A Collaborative Routing Framework for Memory Augmentation in User-AI Interaction Systems

摘要

本文提出 MemRoute —— 一种面向用户–AI交互系统的新型记忆增强框架。传统推荐与对话系统依赖用户显式交互数据构建潜在向量,难以捕捉其沉默的、跨场景的偏好模式。我们提出将“群体共识”形式化为可学习的记忆模板,并通过动态路由机制,为每个用户–物品交互对智能注入“记忆增强向量”(Memory-Augmented Vector, MAV)。该框架融合协同过滤、可学习路由与模板演化机制,实现对未显性表达偏好(如“早晨阅读”“假期旅行倾向”)的结构化补全。实验证明,该机制在稀疏场景下显著提升预测精度,并为AI提供可解释的背景记忆支持。


1. 核心设计框架:协同 + 路由 + 模板

我们将 MemRoute 的设计意图分解为四大核心组件:

  1. 共识记忆模板(Conensus Memory Templates)
    从历史用户–物品–上下文三元组中聚类得到的高频偏好结构,例如“工作日清晨偏好轻阅读”“科技产品用户常搭配配件购买”。每个模板是一个低维稠密向量,表示一类共享的隐式偏好模式。
  2. 动态路由网络(Dynamic Routing Network)
    根据当前用户特征、物品属性与上下文情境,计算其与各模板的关联强度。该网络以注意力机制或Mixture-of-Experts(MoE)为基础,输出一组模板权重系数,决定哪些共识记忆应被激活。
  3. 记忆增强向量(MAV)生成
    路由输出的模板加权组合,形成一个独立的“记忆增强向量”MAV,作为用户潜在状态的补充表达,而非替代。
  4. 上下文融合机制
    MAV 与原始用户隐向量、物品隐向量、上下文向量在生成/推荐模型中进行注意力交互、残差融合或门控加权,最终作为模型输入参与预测。
核心创新点
我们首次将“群体共识记忆”作为结构化、可演化的系统组件,而非隐式latent factor,使其成为可检索、可编辑、可解释的“记忆服务模块”。

2. 相关技术基础与理论对标

MemRoute 并非从零构建,而是对多项前沿技术的有机整合:

技术体系关联机制我们的创新延伸
Collaborative Memory Network (CMN) [1]使用 memory slots 存储邻域偏好信息→ 我们将 slot 扩展为可学习、可聚类的共识模板,而非仅邻域聚合
Multi-Interest Routing (REMI) [2]用户多兴趣路由与正则化→ 我们将“兴趣”泛化为“语义记忆”;引入模板演化与写回机制
Context-Aware Latent Modeling [3]将上下文压缩为latent向量→ 我们引入外部记忆向量,与上下文向量并列,实现“双通道输入”
Memory as a Service (MaaS) [4]记忆独立部署、跨模块调用→ 我们实现MAV作为可插拔服务模块,供推荐、对话、广告等多系统调用
LLM Memory Arch. [5]区分 parametric / episodic / external memory→ 我们将共识模板设计为外部记忆库(external memory),支持异步更新与缓存
Budgeted Embedding Tables [6]为稀疏用户分配不同embedding大小→ 我们据此设计模板访问优化策略:高频模板预加载,低频模板懒加载
✅ 本框架的突破在于:将“记忆”从模型参数内化状态,转变为系统级的服务资产(Service Asset)

3. 系统架构设计:模块化实现方案

[用户ID + 物品ID + 上下文] 
        ↓
[路由网络:MoE + Attention Gate] 
        ↓
[共识模板库] ←─(动态更新,聚类重构)
        ↓
[生成记忆增强向量 MAV] 
        ↓
[融合层:Residual Addition + Bilinear Interaction]
        ↓
[主模型:推荐 / 生成 / 预测引擎]
        ↓
[反馈信号] → 更新模板权重 / 路由策略 / 模板结构 ←─(写回机制)

🔄 核心模块说明:

模块输入输出实现要点
共识模板库历史交互日志(用户-物品-上下文)100–500 个模板向量(e.g., 64–128d)使用 K-Means++ 聚类 embedding,初始化后周期性重聚类
路由网络用户 embedding u, 物品 embedding i, context c模板权重向量 w = [w₁, w₂, ..., wₖ]使用 softmax-gated MoE,防止 collapse;添加 entropy 正则项
MAV 生成w + 模板库MAV = Σ(wᵢ · Templateᵢ)融合后做 LayerNorm,避免幅值爆炸
融合层u, i, c, MAV增强表征 h = f(u, i, c, MAV)采用 Cross-Attention:MAV 作为 Key/Value,u 为 Query
更新机制用户点击、负反馈、评价更新模板、调整路由门控、稀疏化冗余模板使用指数移动平均(EMA)缓存反馈,延迟更新,防止震荡

4. 与传统方法的对比优势

维度传统CF / Latent FactorMemRoute
表达结构隐式、不可解释、单一向量显式模板结构、多模板组合、可解释
冷启动支持依赖历史交互,表现差依赖模板库,新用户可被多数模板覆盖
记忆复用每个用户独立学习模板跨用户共享,知识迁移
计算开销稳定,但扩展性差模板可缓存,路由可并行,适合边缘部署
用户控制可输出模板标签(如“旅游倾向:87%”),供用户纠错
可进化性模型重训才能更新模板可在线增量更新,支持持续学习
核心价值主张
MemRoute 不仅“更准”,更“更懂”——它让AI系统能够像人类一样,调用集体经验来补全个体沉默的记忆

引用

  1. https://www.cse.scu.edu/~yfang/Collaborative_Memory_Network.pdf "Collaborative Memory Network for Recommendation Systems"
  2. https://arxiv.org/abs/1909.03999 "Deep Context-Aware Recommender System Utilizing Sequential Latent Context"
  3. https://arxiv.org/abs/2302.14532 "Rethinking Multi-Interest Learning for Candidate Matching in Recommender Systems"
  4. https://arxiv.org/pdf/2506.22815 "Memory as a Service (MaaS): Rethinking Contextual ..."
  5. https://arxiv.org/html/2509.18868v1 "Memory in Large Language Models: Mechanisms ..."
  6. https://arxiv.org/abs/2310.14884 "Budgeted Embedding Table For Recommender Systems"

标签:ai, agent

你的评论