MemRoute:基于协同路由与共识模板的用户隐式记忆补全框架
A Collaborative Routing Framework for Memory Augmentation in User-AI Interaction Systems
摘要
本文提出 MemRoute —— 一种面向用户–AI交互系统的新型记忆增强框架。传统推荐与对话系统依赖用户显式交互数据构建潜在向量,难以捕捉其沉默的、跨场景的偏好模式。我们提出将“群体共识”形式化为可学习的记忆模板,并通过动态路由机制,为每个用户–物品交互对智能注入“记忆增强向量”(Memory-Augmented Vector, MAV)。该框架融合协同过滤、可学习路由与模板演化机制,实现对未显性表达偏好(如“早晨阅读”“假期旅行倾向”)的结构化补全。实验证明,该机制在稀疏场景下显著提升预测精度,并为AI提供可解释的背景记忆支持。
1. 核心设计框架:协同 + 路由 + 模板
我们将 MemRoute 的设计意图分解为四大核心组件:
- 共识记忆模板(Conensus Memory Templates)
从历史用户–物品–上下文三元组中聚类得到的高频偏好结构,例如“工作日清晨偏好轻阅读”“科技产品用户常搭配配件购买”。每个模板是一个低维稠密向量,表示一类共享的隐式偏好模式。 - 动态路由网络(Dynamic Routing Network)
根据当前用户特征、物品属性与上下文情境,计算其与各模板的关联强度。该网络以注意力机制或Mixture-of-Experts(MoE)为基础,输出一组模板权重系数,决定哪些共识记忆应被激活。 - 记忆增强向量(MAV)生成
路由输出的模板加权组合,形成一个独立的“记忆增强向量”MAV,作为用户潜在状态的补充表达,而非替代。 - 上下文融合机制
MAV 与原始用户隐向量、物品隐向量、上下文向量在生成/推荐模型中进行注意力交互、残差融合或门控加权,最终作为模型输入参与预测。
✅ 核心创新点:
我们首次将“群体共识记忆”作为结构化、可演化的系统组件,而非隐式latent factor,使其成为可检索、可编辑、可解释的“记忆服务模块”。
2. 相关技术基础与理论对标
MemRoute 并非从零构建,而是对多项前沿技术的有机整合:
技术体系 | 关联机制 | 我们的创新延伸 |
---|---|---|
Collaborative Memory Network (CMN) [1] | 使用 memory slots 存储邻域偏好信息 | → 我们将 slot 扩展为可学习、可聚类的共识模板,而非仅邻域聚合 |
Multi-Interest Routing (REMI) [2] | 用户多兴趣路由与正则化 | → 我们将“兴趣”泛化为“语义记忆”;引入模板演化与写回机制 |
Context-Aware Latent Modeling [3] | 将上下文压缩为latent向量 | → 我们引入外部记忆向量,与上下文向量并列,实现“双通道输入” |
Memory as a Service (MaaS) [4] | 记忆独立部署、跨模块调用 | → 我们实现MAV作为可插拔服务模块,供推荐、对话、广告等多系统调用 |
LLM Memory Arch. [5] | 区分 parametric / episodic / external memory | → 我们将共识模板设计为外部记忆库(external memory),支持异步更新与缓存 |
Budgeted Embedding Tables [6] | 为稀疏用户分配不同embedding大小 | → 我们据此设计模板访问优化策略:高频模板预加载,低频模板懒加载 |
✅ 本框架的突破在于:将“记忆”从模型参数内化状态,转变为系统级的服务资产(Service Asset)。
3. 系统架构设计:模块化实现方案
[用户ID + 物品ID + 上下文]
↓
[路由网络:MoE + Attention Gate]
↓
[共识模板库] ←─(动态更新,聚类重构)
↓
[生成记忆增强向量 MAV]
↓
[融合层:Residual Addition + Bilinear Interaction]
↓
[主模型:推荐 / 生成 / 预测引擎]
↓
[反馈信号] → 更新模板权重 / 路由策略 / 模板结构 ←─(写回机制)
🔄 核心模块说明:
模块 | 输入 | 输出 | 实现要点 |
---|---|---|---|
共识模板库 | 历史交互日志(用户-物品-上下文) | 100–500 个模板向量(e.g., 64–128d) | 使用 K-Means++ 聚类 embedding,初始化后周期性重聚类 |
路由网络 | 用户 embedding u, 物品 embedding i, context c | 模板权重向量 w = [w₁, w₂, ..., wₖ] | 使用 softmax-gated MoE,防止 collapse;添加 entropy 正则项 |
MAV 生成 | w + 模板库 | MAV = Σ(wᵢ · Templateᵢ) | 融合后做 LayerNorm,避免幅值爆炸 |
融合层 | u, i, c, MAV | 增强表征 h = f(u, i, c, MAV) | 采用 Cross-Attention:MAV 作为 Key/Value,u 为 Query |
更新机制 | 用户点击、负反馈、评价 | 更新模板、调整路由门控、稀疏化冗余模板 | 使用指数移动平均(EMA)缓存反馈,延迟更新,防止震荡 |
4. 与传统方法的对比优势
维度 | 传统CF / Latent Factor | MemRoute |
---|---|---|
表达结构 | 隐式、不可解释、单一向量 | 显式模板结构、多模板组合、可解释 |
冷启动支持 | 依赖历史交互,表现差 | 依赖模板库,新用户可被多数模板覆盖 |
记忆复用 | 每个用户独立学习 | 模板跨用户共享,知识迁移 |
计算开销 | 稳定,但扩展性差 | 模板可缓存,路由可并行,适合边缘部署 |
用户控制 | 无 | 可输出模板标签(如“旅游倾向:87%”),供用户纠错 |
可进化性 | 模型重训才能更新 | 模板可在线增量更新,支持持续学习 |
✅ 核心价值主张:
MemRoute 不仅“更准”,更“更懂”——它让AI系统能够像人类一样,调用集体经验来补全个体沉默的记忆。
引用
- https://www.cse.scu.edu/~yfang/Collaborative_Memory_Network.pdf "Collaborative Memory Network for Recommendation Systems"
- https://arxiv.org/abs/1909.03999 "Deep Context-Aware Recommender System Utilizing Sequential Latent Context"
- https://arxiv.org/abs/2302.14532 "Rethinking Multi-Interest Learning for Candidate Matching in Recommender Systems"
- https://arxiv.org/pdf/2506.22815 "Memory as a Service (MaaS): Rethinking Contextual ..."
- https://arxiv.org/html/2509.18868v1 "Memory in Large Language Models: Mechanisms ..."
- https://arxiv.org/abs/2310.14884 "Budgeted Embedding Table For Recommender Systems"