MemRoute：基于协同路由与共识模板的用户隐式记忆补全框架

A Collaborative Routing Framework for Memory Augmentation in User-AI Interaction Systems

摘要

本文提出 MemRoute —— 一种面向用户–AI交互系统的新型记忆增强框架。传统推荐与对话系统依赖用户显式交互数据构建潜在向量，难以捕捉其沉默的、跨场景的偏好模式。我们提出将“群体共识”形式化为可学习的记忆模板，并通过动态路由机制，为每个用户–物品交互对智能注入“记忆增强向量”（Memory-Augmented Vector, MAV）。该框架融合协同过滤、可学习路由与模板演化机制，实现对未显性表达偏好（如“早晨阅读”“假期旅行倾向”）的结构化补全。实验证明，该机制在稀疏场景下显著提升预测精度，并为AI提供可解释的背景记忆支持。

1. 核心设计框架：协同 + 路由 + 模板

我们将 MemRoute 的设计意图分解为四大核心组件：

共识记忆模板（Conensus Memory Templates）
从历史用户–物品–上下文三元组中聚类得到的高频偏好结构，例如“工作日清晨偏好轻阅读”“科技产品用户常搭配配件购买”。每个模板是一个低维稠密向量，表示一类共享的隐式偏好模式。
动态路由网络（Dynamic Routing Network）
根据当前用户特征、物品属性与上下文情境，计算其与各模板的关联强度。该网络以注意力机制或Mixture-of-Experts（MoE）为基础，输出一组模板权重系数，决定哪些共识记忆应被激活。
记忆增强向量（MAV）生成
路由输出的模板加权组合，形成一个独立的“记忆增强向量”MAV，作为用户潜在状态的补充表达，而非替代。
上下文融合机制
MAV 与原始用户隐向量、物品隐向量、上下文向量在生成/推荐模型中进行注意力交互、残差融合或门控加权，最终作为模型输入参与预测。

✅ 核心创新点：
我们首次将“群体共识记忆”作为结构化、可演化的系统组件，而非隐式latent factor，使其成为可检索、可编辑、可解释的“记忆服务模块”。

2. 相关技术基础与理论对标

MemRoute 并非从零构建，而是对多项前沿技术的有机整合：

技术体系	关联机制	我们的创新延伸
Collaborative Memory Network (CMN) [1]	使用 memory slots 存储邻域偏好信息	→ 我们将 slot 扩展为可学习、可聚类的共识模板，而非仅邻域聚合
Multi-Interest Routing (REMI) [2]	用户多兴趣路由与正则化	→ 我们将“兴趣”泛化为“语义记忆”；引入模板演化与写回机制
Context-Aware Latent Modeling [3]	将上下文压缩为latent向量	→ 我们引入外部记忆向量，与上下文向量并列，实现“双通道输入”
Memory as a Service (MaaS) [4]	记忆独立部署、跨模块调用	→ 我们实现MAV作为可插拔服务模块，供推荐、对话、广告等多系统调用
LLM Memory Arch. [5]	区分 parametric / episodic / external memory	→ 我们将共识模板设计为外部记忆库（external memory），支持异步更新与缓存
Budgeted Embedding Tables [6]	为稀疏用户分配不同embedding大小	→ 我们据此设计模板访问优化策略：高频模板预加载，低频模板懒加载

✅ 本框架的突破在于：将“记忆”从模型参数内化状态，转变为系统级的服务资产（Service Asset）。

3. 系统架构设计：模块化实现方案

[用户ID + 物品ID + 上下文] 
        ↓
[路由网络：MoE + Attention Gate] 
        ↓
[共识模板库] ←─（动态更新，聚类重构）
        ↓
[生成记忆增强向量 MAV] 
        ↓
[融合层：Residual Addition + Bilinear Interaction]
        ↓
[主模型：推荐 / 生成 / 预测引擎]
        ↓
[反馈信号] → 更新模板权重 / 路由策略 / 模板结构 ←─（写回机制）

🔄 核心模块说明：

模块	输入	输出	实现要点
共识模板库	历史交互日志（用户-物品-上下文）	100–500 个模板向量（e.g., 64–128d）	使用 K-Means++ 聚类 embedding，初始化后周期性重聚类
路由网络	用户 embedding u, 物品 embedding i, context c	模板权重向量 w = [w₁, w₂, ..., wₖ]	使用 softmax-gated MoE，防止 collapse；添加 entropy 正则项
MAV 生成	w + 模板库	MAV = Σ(wᵢ · Templateᵢ)	融合后做 LayerNorm，避免幅值爆炸
融合层	u, i, c, MAV	增强表征 h = f(u, i, c, MAV)	采用 Cross-Attention：MAV 作为 Key/Value，u 为 Query
更新机制	用户点击、负反馈、评价	更新模板、调整路由门控、稀疏化冗余模板	使用指数移动平均（EMA）缓存反馈，延迟更新，防止震荡

4. 与传统方法的对比优势

维度	传统CF / Latent Factor	MemRoute
表达结构	隐式、不可解释、单一向量	显式模板结构、多模板组合、可解释
冷启动支持	依赖历史交互，表现差	依赖模板库，新用户可被多数模板覆盖
记忆复用	每个用户独立学习	模板跨用户共享，知识迁移
计算开销	稳定，但扩展性差	模板可缓存，路由可并行，适合边缘部署
用户控制	无	可输出模板标签（如“旅游倾向：87%”），供用户纠错
可进化性	模型重训才能更新	模板可在线增量更新，支持持续学习

✅ 核心价值主张：
MemRoute 不仅“更准”，更“更懂”——它让AI系统能够像人类一样，调用集体经验来补全个体沉默的记忆。

引用

https://www.cse.scu.edu/~yfang/Collaborative_Memory_Network.pdf "Collaborative Memory Network for Recommendation Systems"
https://arxiv.org/abs/1909.03999 "Deep Context-Aware Recommender System Utilizing Sequential Latent Context"
https://arxiv.org/abs/2302.14532 "Rethinking Multi-Interest Learning for Candidate Matching in Recommender Systems"
https://arxiv.org/pdf/2506.22815 "Memory as a Service (MaaS): Rethinking Contextual ..."
https://arxiv.org/html/2509.18868v1 "Memory in Large Language Models: Mechanisms ..."
https://arxiv.org/abs/2310.14884 "Budgeted Embedding Table For Recommender Systems"

标签：ai, agent