如何让多 agent 达成共识

想象一群人在讨论晚餐吃什么——有人掉线,有人恶意干扰,还有人网络延迟。共识机制,就是让这群人高效达成一致的通信规则。一、为什么需要不同的共识机制?根本原因:现实世界的约束条件差异,如同"野外生存"与"室内会议"需要不同的组织策略。约束维度简单场景(室内会议)复杂场景(野外生存)故障类型节点宕机(崩溃故障)节点作恶(拜占庭故障)网络环境低延迟(如局域网)高延迟(如公网)一致性要求强一致性(如金融交易)最终一致性(如内容分发)群体规模小规模(≤10节点)大规模(≥100节点)核心洞察:没有"最优机制",只有"最适配场景的机制"。例如:区块链需防欺诈(拜占庭容错),数据库集群只需防宕机(崩溃容...

一、强化学习 vs 进化论当我在思考如何改进 prompt 写法的时候,想到了一组有趣的类比:强化学习中,有三个关键组成部分:算法、环境和先验知识生物进化论中,有三个关键的概念:自然选择、环境和基因强化学习算法,似乎是在模拟自然选择的数学本质,我们设定的奖励函数,可以看作是...