我的观察:2025 年 AI 基础设施演进趋势

2025 年的 AI 基础设施正在从「模型驱动时代」走向真正的「Token 经济时代」,未来会最终形成一个以 Token 生产与消费效率为核心的竞赛。一、模型研发:从单模态“巨兽”走向多模态“基础设施”2025 最大的变化,是基础模型不再只是“产品”,而开始成为整个产业的基础设施:GPT-5、Claude 4 等新品均原生多模态(图像/视频/音频/动作),具备长上下文 + Agent 原生能力多模态 tokenization 统一趋势明显,视觉-token 成本快速下降开源生态(尤其是 Qwen/DeepSeek 系)形成规模化替代趋势:模型正在像“计算机操作系统”一样抽象化,成为下一代...

为了解决大语言模型在长文本处理中的“中段丢失”、“上下文腐化”等现象,以及显存带宽对上下文窗口的物理限制,我们提出了一种基于原子级工艺,碳基纤维结构的外部显存扩展方案一、为什么要重新定义“上下文工程”在当前的Agent应用中,维持长对话的历史连贯性,需要消耗巨大的算力、带宽...

一、市场可能不是10亿用户,而是几家不愿换供应商的头部企业一方面,从“数字化转型”到“新质生产力”,顶层设计以前所未有的力度,呼唤着技术的落地。这是时代给出的巨大推力另一方面,技术人员、创业者,怀揣着能改变世界的代码和模型,却反复撞在一堵无形的墙上这堵墙,就是决策者脑中的“...