用“计算不可约性思想”分析 AI 产业发展
Stephen Wolfram 提出一个极具张力的判断:宇宙的底层不是连续几何结构,而是离散的计算过程。物理定律、空间结构、时间演化,都可以被视为某种“规则系统”的运行结果。计算不可约性(Computational Irreducibility)是这个计算宇宙观的核心支柱,它是指某些系统的未来状态无法通过数学压缩或公式跳跃得到,只能一步步计算出来。也就是说,有些系统的结果没有捷径可走,必须运行才知道,系统最快的预测方式,是它自己。
一、计算不可约性 与 AI 模型规模
当任务具有计算不可约性时,模型规模是否成为必要条件?
这个问题可以拆成三层:
| 层级 | 核心变量 | 含义 |
|---|---|---|
| 任务层 | 不可约程度 | 是否存在解析捷径 |
| 模型层 | 参数规模 | 可容纳的函数复杂度 |
| 运行层 | 推理步数 | 推理深度与展开长度 |
若一个系统是不可约的:
- 无法用封闭公式压缩预测
- 不能通过符号归纳直接得到结果
- 只能逐步展开计算过程
这对 AI 的影响在于:
任务本身要求“展开计算”,而非“记忆答案”。可以简单理解为,不能查询到结果(如九九乘法表),必须要计算。
1.1 模型规模的三种角色
1.1.1 压缩器角色
当问题可约时:
- 大模型通过参数容量
- 将复杂映射压缩成近似函数
规模越大,压缩能力越强。适用于:
- 统计模式识别
- 语言概率建模
- 图像纹理归纳
1.1.2 展开器角色
当问题不可约时:
模型规模并不能替代计算步骤,它只能:
- 存储更多中间表示
- 维持更长因果链
- 支撑更深层推理
这时决定性能的变量是:
参数规模 × 推理深度,而非参数规模本身。
1.1.3 模拟器角色
某些任务属于“弱不可约”:
- 局部可压缩
- 全局不可预测
例如博弈、规划、复杂系统模拟。在这类任务中:
- 模型规模提供状态空间表示能力
- 但结果质量取决于 rollout 长度
1.2 规模与计算不可约性的关系矩阵
| 任务类型 | 是否不可约 | 规模是否关键 | 推理是否关键 |
|---|---|---|---|
| 语言流畅度 | 低 | 是 | 低 |
| 数学证明 | 高 | 是 | 是 |
| 博弈决策 | 中高 | 中 | 高 |
| 长程规划 | 高 | 中 | 极高 |
可以看到:不可约程度越高,推理长度的重要性越高。
1.3 Transformer 的结构限制
标准 Transformer:
- 固定层数
- 固定深度
- 计算图有限
它更擅长函数逼近,不擅长动态展开计算。
这解释了现象:
- 参数翻倍 → 性能提升明显
- 推理步数增加 → 某些任务跃迁
Chain of Thought 正是在延长展开路径。
若一个任务不可约:单纯增加参数规模,可能产生“拟合更好”的假象,却无法突破深层结构限制。
典型现象:
- 算术长链推理仍然不稳定
- 复杂规划依赖外部工具
- 需要程序执行器或搜索模块
若世界具有不可约结构:AGI 不可能仅依赖静态权重和一次前向传播
必须具备:
- 动态递归计算
- 可扩展推理深度
- 外部记忆或工具调用
规模是必要条件,计算路径才是充分条件。
二、计算不可约性视角下的产业判断
给出判断公式:
问题复杂度 ≈ 参数容量 × 推理深度 × 外部工具能力当任务不可约:推理深度成为主变量。
2.1 在计算不可约性框架下,基本判断
- 规模红利有限:模型参数接近物理极限后,收益边际下降
- 算力结构重构:推理时算力 > 训练时算力
- 工具增强成为主流:模型 + 搜索 + 规划 + 外部执行
- 上下文 infra 价值上升:长链计算需要持久化结构
2.2 从资本密度、技术栈位置、护城河形态展开
2.2.1 产业重心的迁移:训练中心 → 推理中心
过去五年:训练规模决定代际跃迁,资本集中于大模型预训练
接下来:长链推理、多轮规划、工具调用、状态持久化,这些能力都发生在推理阶段
| 阶段 | 关键资源 | 资本密度 |
|---|---|---|
| 预训练 | GPU 集群 | 极高 |
| 推理 | 弹性算力 + 存储 + 编排 | 持续高 |
推理算力将成为长期消耗资产,而非一次性投入。
2.2.2 模型公司的分化:单纯扩大参数规模带来的优势会收敛。
未来模型公司可能分化为三类:
| 类型 | 核心能力 | 护城河 |
|---|---|---|
| 规模型 | 基础模型训练 | 资金与数据 |
| 推理型 | 长链展开能力 | 系统架构 |
| 生态型 | 工具与接口网络 | 开发生态 |
规模仍然重要,系统调度能力的价值上升。
2.2.3 Agent 框架是对不可约性的工程回应
典型形态包括:
- 规划器
- 记忆系统
- 外部执行器
- 状态回溯机制
这类公司(如 DeepSeek)不必拥有最大模型,却能通过推理深度,工作流编排,领域工具整合等,获得结构优势。
2.2.4 算力产业链的变化
- 训练芯片:仍由高端 GPU 主导,如NVIDIA。增长率可能放缓,边际效率下降。
推理芯片:(高并发、低延迟、长时运行、高频上下文读写)利好
- 专用推理加速器
- 近存算架构
- 边缘计算芯片
2.2.5 存储层价值提升
长链计算意味着状态保存、中间结果缓存、可回溯执行,高性能存储系统与上下文 infra 成为关键节点。
计算的“城市化进程加快”,存储就是这个城市高增长的“房地产”
2.3 商业模式重估
企业客户更关注:任务完成率、稳定性、迭代成本、推理耗时,进入更成熟的企业级市场
计费逻辑可能从“Token 消耗”转向:
- 任务级计费
- 成功率计费
- 按流程收费
模型成为基础组件,系统能力决定议价权。
2.4 投资节奏判断
未来 3-5 年可能出现三条主线:
- 推理算力爆发,推理侧算力消耗持续增长
- Agent 基础设施层持续投资:记忆系统、调度系统、工具调用协议
- 行业深耕型系统。金融、法律、制造规划等不可约程度高的领域
风险上看,也许要考虑算法突破减少推理深度需求,结构再次改变