Stephen Wolfram 提出一个极具张力的判断:宇宙的底层不是连续几何结构,而是离散的计算过程。物理定律、空间结构、时间演化,都可以被视为某种“规则系统”的运行结果。计算不可约性(Computational Irreducibility)是这个计算宇宙观的核心支柱,它是指某些系统的未来状态无法通过数学压缩或公式跳跃得到,只能一步步计算出来。也就是说,有些系统的结果没有捷径可走,必须运行才知道,系统最快的预测方式,是它自己。

一、计算不可约性 与 AI 模型规模

当任务具有计算不可约性时,模型规模是否成为必要条件?

这个问题可以拆成三层:

层级核心变量含义
任务层不可约程度是否存在解析捷径
模型层参数规模可容纳的函数复杂度
运行层推理步数推理深度与展开长度

若一个系统是不可约的:

  • 无法用封闭公式压缩预测
  • 不能通过符号归纳直接得到结果
  • 只能逐步展开计算过程

这对 AI 的影响在于:

任务本身要求“展开计算”,而非“记忆答案”。可以简单理解为,不能查询到结果(如九九乘法表),必须要计算。

1.1 模型规模的三种角色

1.1.1 压缩器角色

当问题可约时:

  • 大模型通过参数容量
  • 将复杂映射压缩成近似函数

规模越大,压缩能力越强。适用于:

  • 统计模式识别
  • 语言概率建模
  • 图像纹理归纳

1.1.2 展开器角色

当问题不可约时:

模型规模并不能替代计算步骤,它只能:

  • 存储更多中间表示
  • 维持更长因果链
  • 支撑更深层推理

这时决定性能的变量是:

参数规模 × 推理深度,而非参数规模本身。

1.1.3 模拟器角色

某些任务属于“弱不可约”:

  • 局部可压缩
  • 全局不可预测

例如博弈、规划、复杂系统模拟。在这类任务中:

  • 模型规模提供状态空间表示能力
  • 但结果质量取决于 rollout 长度

1.2 规模与计算不可约性的关系矩阵

任务类型是否不可约规模是否关键推理是否关键
语言流畅度
数学证明
博弈决策中高
长程规划极高

可以看到:不可约程度越高,推理长度的重要性越高。


1.3 Transformer 的结构限制

标准 Transformer:

  • 固定层数
  • 固定深度
  • 计算图有限

它更擅长函数逼近,不擅长动态展开计算。

这解释了现象:

  • 参数翻倍 → 性能提升明显
  • 推理步数增加 → 某些任务跃迁

Chain of Thought 正是在延长展开路径。

若一个任务不可约:单纯增加参数规模,可能产生“拟合更好”的假象,却无法突破深层结构限制。

典型现象:

  • 算术长链推理仍然不稳定
  • 复杂规划依赖外部工具
  • 需要程序执行器或搜索模块

若世界具有不可约结构:AGI 不可能仅依赖静态权重和一次前向传播

必须具备:

  • 动态递归计算
  • 可扩展推理深度
  • 外部记忆或工具调用

规模是必要条件,计算路径才是充分条件。


二、计算不可约性视角下的产业判断

给出判断公式:

问题复杂度 ≈ 参数容量 × 推理深度 × 外部工具能力

当任务不可约:推理深度成为主变量。


2.1 在计算不可约性框架下,基本判断

  • 规模红利有限:模型参数接近物理极限后,收益边际下降
  • 算力结构重构:推理时算力 > 训练时算力
  • 工具增强成为主流:模型 + 搜索 + 规划 + 外部执行
  • 上下文 infra 价值上升:长链计算需要持久化结构

2.2 从资本密度、技术栈位置、护城河形态展开

2.2.1 产业重心的迁移:训练中心 → 推理中心

过去五年:训练规模决定代际跃迁,资本集中于大模型预训练
接下来:长链推理、多轮规划、工具调用、状态持久化,这些能力都发生在推理阶段

阶段关键资源资本密度
预训练GPU 集群极高
推理弹性算力 + 存储 + 编排持续高

推理算力将成为长期消耗资产,而非一次性投入。


2.2.2 模型公司的分化:单纯扩大参数规模带来的优势会收敛。

未来模型公司可能分化为三类:

类型核心能力护城河
规模型基础模型训练资金与数据
推理型长链展开能力系统架构
生态型工具与接口网络开发生态

规模仍然重要,系统调度能力的价值上升。


2.2.3 Agent 框架是对不可约性的工程回应

典型形态包括:

  • 规划器
  • 记忆系统
  • 外部执行器
  • 状态回溯机制

这类公司(如 DeepSeek)不必拥有最大模型,却能通过推理深度,工作流编排,领域工具整合等,获得结构优势。


2.2.4 算力产业链的变化

  • 训练芯片:仍由高端 GPU 主导,如NVIDIA。增长率可能放缓,边际效率下降。
  • 推理芯片:(高并发、低延迟、长时运行、高频上下文读写)利好

    • 专用推理加速器
    • 近存算架构
    • 边缘计算芯片

2.2.5 存储层价值提升

长链计算意味着状态保存、中间结果缓存、可回溯执行,高性能存储系统与上下文 infra 成为关键节点。

计算的“城市化进程加快”,存储就是这个城市高增长的“房地产”

2.3 商业模式重估

企业客户更关注:任务完成率、稳定性、迭代成本、推理耗时,进入更成熟的企业级市场

计费逻辑可能从“Token 消耗”转向:

  • 任务级计费
  • 成功率计费
  • 按流程收费

模型成为基础组件,系统能力决定议价权。


2.4 投资节奏判断

未来 3-5 年可能出现三条主线:

  1. 推理算力爆发,推理侧算力消耗持续增长
  2. Agent 基础设施层持续投资:记忆系统、调度系统、工具调用协议
  3. 行业深耕型系统。金融、法律、制造规划等不可约程度高的领域

风险上看,也许要考虑算法突破减少推理深度需求,结构再次改变

标签:infra, ai, 投资

你的评论