AI Infra:Token 工厂的商业模式研究
别再叫它 API 聚合了,它正在控制 AI 世界的“石油管道”
上周和一个做投资的朋友聊天,他抱怨说现在看 AI 项目看到头秃。基础模型那波已经卷成麻花,应用层又虚头巴脑,找不到护城河。
我给他画了张图,他一下就懂了。
我说,你别盯着挖金矿的(模型厂商)和卖水的(云厂商),你应该去看那条“输油管道”。而这条管道里流淌的,不是石油,是 Token。
管道的控制者,我把它叫做 Token Factory(Token 工厂)。OpenRouter、Portkey、LiteLLM Cloud 这些公司,都在这条赛道上。它们生产的不是模型,而是一个标准化的产品:推理 Token。
这玩意儿才是 AI 商业化的真正咽喉。为了讲清楚这个逻辑,我把 Token Factory 的商业模式拆成了五层。这五层,从低到高,价值完全不同。
一、最底层:Token 转售,听着像二道贩子,其实是“AI界的Stripe”
最早期,这门生意听起来一点都不性感,甚至有点 low。
说白了,就是个二道贩子。比如 OpenRouter,它自己一个模型都不训。它先从 OpenAI、Anthropic 那儿批量“批发”模型推理能力,再零售卖给我们这些开发者。
用户付 $100
│
▼
OpenRouter(过一手)
│
│ 付 $95
▼
OpenAI / Anthropic收入哪来?就挣那 5% 左右的差价和充值手续费。乍一看,这护城河也太浅了,不就是个倒买倒卖的生意吗?
但有意思的地方在于它的定位。它刻意保持 Token 的官方原价,然后靠服务费赚钱。这招非常聪明,它不是在跟模型厂商抢利差,而是在做支付和渠道的基础设施。
所以,准确的定义不是“AI 代理商”,而是 AI 时代的 Stripe。它解决的是一个极其无聊但极其重要的问题:让开发者用一行代码,就能接入全世界所有的模型,不用管后面那一堆账单、密钥和对账。
这一层,赚的是辛苦钱,但也是所有故事的起点。
二、第二层:路由,从“管道”到“大脑”,真正值钱的来了
如果只做一层,Token Factory 永远只是个微利的管道工。真正让它开始值钱的,是第二层:Routing(路由)。
这玩意儿我天天在用,感受太深了。比如我随手发一个请求:“帮我用 Python 写个二分查找。”
一个好的 Router,它脑子里会瞬间闪过一堆决策:
- 任务分析:这是一个标准代码任务。
- 模型匹配:Claude Sonnet 干这活最利索,性价比最高。
- 成本计算:不用上 GPT-4,浪费钱。
- 执行:直接把任务甩给 Sonnet。
如果我再问:“帮我研究一下最近 AI 制药的新突破。”
Router 又会立刻判断:这是深度研究任务,得调用具备联网或深度推理能力的模型,比如有 Deep Research 功能的 GPT 或 Gemini。
看到了吗?从此以后,作为用户,我们根本不需要关心模型叫什么。我们只关心三个词:最便宜,最快,最准。
但对企业来说,这背后还有更深的逻辑:成本调度、延迟调度、SLA 调度、自动灾备、多云切换……这些能力让 Router 瞬间从一个管道工,变成了一个指挥交通的操作系统(Inference OS)。护城河一下子就冒出来了——算法和调度数据,是模型厂商自己都无法轻易复制的。
三、第三层:算力市场,当“AI司机”的 Uber
再往下走一层,事情就更有意思了。
现在越来越多的独立推理服务商(Inference Provider)爆发式增长,比如 Groq、Together、Fireworks。他们手里有海量的 GPU,专门优化推理速度,比通用云快得多、也便宜得多。
Token Factory 做了什么?它把这些分散的“算力司机”全部接入了自己的网络。
于是,商业模型变成了一个双边市场:
- 供给侧:成千上万的 GPU 集群,随时待命。
- 需求侧:数百万开发者,嗷嗷待哺地发出推理请求。
- 平台:Token Factory 居中调度,撮合交易。
这像极了 Uber。Uber 不拥有任何一辆车,但它控制了出行服务的调度和定价。Token Factory 也一样,它不拥有任何一块 GPU,但它控制着推理能力的生产和分发。
这也是为什么现在很多投资人不再提“API 聚合”,而开始用 AI Compute Marketplace(AI 算力市场) 这个概念。这个叙事,比卖接口要性感十倍。
四、第四层:Token 财务治理,比“省钱”更重要的是“知道钱花哪儿了”
好了,当一个公司开始大规模使用 AI 时,一个恐怖的场景出现了:Token 花费完全失控。
财务总监会发现,他不知道那 10 万美金的账单是怎么来的。是研发部在疯狂调优?是市场部在批量生成文案?还是某个失控的 Agent 陷入了死循环,一夜之间花掉 800 万 Token?
Token Factory 在这里找到了第四层价值:Token FinOps(Token 成本治理)。
他们提供的已经不是一个 API 接口,而是一个管理面板。功能包括:预算、配额、角色权限、实时花费、成本归属、计费仪表盘。谁花的,花了多少,花在哪个模型上,ROI 是多少,一目了然。
这一刀,直接切中了企业级客户的命门。你卖 API,IT 部门可能觉得你在增加他们的工作。但你卖管理和控制,CFO 都会帮你说话。
所以,这一层的产品,已经从“工具”变成了“SaaS 订阅服务”,护城河是企业管理能力。
五、第五层:Token 智能,这是终极的“上帝视角”和真正的护城河
以上四层,都是业务和产品上的创新。但最让我觉得恐怖的,是第五层:Token Intelligence(Token 智能)。
因为这些平台每天处理着天文数字般的推理请求,它们手里握着全世界最珍贵的数据。比如 OpenRouter,每周处理数万亿 Token,它们能看到:
- 哪个模型的代码能力被调用得最频繁?
- 哪个推理服务商最近频繁宕机?
- 哪种 Prompt 技巧的成功率最高?
- 哪种类型的 AI 应用正在爆炸式增长?
这太可怕了。这种跨模型的、全局的、真实的推理行为数据,是任何一家模型厂商都绝对拿不到的。
- OpenAI 只能看到自家 GPT 的表现。
- Anthropic 只能了解 Claude 的优缺点。
- 但 OpenRouter 站在上帝视角,看着所有模型在同一个擂台上打群架,知道每一场具体的比分和细节。
这形成了一个无法被超越的数据网络效应:接入的平台越多,数据越厚;数据越厚,路由越准;路由越准,用户越多。从去年开始,OpenRouter 已经开始基于这些数据发布论文,研究超百万亿 Token 的模型真实使用状况了。
这已经不是在卖 Token,而是在掌握 AI 产业的真实脉搏。它的价值,彻底从管道,变成了大脑,又变成了预言家。
总结:一条全新的价值链
所以,别再把它看作一个简单的接口工具了。把视野拉高,它正在形成一条控制“AI 推理经济”的全新价值链。
结合我之前研究的“Token 经济”框架,现在这张图可以画完整了:
- Model Factory(模型工厂):OpenAI、DeepSeek,生产的是基础模型能力。
- Token Factory(Token 工厂):OpenRouter、Portkey,生产的是通用、可调度的推理 Token。
- Business Token Factory(业务 Token 工厂):将企业散落的数据,持续转化为高价值的、带着业务语义的业务 Token。
- Agent Factory(智能体工厂):Manus、OpenHands 等,拿着上面的推理 Token 和业务 Token,去执行具体的业务动作。
结论就是,在 AI 狂飙的时代,谁控制算力、谁控制模型,当然重要。但谁控制了 Token 的生产、调度、结算和运营,谁就掌握了将算力和算法变现的“水龙头”。
OpenRouter 正在做的事,就是让自己从一个卖水管的,变成那个掌握水龙头的总闸。而我们,正在用水龙头的另一边——业务数据——制造出能真正浇灌企业价值的特种水源。