“万亿级市场窗口打开?”——中国AI+DATA基础设施全解析与赛道机遇
一、趋势与机会
1.1 市场趋势
趋势一:从“流量为王”到“计算为王”的商业模式转变
过去,互联网业务的增长主要依赖用户流量,商业模式以广告、电商等流量变现为主
AI Agent的能力核心在于其强大的计算能力和对数据的深度处理。商业模式正在转向以计算资源、模型服务为核心的收费模式,即MaaS(模型即服务)。企业不再只购买流量,而是为模型的调用次数、计算资源的消耗付费
趋势二:软硬一体化的全栈生态竞争
在全球AI基础设施的竞争中,玩家们不再满足于提供单一的硬件或软件产品。领先企业都在积极构建从底层芯片、操作系统到上层框架、应用平台的全栈生态。通过统一的软件接口降低开发门槛,形成强大的竞争壁垒
全球玩家以NVIDIA、微软、Google为代表,通过GPU硬件优势和云服务平台构建了强大的全栈能力
中国玩家如华为的昇腾生态,则通过自研的昇腾芯片和MindSpore框架实现软硬件深度协同,旨在构建一个自主可控、从底层算力到上层应用的完整生态系统
趋势三:软件基础设施成为突破硬件限制的关键
在中国市场,由于高性能芯片存在受限,软件基础设施的重要性被空前放大,成为“变道超车”的关键
算力调度优化: 软件正扮演着算力调度员的角色,通过异构超融合软件栈和分布式调度系统,能够高效整合不同厂商、不同架构的芯片资源,最大化现有算力池的整体性能
国产硬件适配: 深度学习框架(如百度的PaddlePaddle和华为的MindSpore)正在积极适配国内各类芯片,并提供专门的工具链,使得开发者能够基于国产硬件进行高效开发。这种软件层面的适配工作,是构建国产AI生态的基石
趋势四:供给侧从平台软件开发商到数据及AI服务商的转变
企业在 AI 应用落地中存在数据与AI系统割裂和智能化能力不深入系统底层,大多数平台将AI作为外挂模块的问题,供给侧软件倾向于形成 ALL-IN-ONE 的服务,弥补企业能力不足
从平台转向服务入口:不只是卖软件,而是提供一套完整的数据+AI服务基础设施,形成客户粘性强的生态
抢占AI-Native先机:在行业内塑造“AI原生体系”的领导者形象,抢占认知高地
技术壁垒 + 政策红利双轮驱动:通过自研专利和国产适配,在政企市场建立稳固地位,规避外部技术依赖风险
趋势五:数据空间(Data Space)作为新一代基础设施崛起
除了传统的计算、网络和存储,一个全新的基础设施层——数据空间正在兴起。它被视为继信息空间(Cyberspace)之后的又一重要虚拟空间
核心理念: 数据空间将数据本身提升为一种可以被高效管理、流通和计算的基础设施。它旨在将海量数据转化为可以被AI模型直接使用的“数据场”,实现数据、算力、算法的广域协同,为通用人工智能(AGI)的实现铺平道路
1.2 市场机遇
1.2.1 系统性机遇:数据和算力因 AI agent 需求成指数增长
系统性机遇源于市场、技术和商业模式的根本性变革,改变了整个行业的价值创造和分配方式,创造新的市场
核心趋势 | 系统性机遇 | 具体表现 |
---|---|---|
“流量为王”->“计算为王” | MaaS(模型即服务) | 软件企业可以从销售传统软件许可证,转变为提供基于大模型的API调用、模型微调和推理服务 这种模式的盈利不再依赖一次性授权,而是基于用量和计算消耗,形成持续的、高粘性的收入流 |
“数据空间”成为新基础设施 | 数据要素价值化新引擎 | AI Agent的崛起对数据处理提出了更高要求。这催生了数据治理、数据标注和数据资产化的巨大市场 软件基础设施企业有机会构建数据空间管理平台,帮助企业高效整合、清洗和激活海量数据资产,使其成为可直接驱动AI Agent的“燃料” |
AI Agent驱动产业升级 | 企业级“智能员工”方案 | 随着AI Agent从工具升级为“智能员工”,企业需要新的软件基础设施来管理和部署这些Agent 这为提供Agent工厂、Agent协作平台和Agent应用开发框架的软件公司创造了新的机遇,帮助企业实现从单一自动化到全流程智能化的转型 |
1.2.2 结构性机遇:软件走向all-in-one,弥补硬件不足
结构性机遇源于市场中的特定结构性矛盾和技术瓶颈,尤其是在中国市场面临高性能芯片受限的背景下,为软件基础设施企业提供了独特的创新空间。
核心趋势 | 结构性机遇 | 具体表现 |
---|---|---|
高性能芯片受限 | 异构计算平台和调度系统 | 软件基础设施有机会成为弥补硬件性能差距的“核心控制器” 通过开发AI异构计算平台和智能调度系统,软件企业可以高效管理和分配不同厂商、不同架构的芯片资源,充分挖掘国产芯片的潜力,提升整体算力利用率和训练推理效率 |
软硬一体化生态竞争 | “芯片研发+系统集成”模式 | 在硬件生态尚不成熟的背景下,软件基础设施企业可以与国产芯片公司深度合作,通过软件-硬件协同设计来优化性能 可以为垂直行业提供定制化的、性能更优的解决方案,实现软硬件的1+1>2效果,有效对抗海外全栈巨头的竞争 |
平台软件 -> 数据及AI服务 | 组装式数据平台 -> all-in-one | 企业从过去的组装式大数据平台向 AI+DATA 底座迁移,分散算力和IT基础设施得到改造和充分利用 AI 基座模型及行业 AI Agent 成为新的企业投入增长点,松散业务系统向集中式智能平台迁移 |
1.2.3 企业部署 AI 的挑战
企业部署AI Agent效果未达预期的关键,在于混淆了应用平台与底层架构的边界
Agent ≠ AI Infra:Agent更多是应用工具,而非数据驱动的智能闭环载体
核心缺漏:没有形成“采集—处理—反馈—优化”循环的数据引擎
直接后果:模型缺乏持续训练素材,无法贴合业务场景,导致Agent功能浮于表面,无法深度落地
1.3 市场规模
1.3.1 中国AI+DATA软件基础设施市场规模
2022年,中国AI基础设施行业的市场规模达到1,117.8亿元人民币,2019年至2022年的年复合增长率为36%
预计到2027年,这一市场将实现跨越式增长,达到6,008.1亿元人民币
中国市场2022年至2027年的年复合增长率预计将高达39.98% ,远高于全球复合年增长率27.6%
预计中国 AI Agent 市场复合增长率高达72.7%
年份 (Year) | 市场规模 (亿元) | 年复合增长率 (CAGR) |
---|---|---|
2019 | 452.8 | 36% |
2020 | 615.8 | 36% |
2021 | 837.2 | 36% |
2022 | 1,117.80 | 36% |
2027 (预测) | 6,008.10 | 39.98% |
附表为:中国AI基础设施市场规模及预测 (2019-2027)(数据来源:[头豹研究院,中国信通院]
1.3.2 可信数据空间市场规模
据国际数据公司(IDC)发布的《中国数据空间市场分析,2025》预测:2025年中国可信数据空间市场规模为30.4亿元人民币,其中城市数据空间占比超过56%。随着数据要素的深化应用,行业数据空间和企业数据空间的增长预期将远超城市市场空间据艾瑞咨询预测,2024年中国数据要素市场规模达1662.0亿元,2025年约达2042.9亿元
1.3.3 中国数据基础设施投入规模
根据发布于中央人民政府网站《促进开放共享,释放数据价值——解读《国家数据基础设施建设指引》》
2023年我国数据产业规模达2万亿元,全国数据企业超19万家
数据基础设施每年将吸引直接投资约4000亿元,带动未来五年投资规模约2万亿元
二、AI + DATA 基础设施的定位
市场需要这样的产品:
将AI真正植入数据架构底座、通过统一平台实现“数据流转→智能生成→业务驱动”闭环的企业级解决方案
2.1 AI + DATA 基础设施:硬件加速器 + 软件栈 + 数据基础 + 网络连接
硬件层:AI芯片、计算与存储资源
- GPU、TPU和专用AI芯片是现代AI基础设施的计算基石
- 容纳多个GPU的专用服务器,作为计算的容器
软件层:深度学习框架、模型、开发工具与平台
- AI 基础框架(如TensorFlow和PyTorch),包括训练和推理框架
- AI 及数据开发平台(如百度百舸AI异构计算平台/千帆大模型平台、阿里云的“百炼”平台)
- 各种AI平台和工具,包括模型监控、版本控制和通信工具
数据层:数据工作负载、数据管理与治理
- 数据标注和管理(诞生了scale.ai 等百亿级公司)
- 数据预处理和存储(华为的“AI-Ready金融数据基础设施”就包含了“AI数据湖”层,支持HDFS和S3协议,以及采用专用高密度全闪存存储的“数据存储层” )
网络层:高速互联与分布式计算
- 高带宽互连技术,形成分布式计算网络
- 主要包括高速网卡、交换机、高速通信协议等
2.2 新一代基础设施特点:可扩展性、效率与可访问性
本质是数据基础设施化的过程:数据、算力、算法的融合
2.2.1 AI Agent 时代对基础设施提出了新的技术挑战:
- 计算资源利用率低,资源分配效率低下
- 海量数据处理效率低下,数据存储因效率低下而成为瓶颈
- 网络通信成为新障碍,随着并行计算规模扩大,网络通信构成显著障碍
- 开发效率成为新制约,模型参数急剧增加导致开发效率受限
- 基础设施故障率高,运维复杂度高,对人员和自动化要求高
2.2.2 新一代 AI+DATA 基础设施的模式:集中与融合应对挑战
1)大中心+节点:
新一代AI基础设施遵循产业布局,采用“大中心+节点”模式,通常由政府或大型企业主导,构建覆盖整个区域的算力网络,为大型模型训练、区域行业及应用孵化提供AI基础
算力硬件持续高速投入,需要平台型软件支持,形成经济可行、可扩展且易于使用的公共服务向外提供
公共数据需要可控安全的计算环境,向公众和企业提供
2)建运一体化:
“建运一体化”是一种项目管理和运营模式,它将项目的建设(建)和运营(运)视为一个不可分割的整体。在这种模式下,通常由同一家或同一个联盟的企业,从项目规划、设计、施工到后期的运维、服务、甚至商业化运营,承担全周期的责任
早期参与智算中心标准建设的企业有极大的先发优势
运营方通常与承建方长期合作,采购技术服务,形成稳定的业务合作
2.2.3 技术路径:Data&AI一体化是关键跃迁
下一代AI Infra的突破口在于Data与AI的深度融合,不再是分离的两个环节,而是构成一个有机体,其特点是:
- 全链路打通:数据治理、计算引擎、模型开发、推理部署贯穿一体
- 闭环运行:模型推理产生的洞察可逆推回数据层进行补足或校正
- 灵活适应:支持大规模、高密度、低时延的生产级AI应用部署
- 平台化交付:作为基础软件,具备标准化、可扩展、可集成特性,适配多行业场景需求
三、AI + DATA 基础设施的客户场景
3.1 政府主导的可信数据空间
- 数据共享与治理:政府可以利用该基础设施构建一个安全、可信的数据共享平台,将不同部门(如交通、医疗、社保)的数据整合起来,在保证数据隐私和安全的前提下,通过AI模型进行综合分析
- 智慧城市管理:通过汇聚城市运行的实时数据(如交通流量、环境监测、公共安全),AI可以预测交通拥堵、优化能源分配、提前预警自然灾害,从而提升城市管理的效率和应急响应能力
- 普惠金融服务:在确保数据合规的情况下,金融机构可以利用政府提供的可信数据(如企业工商信息、纳税记录),通过AI进行更精准的信用评估,为中小微企业提供更便捷、低成本的贷款服务
3.2 金融行业
- 智能风控与反欺诈:AI模型可以实时分析海量的交易数据和用户行为模式,识别异常交易和欺诈行为,大大提高风控的精准度和效率
- 个性化金融服务:通过分析客户的消费行为、投资偏好等数据,AI可以为客户提供定制化的理财产品推荐、投资建议和保险方案
- 智能投研:利用AI处理海量的市场新闻、财报、社交媒体舆情等非结构化数据,生成有价值的投资洞察,辅助投资经理进行更科学的决策
3.3 智能制造
- 工业大脑与智能工厂:通过物联网(IoT)传感器收集设备运行、生产线流程等数据,AI可以实时分析生产效率、预测设备故障,实现生产线的自动化管理和故障预警
- 产品设计与研发:AI可以根据市场需求、用户反馈和历史数据,快速生成产品设计方案,优化产品性能,缩短新产品的研发周期
- 供应链优化:利用AI预测市场需求变化,优化库存管理和物流配送路径,降低运营成本,提高供应链的韧性
3.4 医疗健康
- 辅助诊断与新药研发:AI可以分析大量的医学影像、病理报告和基因数据,辅助医生进行疾病诊断,甚至加速新药的分子筛选和临床试验流程
- 个性化健康管理:通过可穿戴设备收集用户的健康数据,AI可以为用户提供定制化的健康建议、运动计划和饮食方案,实现从“治病”到“防病”的转变
- 医院运营管理:AI可以优化医院的资源调度,如床位分配、医生排班、手术室安排等,提升医院的整体运行效率
3.5 其他新兴应用场景
智能驾驶与汽车行业:自动驾驶模型训练、智能座舱、高精地图
建筑物智能管理: AI技术可用于建筑物监控、预测性维护和布局优化,提高建筑物的运营效率和舒适度
供应链监控与需求预测: AI可实现供应链监控、供应链优化和需求预测等功能,提升供应链效率
媒体和娱乐: AI可用于内容制作和分发运营的各种解决方案
电信: AI用于部署5G并通过5G创收的各种混合云和多云端服务
游戏: AI驱动型解决方案帮助更快地构建游戏并为其扩容
农业: AI Agent应用于智能农业和农产品追溯,推动农业现代化
教育: 通过智能教学和学习分析提升教育质量
四、行业竞争
当前市场分为四类玩家,其差异不仅在技术路径上,更体现在能否提供完整的“Data to AI”闭环能力上
玩家类型 | 优势 | 瓶颈 |
---|---|---|
AI新锐厂商 | 围绕场景定制开发Agent | 缺乏统一数据底座,难以横向扩展 |
传统大数据厂商 | 行业经验丰富、客户积累深厚 | AI能力较弱,未完成向AI-Native转型 |
综合型平台厂商 | 布局广泛、影响力大 | 架构冗余、各模块割裂、整合成本高 |
专业垂直厂商 | 技术领先、架构清晰、能力闭环 | 商业化初期,品牌认知和生态覆盖相对有限 |
4.1 全球市场竞争格局:全栈生态与云端寡头
竞争特点:
- 强者恒强: 行业进入门槛高,少数巨头占据主导地位,新玩家难以撼动
- 生态为王: 竞争焦点已从单一产品的性能比拼,转向全栈生态系统的广度和深度
全球市场的竞争格局主要由少数几家科技巨头主导,通过“软硬一体化”的战略,构建了从底层芯片到上层应用的封闭或半封闭生态系统,形成了强大的竞争壁垒。
NVIDIA:
- 作为AI基础设施的核心硬件供应商,NVIDIA凭借其在GPU领域的绝对领先地位(预计2025年市占率将达到70%左右)和CUDA软件平台,形成了难以逾越的生态优势。
- 是一家硬件公司,更是一个“以软件定义硬件”的全栈生态主导者,其竞争对手很难在短期内复制其生态护城河
云服务巨头(AWS、Microsoft Azure、Google Cloud):
- 巨头凭借其庞大的云基础设施和资本投入,为全球开发者提供了AI训练和推理所需的基础设施服务(IaaS)
- 通过自研芯片(如Google的TPU)和深度整合的云服务,将AI能力以MaaS(模型即服务)的形式提供,与NVIDIA形成既合作又竞争的关系
- 核心优势在于“云”,通过规模效应和技术服务,吸引大量企业客户
4.2 中国市场竞争格局:多元协同与自主可控
竞争特点:
- 政策驱动: “自主可控”的国策导向是核心驱动力,推动了国产芯片和软件生态的快速发展。
- 协同作战: 在硬件受限的背景下,企业更倾向于通过“芯片研发+系统集成”以及生态共建等合作模式,共同应对挑战
- 市场分散: 尽管云服务巨头占据主导,但由于技术路线和生态的多元性,市场格局尚未完全固化,为其他玩家提供了差异化竞争的机会
五、投资逻辑
「AI Infra 投资的核心维度拆解:技术、生态、市场、商业模式」
标签:ai