中财投资网(www.161588.com)2026/3/18 9:50:04讯:
本报记者 王镜茹
随着生成式人工智能技术从“模型训练”逐步迈向大规模商业落地,以训练为核心的算力消耗,正逐渐转向以推理为主导的持续性算力需求。3月17日,英伟达首席执行官黄仁勋在GTC大会上表示,AI推理市场拐点已经到来,AI从训练阶段全面进入推理与执行阶段,推理算力需求呈指数级爆发。
“随着生成式人工智能应用规模扩大,推理算力需求增长速度可能远超训练算力。一方面,应用需求爆发,生成式AI与智能体应用加速落地,用户高频交互带来指数级推理请求;另一方面,专用推理芯片、液冷散热及光互连等技术持续突破,显著提升算力效率与并发能力,为大规模部署奠定基础。”深圳市前海排排网基金销售有限责任公司研究员张鹏远对《证券日报》记者表示。
从行业机构的预测来看,推理算力的重要性正持续提升。国际数据公司(IDC)预测,到2027年,我国推理算力占整体算力的比例将突破70%。中国IDC圈创始人、CEO黄超表示,2026年产业智能体将进入百花齐放的发展阶段,算力应用正从“训练主导”转向“推理驱动”,推理算力需求的爆发周期即将全面到来。
面对推理算力需求的快速增长,国内产业链上下游企业正加快技术研发和产品布局。在芯片层面,多家厂商正推出面向推理场景优化的芯片。相较于传统训练芯片,推理芯片更强调功耗控制、成本效率以及部署灵活性,因此在云端和边缘侧均具有广阔应用空间。
以深圳云天励飞技术股份有限公司(以下简称“云天励飞”)为例,该公司以NPU为核心,在云推理场景的大算力芯片上确定了GPNPU技术路线,并在矩阵、向量单元、存储层级和有效带宽利用上深度优化,目标是指数级降低token成本,加速大模型应用的规模化、普惠化落地。
2025年,云天励飞实现营业收入13.08亿元,同比增长42.57%。云天励飞相关负责人对《证券日报》记者表示:“对于企业而言,随着行业竞争从比训练规模逐步转向比推理效率、比交付成本、比系统赚钱能力,谁能更早把硬件、存储和软件协同做到位,谁就更有机会在推理时代占据主动。”
在服务器和系统层面,头部厂商也在持续推出针对推理场景优化的算力平台。例如,浪潮电子信息产业股份有限公司推出了元脑R1推理服务器,可实现单机支持16张标准PCIe双宽卡,单机即可部署DeepSeek-671B模型;推出元脑CPU推理服务器,可快速部署并高效运行DeepSeek-R132B、QwQ-32B等新一代推理模型。
与此同时,算力基础设施建设也在同步提速。过去,国内许多智算中心普遍采用训推一体的建设模式。3月12日,云天励飞中标广东省湛江市AI渗透支撑新质生产力基础设施建设项目,该项目定位为专注推理任务的AI推理集群,主要面向各类行业应用场景,为国内传统产业的AI化提供落地样本。
北京止于至善投资管理有限公司总经理何理认为,在这一变革中,高性能推理芯片、HBM及全栈软件将率先受益算力红利。推理场景对低延迟、高吞吐和能效要求极高,LPU、ASIC等专用架构将加速替代通用计算单元,HBM4等存储技术将成为突破带宽瓶颈的关键。同时,算力由数据中心向边缘侧下沉,高密度推理机架与先进散热技术需求提升,叠加模型量化、参数压缩等编译优化,将推动产业从硬件堆叠转向软硬协同。
(编辑 乔川川)