目录

潘阳,SiliconFlow 的联合创始人,在 Convo AI & RTE 2025 的“实时 AI 基础设施论坛”上发表了题为“AI 基础设施:为谁而建,为什么而建?”的演讲。对于 AI 基础设施领域,他提出了8个核心见解。
总结
潘阳关于 AI 基础设施演讲的8个关键见解:
推理优先 — 向推理计算的转变是由 AI 用户和计算需求的指数增长所推动的。
开源机会 — 开源模型以3-5个月的差距追赶,具有在Multimodal领域潜在突破的机会。
MaaS 的呼唤 — 一站式平台提供单个 API 访问多个模型。
三大 MaaS 挑战 — 可用性问题、性能差异以及成本降低的假象。
做困难但正确的事 — SiliconFlow 致力于提供更快、更好、更具成本效益的 AI 基础设施。
2025 年的四大 AI 场景— 内容生成、智能代理(代理年)、编码和Multimodal应用。
AI 是工作,而不是工具 — 黄仁勋的范式转变强调为代理构建,而不是为人类构建。
AI 基础设施 — 无泡沫 — 市场现实显示未满足的巨大需求证明没有泡沫,只有供应短缺。
推理优先
SiliconFlow 预测“未来,大多数计算能力将用于推理,而不是训练”在2023年。这一趋势在2025年成为现实,主要由两个因素推动:AI 客户数量和使用量的指数增长,以及完成单个任务所需计算量的指数增长。
开源模型的机会
开源模型正在以 3-5 个月的动态差距快速赶上闭源模型。目前,LLMs 的开源生态系统接近最先进水平(SOTA),而对于像 image、audio 和 video 这样的Multimodal模型,仍然有显著的突破机会。
Model as a Service (MaaS) 的呼唤
今年,我们见证了频繁的模型更新、多样的规格、多变的架构以及多种模式,没有公司能够独立部署和维护所有模型。因此,能够整合多种模型的一站式 MaaS 平台已成为开发者不可或缺的切入点。这正是 SiliconFlow 继续关注的方向,允许用户通过一个 API 快速体验各种模型。
MaaS 平台当前面临的三大挑战
可用性和可靠性挑战:出现了资源不足和429/503错误等问题。
性能和质量差异显著:不同服务提供商提供的相同开源模型在实际性能上表现出显著差异,反映出模型量化和优化水平的差异,直接影响模型的最终能力。
成本下降的幻觉:虽然单个模型的成本可能每年下降十倍,但用户总是追求最新、最强大的 SOTA 模型,而这些顶级模型的调用价格相对稳定。同时,完成任务所消耗的token数量呈指数增长,导致实际应用成本并没有明显下降。
做困难但正确的事
SiliconFlow 一直深耕 AI 基础设施领域,深刻理解所涉及的挑战,并持续致力于推动解决方案的实施,为用户提供更快、更高性能和更低成本的 AI 基础设施服务。
2025 年高共识的四大 AI 场景
内容生成:生成文章、通过 Chatbot 提供客户服务或构建知识库,一切都围绕语言展开。
智能代理:今年被称为代理年。尽管对代理的理解因人而异,但已经发生了一些变化。例如,Manus 作出了巨大努力推动对代理概念的定义。
编码:今年推出的主流模型首先与代理和编码能力对齐。行业普遍认为代理和编码是消耗最多tokens的领域。
Multimodal:尤其是在中国的互联网环境中,Multimodal的模型消耗量远大于其他形式。
“AI 是工作,而不是工具”
黄仁勋提出“AI 是工作,而不是工具”,这本质上是一种范式转变。AI 将主动操作工具以完成任务,而不是被动地响应指令。这将引发范式转换:构建用于代理,而不是用于人类。人类将越来越多地将任务委托给代理,减少对软件界面的直接操作。
AI 基础设施 — 无泡沫
整个 AI 基础设施行业不存在泡沫,实际上处于“供应远远不足”的状态。全球顶级科技公司已计划购买价值数千亿美元的尚未交付的基础设施。行业当前的瓶颈是生产芯片和能源不足。需求远超供应能力,证明了市场的真实性和巨大潜力。

