目錄
Pan Yang,SiliconFlow 的聯合創始人,在 Convo AI 和 RTE 2025 的“Real-Time AI Infra Session”上發表了題為“AI Infra: For Whom and Why?”的演講。在 AI 基礎架構領域有 8 大核心見解。
摘要
潘揚(Pan Yang)在人工智能基礎架構演講中的8個關鍵見解:
以推理為先 — 向推理計算轉變是由 AI 客戶和計算需求的指數增長所驅動的。
開源機會 — 開源模型以 3–5 個月的差距追趕,並在多模態領域有突破潛力。
MaaS 的呼喚 — 一站式平台提供多個模型的單一 API 訪問。
MaaS 的三大挑戰 — 可用性問題、性能差異和成本降低幻覺。
做困難但正確的事 — SiliconFlow 致力於提供更快、更好、更具成本效益的 AI 基礎架構。
2025 年四大 AI 場景 — 內容生成、智能代理(Agent 年)、編程和多模態應用。
AI 是工作,不是工具 — 黃仁勳提出的範式轉變是強調為代理而非人類構建。
AI 基礎架構 — 沒有泡沫 — 市場現實顯示大量未滿足需求,證明沒有泡沫,只有供應不足。
以推理為先
SiliconFlow 預測“未來大量計算能力將用於推理,而非訓練”,此趨勢在 2025 年變為現實,主要由兩個因素驅動:AI 客戶數量和使用量的指數增長,而完成單一任務所需計算量也呈指數增長。
開源模型的機會
開源模型正在迅速追趕閉源模型,动态差距為 3–5 個月。目前,LLM 的開源生態系統接近最先進(SOTA),而對於圖像、音频和视频等多模态模型仍有重大突破机会。
模型即服务(MaaS)的呼唤
今年,我们看到频繁的模型更新、规格多样、架构各异、多个模态,没有一家公司可以独立部署和维护所有模型。因此,一个能够整合各种模型的一站式平台成为开发人员的不可或缺的入口。SiliconFlow 正是做这一方向的,允许用户仅通过一个 API 快速体验多种模型。
MaaS 平台目前面临三大挑战
可用性和可靠性挑战:发生了资源不足和 429/503 错误等问题。
性能和质量显著差异:由不同服务提供商提供的同一开源模型在实际性能上表现出显著差异,反映了模型量化和优化程度的不同,直接影响了模型的最终能力。
成本降低的幻觉:尽管单个模型的成本可能每年降低十倍,但用户总是寻求最新、最强大的最先进(SOTA)模型,而这些顶级模型的调用价格仍相对稳定。同时,完成任务所消耗的令牌数量呈指数增长,导致实际应用成本没有显著减少。
做困难但正确的事
SiliconFlow 一直深耕在 AI 基础架构领域,深刻理解涉及的挑战,并持续致力于推动解决方案的实施,为用户提供更快、性能更优和成本更低的 AI 基础架构服务。
2025 年高度共識的四個 AI 情景
内容生成:生成文章、通过聊天机器人提供客户服务或建立知识库,一切都围绕语言进行。
智能代理(Agent):今年被称为代理年。虽然关于代理的概念有各种理解,但确实有一些变化。例如,Manus 努力推动如何定义代理。
编程:今年发布的主流模型首先与代理和编程能力对齐。业界普遍认为代理和编程是消耗最多令牌的领域。
多模态:尤其是在中国互联网环境中,多模态的模型消耗远远超过其他形式。
“AI 是工作,不是工具”
黄仁勋提出“AI 是工作,不是工具”,这本质上是一种范式转变。人工智能将主动操作工具完成任务,而不是被动响应指令。这将触发范式转变:为代理而非人为进行构建。人们将越来越多地将任务委托给代理,减少直接在软件界面上的操作。
AI 基础架构 — 没有泡沫
整个 AI 基础架构行业没有泡沫,实际上处于“远远不足”的供应状态。全球顶尖科技公司计划购买价值数千亿美元的尚未交付的基础架构。行业当前的瓶颈是无法生产芯片和缺乏能量。需求远远超过供应能力,证明市场的真实性和巨大潜力。


