シリコンフロー共同創業者からのAIインフラに関する8つの重要な洞察

2025/11/14

目次

SiliconFlowの共同創設者であるPan Yangは、「AIインフラ:誰のために、なぜ?」と題した講演を「リアルタイムAIインフラセッション」Convo AI & RTE 2025で行いました。AIインフラの分野における8つの主要な洞察があります。

要約

Pan YangのAIインフラに関するスピーチからの8つの重要な洞察:

  1. 推論ファースト — AI顧客と計算需要の指数関数的な増加によって推論コンピューティングへのシフトが進んでいます。

  2. オープンソースの機会 — オープンソースモデルが3〜5ヶ月のギャップで追いついており、マルチモーダル領域でのブレークスルーの可能性があります。

  3. MaaSへの呼びかけ — 単一のAPIアクセスで複数のモデルに接続できるワンストッププラットフォーム。

  4. 三つの主要なMaaSの課題 — 利用可能性の問題、パフォーマンスのばらつき、コスト削減の錯覚。

  5. 難しいけれど正しいことをする — SiliconFlowは、より速く、より良く、よりコスト効果の高いAIインフラを提供することに専念しています。

  6. 四つのAIシナリオ2025 — コンテンツ生成、エージェントAI(エージェントの年)、コーディング、マルチモーダルアプリケーション。

  7. AIはツールではなく仕事 — ジェンセン・ファンによるエージェントのための構築に焦点を当てたパラダイムシフト。

  8. AIインフラ — バブルではない — 市場の現実は、バブルがないことを示しており、供給の不足のみを示しています。

推論ファースト

SiliconFlowは2023年に「将来的には、大多数の計算能力がトレーニングではなく推論に使用される」と予測しました。この傾向は2025年に現実になりつつあり、主にAI顧客数と利用の指数関数的な成長、そして単一のタスクを完遂するために必要な計算量の増加によって推進されています。

オープンソースモデルの機会

オープンソースモデルは閉鎖モデルとの間で3〜5か月の動的なギャップで急速に差を詰めています。現在、LLMのオープンソースエコシステムは最先端(SOTA)に近づいていますが、画像、音声、動画などのマルチモーダルモデルではまだブレークスルーの余地があります。

Model as a Service(MaaS)への呼びかけ

今年は頻繁なモデルの更新、多様な仕様、多様なアーキテクチャ、および複数のモダリティがあるため、単一の企業がすべてのモデルを独自に展開および維持することはできません。したがって、さまざまなモデルを統合できるワンストップMaaSプラットフォームが開発者にとって不可欠な入り口となっています。これは、SiliconFlowが引き続き注力している方向性であり、ユーザーが1つのAPIだけでさまざまなモデルを迅速に体験できるようにしています。

MaaSプラットフォームが直面している三つの主要な課題

  • 可用性と信頼性の課題:リソースが不足している、または429/503エラーが発生することがある。

  • パフォーマンスと品質に大きなばらつきがある:同じオープンソースモデルが異なるサービスプロバイダーによって提供されると、大幅に異なる実際のパフォーマンスを示し、モデルの量子化と最適化のレベルの違いを反映し、モデルの最終能力に直接影響を与えることがあります。

  • コスト削減の錯覚:単一モデルのコストは年々10倍に減少するかもしれませんが、ユーザーは常に最新かつ最強の最先端(SOTA)モデルを求めており、これらのトップティアモデルの呼び出し価格は比較的安定しています。その一方で、タスクを完了するために消費されるトークンの数は指数関数的に増加し、実際のアプリケーションコストに大幅な減少はありません。

難しいけれど正しいことをする

SiliconFlowはAIインフラ分野に深く根ざしており、関与する課題を深く理解し、ユーザーにより速く、より高性能で、低コストのAIインフラサービスを提供するためにソリューションの実装を促進し続けています。

2025年までに合意された四つのAIシナリオ

  • コンテンツ生成: 文章を生成したり、チャットボットでカスタマーサービスを提供したり、ナレッジベースを構築することがすべて言語に関連しています。

  • エージェントAI: 今年はエージェントの年と呼ばれています。エージェントの概念についての理解にはさまざまなものがありますが、いくつかの変化がありました。たとえば、Manusはエージェントを定義する取り組みを大いに推進しました。

  • コーディング: 今年リリースされた主流モデルはエージェントとコーディング能力に対応することが最初でした。業界は一般的に、エージェントとコーディングが最もトークンを消費する分野であると認識しています。

  • マルチモーダル: 特に中国のインターネット環境では、マルチモーダルのモデル消費は他の形式より遥かに大きいです。

「AIはツールではなく仕事」

ジェンセン・ファンは「AIはツールではなく仕事」であると提案し、これは本質的にパラダイムシフトです。AIはタスクを完遂するためにツールを積極的に操作し、指示に応答するのではなく、エージェントのために構築し、人間のためではないというパラダイムシフトを引き起こします。人間はますますタスクをエージェントに委任し、ソフトウェアインターフェイスを直接操作することは少なくなります。

AIインフラ — バブルではない

AIインフラ業界全体にバブルはなく、実際には供給が「全く不十分」な状態です。世界の大手テクノロジー企業は、数千億ドルに相当するインフラを購入する計画を進めていますが、まだ配達されていません。現在の業界におけるボトルネックは、チップの生産能力とエネルギーの不足です。需要は供給能力を大幅に上回っており、市場の信憑性とその巨大な可能性を証明しています。

AI開発を 加速する準備はできていますか?

AI開発を 加速する準備はできていますか?

AI開発を 加速する準備はできていますか?

Japanese

© 2025 SiliconFlow

Japanese

© 2025 SiliconFlow

Japanese

© 2025 SiliconFlow