🎉 MiniMax-M2.5可在 SiliconFlow 上使用。現在就試試看。
開始使用
一個 API 可以運行 200 多個尖端 AI 模型,並在幾秒鐘內部署
All
Featured
LLM
Vision
Image
Video
Audio
Serverless
Fish Audio
Text-to-Speech
發行日期:2024年11月29日
Fish Speech V1.5 是一個領先的開源語音合成(TTS)模型。該模型採用了創新的 DualAR 架構,具有雙自回歸變壓器設計。它支持多種語言,包括英語和中文的訓練數據超過 300,000 小時,以及日語的訓練數據超過 100,000 小時。 在 TTS Arena 獨立評估中,該模型表現非常出色,ELO 得分為 1339。該模型在英語的詞語錯誤率(WER)為 3.5%,字符錯誤率(CER)為 1.2%,以及中文字的字符錯誤率(CER)為 1.3%。...
$
15.0
/ M UTF-8 bytes
準備好 加速您的人工智能開發了嗎?
免費開始
頁面
首頁
模型
產品
文檔
定價
部落格
關於
聯繫
圖像
視頻
大型語言模型
音頻
概覽
推理
微調
預留的 GPU
訂閱以獲取更新
訂閱
© 2025 SiliconFlow
條款
·
隱私