關於Fish-Speech-1.5
Fish Speech V1.5 是一個領先的開源文本轉語音系統 (TTS) 模型。該模型採用創新的 DualAR 架構,具有雙自迴歸轉換器設計。它支持多種語言,擁有超過 300,000 小時的英文和中文訓練數據,以及超過 100,000 小時的日文數據。在 TTS Arena 的獨立評估中,該模型表現出色,獲得了 1339 的 ELO 分數。該模型實現了單詞錯誤率 (WER) 3.5% 和英文的字符錯誤率 (CER) 1.2%,中文字符的 CER 為 1.3%。
可用的無伺服器
立即運行查詢,僅按使用量付費
$
/
$
每百萬 Tokens(輸入/輸出)
元數據
規格
狀態
可用
架構
經過校準的
不
專家並行
不
總參數
啟用的參數
推理
不
精度
FP8
上下文長度
0K
最大輸出長度
支援的功能
無伺服器
支持
無伺服器的 LoRA
不支持
微調
不支持
向量嵌入
不支持
重排序
不支持
支援圖片輸入
不支持
JSON 模式
不支持
結構化輸出
不支持
工具
不支持
中間填充補全
不支持
聊天前綴補全
不支持
與其他模型比較
看看這個模型與其他模型的對比如何。
