Fish-Speech-1.5

Fish-Speech-1.5

fishaudio/fish-speech-1.5

關於Fish-Speech-1.5

Fish Speech V1.5 是一個領先的開源文本轉語音系統 (TTS) 模型。該模型採用創新的 DualAR 架構,具有雙自迴歸轉換器設計。它支持多種語言,擁有超過 300,000 小時的英文和中文訓練數據,以及超過 100,000 小時的日文數據。在 TTS Arena 的獨立評估中,該模型表現出色,獲得了 1339 的 ELO 分數。該模型實現了單詞錯誤率 (WER) 3.5% 和英文的字符錯誤率 (CER) 1.2%,中文字符的 CER 為 1.3%。

可用的無伺服器

立即運行查詢,僅按使用量付費

$

$

每百萬 Tokens(輸入/輸出)

元數據

創建於

2024年11月29日

許可證

供應商

Fish Audio

HuggingFace

規格

狀態

可用

架構

經過校準的

專家並行

總參數

啟用的參數

推理

精度

FP8

上下文長度

0K

最大輸出長度

支援的功能

無伺服器

支持

無伺服器的 LoRA

不支持

微調

不支持

向量嵌入

不支持

重排序

不支持

支援圖片輸入

不支持

JSON 模式

不支持

結構化輸出

不支持

工具

不支持

中間填充補全

不支持

聊天前綴補全

不支持

準備好 加速您的人工智能開發了嗎?

準備好 加速您的人工智能開發了嗎?

準備好 加速您的人工智能開發了嗎?

Chinese (Traditional Han, Taiwan)

© 2025 SiliconFlow

Chinese (Traditional Han, Taiwan)

© 2025 SiliconFlow

Chinese (Traditional Han, Taiwan)

© 2025 SiliconFlow