模型

產品

定價

文檔

部落格

關於

聯繫

🎉 Kimi-K3可在 SiliconFlow 上使用。現在就試試看。

🎉 Kimi-K3可在 SiliconFlow 上使用。現在就試試看。

模型

Fish-Speech-1.5

Fish-Speech-1.5

fishaudio/fish-speech-1.5

API 參考

關於Fish-Speech-1.5

Fish Speech V1.5 是一個領先的開源語音合成（TTS）模型。該模型採用了創新的 DualAR 架構，具有雙自回歸變壓器設計。它支持多種語言，包括英語和中文的訓練數據超過 300,000 小時，以及日語的訓練數據超過 100,000 小時。在 TTS Arena 獨立評估中，該模型表現非常出色，ELO 得分為 1339。該模型在英語的詞語錯誤率（WER）為 3.5%，字符錯誤率（CER）為 1.2%，以及中文字的字符錯誤率（CER）為 1.3%。

可用的無伺服器

立即運行查詢，僅按使用量付費

每百萬 Tokens（輸入/輸出）

$

15.0

/ M UTF-8 bytes

體驗中心

API 使用

基準

用例

Loading...

元數據

創建於

2024年11月29日

許可證

OPEN-SOURCE

供應商

Fish Audio

HuggingFace

Fish-Speech-1.5

規格

狀態

Available

架構

DualAR Transformer

經過校準的

否

專家並行

否

總參數

啟用的參數

推理

否

精度

FP8

上下文長度

0K

最大輸出長度

支援的功能

無伺服器

支持

無伺服器的 LoRA

不支持

微調

不支持

向量嵌入

不支持

重排序

不支持

支援圖片輸入

不支持

JSON 模式

不支持

結構化輸出

不支持

工具

不支持

中間填充補全

不支持

聊天前綴補全

不支持

與其他模型比較

看看這個模型與其他模型的對比如何。

Fish Audio

text-to-speech

Fish-Speech-1.5

發行日期：2024年11月29日

總上下文：

0K

最大輸出：

輸入：

$

/ M UTF-8 bytes

輸出：

$

/ M UTF-8 bytes

準備好加速您的人工智能開發了嗎？

準備好加速您的人工智能開發了嗎？

準備好加速您的人工智能開發了嗎？

頁面

模型

大型語言模型

產品

© 2025 SiliconFlow

·

頁面

模型

大型語言模型

產品

© 2025 SiliconFlow

·

頁面

模型

大型語言模型

產品

© 2025 SiliconFlow

·