最先進的

人工智能模型庫

一個 API 可以運行 200 多個尖端 AI 模型，並在幾秒鐘內部署

最先進的

人工智能模型庫

一個 API 可以運行 200 多個尖端 AI 模型，並在幾秒鐘內部署

最先進的

人工智能模型庫

一個 API 可以運行 200 多個尖端 AI 模型，並在幾秒鐘內部署

All

Featured

LLM

Vision

Image

Video

Audio

Serverless

Fish Audio

Text-to-Speech

Fish-Speech-1.5

發行日期：2024年11月29日

Fish Speech V1.5 是一個領先的開源語音合成（TTS）模型。該模型採用了創新的 DualAR 架構，具有雙自回歸變壓器設計。它支持多種語言，包括英語和中文的訓練數據超過 300,000 小時，以及日語的訓練數據超過 100,000 小時。在 TTS Arena 獨立評估中，該模型表現非常出色，ELO 得分為 1339。該模型在英語的詞語錯誤率（WER）為 3.5%，字符錯誤率（CER）為 1.2%，以及中文字的字符錯誤率（CER）為 1.3%。...

15.0

/ M UTF-8 bytes

輸入：

text

/ M UTF-8 bytes

準備好加速您的人工智能開發了嗎？