Fish-Speech-1.5

Fish-Speech-1.5

fishaudio/fish-speech-1.5

約Fish-Speech-1.5

Fish Speech V1.5 は、オープンソースのテキストトゥスピーチ (TTS) Model の中で最も先進的なものです。このModelは革新的なDualARアーキテクチャを採用しており、二重自己回帰型トランスフォーマーデザインを特徴としています。複数の言語をサポートしており、英語と中国語には30万時間以上、日本語には10万時間以上のトレーニングデータを提供しています。TTS Arenaによる独立評価では、Modelは非常に優れた性能を発揮し、ELOスコアは1339を獲得しました。英語においては単語誤り率 (WER) が 3.5%、文字誤り率 (CER) が 1.2% を達成し、中国語の文字においては 1.3% のCERを達成しました。

利用可能な Serverless

クエリをすぐに実行し、使用量のみを支払います

$

15.0

1M UTF-8 バイトごと

メタデータ

作成する

2024/11/29

ライセンス

プロバイダー

Fish Audio

ハギングフェイス

仕様

Available

建築

キャリブレートされた

いいえ

専門家の混合

いいえ

合計パラメータ

アクティブ化されたパラメータ

推論

いいえ

Precision

FP8

コンテキスト長

0K

Max Tokens

対応機能

Serverless

対応

Serverless LoRA

サポートされていません

Fine-tuning

サポートされていません

Embeddings

サポートされていません

Rerankers

サポートされていません

Image入力をサポートする

サポートされていません

JSON Mode

サポートされていません

構造化されたOutputs

サポートされていません

ツール

サポートされていません

Fim Completion

サポートされていません

Chat Prefix Completion

サポートされていません

他のModelsと比較

他のモデルに対してこのModelがどのように比較されるかを見てください。

AI開発を 加速する準備はできていますか?

AI開発を 加速する準備はできていますか?

AI開発を 加速する準備はできていますか?

Japanese

© 2025 SiliconFlow

Japanese

© 2025 SiliconFlow

Japanese

© 2025 SiliconFlow