約Fish-Speech-1.5
Fish Speech V1.5 は、オープンソースのテキストトゥスピーチ (TTS) Model の中で最も先進的なものです。このModelは革新的なDualARアーキテクチャを採用しており、二重自己回帰型トランスフォーマーデザインを特徴としています。複数の言語をサポートしており、英語と中国語には30万時間以上、日本語には10万時間以上のトレーニングデータを提供しています。TTS Arenaによる独立評価では、Modelは非常に優れた性能を発揮し、ELOスコアは1339を獲得しました。英語においては単語誤り率 (WER) が 3.5%、文字誤り率 (CER) が 1.2% を達成し、中国語の文字においては 1.3% のCERを達成しました。
利用可能な Serverless
クエリをすぐに実行し、使用量のみを支払います
$
15.0
1M UTF-8 バイトごと
メタデータ
仕様
州
Available
建築
キャリブレートされた
いいえ
専門家の混合
いいえ
合計パラメータ
アクティブ化されたパラメータ
推論
いいえ
Precision
FP8
コンテキスト長
0K
Max Tokens
対応機能
Serverless
対応
Serverless LoRA
サポートされていません
Fine-tuning
サポートされていません
Embeddings
サポートされていません
Rerankers
サポートされていません
Image入力をサポートする
サポートされていません
JSON Mode
サポートされていません
構造化されたOutputs
サポートされていません
ツール
サポートされていません
Fim Completion
サポートされていません
Chat Prefix Completion
サポートされていません
他のModelsと比較
他のモデルに対してこのModelがどのように比較されるかを見てください。
