Fish-Speech-1.5
Tentang Fish-Speech-1.5
Fish Speech V1.5 adalah model text-to-speech (TTS) open-source terkemuka. Model ini memanfaatkan arsitektur DualAR yang inovatif, menampilkan desain transformer autoregressive ganda. Ini mendukung beberapa bahasa, dengan lebih dari 300.000 jam data pelatihan untuk Bahasa Inggris dan Cina, dan lebih dari 100.000 jam untuk Bahasa Jepang. Dalam evaluasi independen oleh TTS Arena, model ini berkinerja sangat baik, dengan skor ELO 1339. Model ini mencapai tingkat kesalahan kata (WER) sebesar 3,5% dan tingkat kesalahan karakter (CER) sebesar 1,2% untuk Bahasa Inggris, serta CER sebesar 1,3% untuk karakter Cina.
Tersedia Serverless
Jalankan kueri segera, bayar hanya untuk penggunaan
$
15.0
Per 1M Bytes UTF-8
Metadata
Spesifikasi
Negara
Available
Arsitektur
Terkalibrasi
Tidak
Campuran Ahli
Tidak
Total Parameter
Parameter yang Diaktifkan
Penalaran
Tidak
Precision
FP8
Text panjang konteks
0K
Max Tokens
Didukung Keberfungsian
Serverless
didukung
Serverless LoRA
Tidak didukung
Fine-tuning
Tidak didukung
Embeddings
Tidak didukung
Rerankers
Tidak didukung
Dukung Image Input
Tidak didukung
JSON Mode
Tidak didukung
Output Terstruktur
Tidak didukung
Alat
Tidak didukung
Fim Completion
Tidak didukung
Chat Prefix Completion
Tidak didukung
Bandingkan dengan Model Lain
Lihat bagaimana model ini dibandingkan dengan yang lain.
