Fish-Speech-1.5
О Fish-Speech-1.5
Fish Speech V1.5 — ведущая модель преобразования текста в речь (TTS) с открытым исходным кодом. Model использует инновационную архитектуру DualAR, включающую двухслойный авторегрессивный дизайн трансформера. Она поддерживает несколько языков, с более чем 300,000 часами тренировочных данных для английского и китайского языков, и более 100,000 часов для японского. В независимых оценках TTS Arena Model показала себя исключительно хорошо, с рейтингом ELO 1339. Model достигла уровня ошибки слов (WER) в 3.5% и уровня ошибки символов (CER) в 1.2% для английского языка, и уровня ошибки символов (CER) в 1.3% для китайских символов.
Доступный Serverless
Запускайте запросы немедленно, платите только за использование
$
15.0
На 1M UTF-8 Bytes
Метаданные
Спецификация
Государство
Available
Архитектура
Калибровка
Нет
Смешение экспертов
Нет
Общее количество параметров
Активированные параметры
Мышление
Нет
Точность
ФП8
Контекст length
0K
Максимум Tokens
поддерживается функциональность
Безсерверный
поддерживается
Безсерверный LoRA
Не поддерживается
Тонкая настройка
Не поддерживается
Embeddings
Не поддерживается
Rerankers
Не поддерживается
Поддержка Image Input
Не поддерживается
Режим JSON
Не поддерживается
Структурированные Outputs
Не поддерживается
Инструменты
Не поддерживается
Завершение погашения
Не поддерживается
Chat Префикс Заполнение
Не поддерживается
Сравнить с другими Model
Посмотрите, как эта Model сравнивается с другими.
