Fish-Speech-1.5

Fish-Speech-1.5

fishaudio/fish-speech-1.5

О Fish-Speech-1.5

Fish Speech V1.5 — ведущая модель преобразования текста в речь (TTS) с открытым исходным кодом. Model использует инновационную архитектуру DualAR, включающую двухслойный авторегрессивный дизайн трансформера. Она поддерживает несколько языков, с более чем 300,000 часами тренировочных данных для английского и китайского языков, и более 100,000 часов для японского. В независимых оценках TTS Arena Model показала себя исключительно хорошо, с рейтингом ELO 1339. Model достигла уровня ошибки слов (WER) в 3.5% и уровня ошибки символов (CER) в 1.2% для английского языка, и уровня ошибки символов (CER) в 1.3% для китайских символов.

Доступный Serverless

Запускайте запросы немедленно, платите только за использование

$

15.0

На 1M UTF-8 Bytes

Метаданные

Создать на

29 нояб. 2024 г.

Лицензия

Поставщик

Fish Audio

HuggingFace

Спецификация

Государство

Available

Архитектура

Калибровка

Нет

Смешение экспертов

Нет

Общее количество параметров

Активированные параметры

Мышление

Нет

Точность

ФП8

Контекст length

0K

Максимум Tokens

поддерживается функциональность

Безсерверный

поддерживается

Безсерверный LoRA

Не поддерживается

Тонкая настройка

Не поддерживается

Embeddings

Не поддерживается

Rerankers

Не поддерживается

Поддержка Image Input

Не поддерживается

Режим JSON

Не поддерживается

Структурированные Outputs

Не поддерживается

Инструменты

Не поддерживается

Завершение погашения

Не поддерживается

Chat Префикс Заполнение

Не поддерживается

Сравнить с другими Model

Посмотрите, как эта Model сравнивается с другими.

Готовы ускорить ваше развитие ИИ?

Готовы ускорить ваше развитие ИИ?

Готовы ускорить ваше развитие ИИ?

Russian (Russia)
Russian (Russia)
Russian (Russia)