Модели

Продукты

Цены

Документация

Блог

О

Контакт

🎉 gemma-4-12B-it доступно на SiliconFlow. Попробуйте это СЕЙЧАС.

🎉 gemma-4-12B-it доступно на SiliconFlow. Попробуйте это СЕЙЧАС.

Модели

Fish-Speech-1.5

Fish-Speech-1.5

fishaudio/fish-speech-1.5

Справочник API

О Fish-Speech-1.5

Fish Speech V1.5 — ведущая модель преобразования текста в речь (TTS) с открытым исходным кодом. Model использует инновационную архитектуру DualAR, включающую двухслойный авторегрессивный дизайн трансформера. Она поддерживает несколько языков, с более чем 300,000 часами тренировочных данных для английского и китайского языков, и более 100,000 часов для японского. В независимых оценках TTS Arena Model показала себя исключительно хорошо, с рейтингом ELO 1339. Model достигла уровня ошибки слов (WER) в 3.5% и уровня ошибки символов (CER) в 1.2% для английского языка, и уровня ошибки символов (CER) в 1.3% для китайских символов.

Доступный Serverless

Запускайте запросы немедленно, платите только за использование

За 1 миллион Tokens (Input/Output)

$

15.0

/ M UTF-8 bytes

Playground

Использование API

Эталон

Случай использования

Loading...

Метаданные

Создать на

29 нояб. 2024 г.

Лицензия

OPEN-SOURCE

Поставщик

Fish Audio

HuggingFace

Fish-Speech-1.5

Спецификация

Государство

Available

Архитектура

DualAR Transformer

Калибровка

Нет

Смешение экспертов

Нет

Общее количество параметров

Активированные параметры

Мышление

Нет

Точность

ФП8

Контекст length

0K

Максимум Tokens

поддерживается функциональность

Безсерверный

поддерживается

Безсерверный LoRA

Не поддерживается

Тонкая настройка

Не поддерживается

Embeddings

Не поддерживается

Rerankers

Не поддерживается

Поддержка Image Input

Не поддерживается

Режим JSON

Не поддерживается

Структурированные Outputs

Не поддерживается

Инструменты

Не поддерживается

Завершение погашения

Не поддерживается

Chat Префикс Заполнение

Не поддерживается

Сравнить с другими Model

Посмотрите, как эта Model сравнивается с другими.

Fish Audio

text-to-speech

Fish-Speech-1.5

Выпуск: 29 нояб. 2024 г.

Общий Контекст:

0K

Максимальный Output:

Input:

$

/ M UTF-8 bytes

Output:

$

/ M UTF-8 bytes

Готовы ускорить ваше развитие ИИ?

Готовы ускорить ваше развитие ИИ?

Готовы ускорить ваше развитие ИИ?

СТРАНИЦЫ

Продукты

Документация

МОДЕЛИ

ПРОДУКТЫ

Зарезервированные GPU

© 2025 SiliconFlow

·

Конфиденциальность

СТРАНИЦЫ

Продукты

Документация

МОДЕЛИ

ПРОДУКТЫ

Зарезервированные GPU

© 2025 SiliconFlow

·

Конфиденциальность

СТРАНИЦЫ

Продукты

Документация

МОДЕЛИ

ПРОДУКТЫ

Зарезервированные GPU

© 2025 SiliconFlow

·

Конфиденциальность