ChatTTS Основные функции
ChatTTS — это модель генерации речи, разработанная для разговорных сценариев, подходящая для задач диалога помощников больших языковых моделей, разговорных аудио и видео-вступлений и многого другого. Она поддерживает китайский и английский языки, и продемонстрировала высокое качество и естественность в синтезе речи благодаря обучению на примерно 100 000 часов данных. Планы по открытому исходному коду для базовой модели, обученной на 40 000 часов данных, также находятся в стадии разработки.
Основные возможности ChatTTS
Синтез речи
ChatTTS может преобразовывать текст в естественную плавную речь, поддерживая множество языков и стилей речи.
Поддержка нескольких языков
В настоящее время поддерживаются китайский и английский языки, в будущем будет добавлена поддержка других языков.
Высококачественная речь
Благодаря обучению на большом количестве данных ChatTTS может генерировать высококачественную речь с естественной интонацией и плавностью.
Оптимизация для диалоговых сценариев
Модель разработана специально для диалоговых сценариев и подходит для различных задач диалога, таких как чат-боты, голосовые помощники и т. д.
Модель с открытым исходным кодом
Команда проекта планирует открыть исходный код базовой модели, что позволит исследователям и разработчикам проводить вторичную разработку.