logoAIStage

ChatTTS Введение

ChatTTS — это модель генерации речи, разработанная для разговорных сценариев, подходящая для задач диалога помощников больших языковых моделей, разговорных аудио и видео-вступлений и многого другого. Она поддерживает китайский и английский языки, и продемонстрировала высокое качество и естественность в синтезе речи благодаря обучению на примерно 100 000 часов данных. Планы по открытому исходному коду для базовой модели, обученной на 40 000 часов данных, также находятся в стадии разработки.

Посетить сайт

Что такое ChatTTS

ChatTTS — это модель синтеза речи для диалоговых сценариев, разработанная в рамках проекта 2noise/chattts на GitHub. ChatTTS специализируется на задачах диалога, таких как диалоговые задачи для помощников с большой языковой моделью, а также диалоговые аудио- и видеовступления. Модель поддерживает как китайский, так и английский языки, демонстрируя высокое качество и естественность при синтезе речи. Такой уровень производительности достигается благодаря обучению на примерно 100 000 часах китайских и английских данных. Кроме того, команда проекта планирует открыть исходный код базовой модели, обученной на 40 000 часах данных, что поможет академическому сообществу и сообществу разработчиков в дальнейшем исследовании и развитии.

Рекомендуемые*

ChatTTS Альтернативы