logoAIStage

ChatTTS はじめに

ChatTTS は、約 100,000 時間のデータでトレーニングされた、会話型のシナリオ向けの音声生成モデルで、大規模言語モデルアシスタントの対話タスク、会話型音声およびビデオのイントロなどに適しています。中国語と英語をサポートし、音声合成の品質と自然さが高く評価されています。40,000 時間のデータでトレーニングされた基本モデルのオープンソースプランも用意されています。

ウェブサイトを訪問する

ChatTTSとは何ですか

ChatTTS は、会話シナリオ向けのテキスト音声合成モデルであり、GitHub 上の 2noise/chattts プロジェクトによって開発されました。ChatTTS は、大規模言語モデルアシスタントの会話タスクや、会話音声およびビデオのイントロなど、会話タスクに特化しています。このモデルは中国語と英語をサポートしており、音声合成において高品質で自然な音声を実現しています。このレベルの性能は、約 100,000 時間の中国語と英語のデータでトレーニングすることで実現しています。さらに、プロジェクトチームは、40,000 時間のデータでトレーニングされた基本モデルをオープンソース化する予定です。これは、学術界と開発者コミュニティがさらなる研究開発を進めるための助けとなるでしょう。

特徴*

ChatTTS 代替案