logoAIStage

ChatTTS Pendahuluan

ChatTTS adalah model pembangkitan suara yang dirancang untuk skenario percakapan, cocok untuk tugas dialog asisten model bahasa besar, pengantar audio dan video percakapan, dan banyak lagi, mendukung bahasa Cina dan Inggris, dan telah menunjukkan kualitas tinggi dan kealamian dalam sintesis ucapan melalui pelatihan dengan sekitar 100.000 jam data, rencana sumber terbuka untuk model dasar yang dilatih dengan 40.000 jam data juga tersedia.

Kunjungi Situs Web

Apa itu ChatTTS

ChatTTS adalah model sintesis ucapan yang dirancang untuk skenario percakapan, dikembangkan oleh proyek 2noise/chattts di GitHub. ChatTTS mengkhususkan diri dalam tugas percakapan, seperti tugas percakapan untuk asisten dengan model bahasa berskala besar, serta pengantar audio dan video percakapan. Model ini mendukung bahasa Mandarin dan Inggris, menunjukkan kualitas tinggi dan naturalitas dalam sintesis ucapan. Tingkat kinerja ini dicapai melalui pelatihan pada sekitar 100.000 jam data bahasa Mandarin dan Inggris. Selain itu, tim proyek berencana untuk membuka sumber kode model dasar yang dilatih dengan 40.000 jam data, yang akan membantu komunitas akademis dan pengembang dalam penelitian dan pengembangan di masa mendatang.

Unggulan*

ChatTTS Alternatif