ChatTTSIntroduction
ChatTTS est un modèle de génération de voix conçu pour les scénarios conversationnels, adapté aux tâches de dialogue des assistants de grands modèles de langage, aux introductions audio et vidéo conversationnelles, et plus encore, il prend en charge le chinois et l'anglais, et a montré une qualité et une naturalité élevées dans la synthèse vocale grâce à une formation avec environ 100 000 heures de données. Des plans d'open source pour un modèle de base formé avec 40 000 heures de données sont également en place.
Qu'est-ce que ChatTTS
ChatTTS est un modèle de synthèse vocale conçu pour les scénarios de conversation, développé par le projet 2noise/chattts sur GitHub. ChatTTS est spécialisé dans les tâches de dialogue, telles que les tâches de dialogue pour les assistants avec des modèles linguistiques de grande taille, ainsi que les introductions audio et vidéo conversationnelles. Le modèle prend en charge à la fois le chinois et l'anglais, montrant une haute qualité et une naturalité dans la synthèse vocale. Ce niveau de performance est obtenu grâce à l'entraînement sur environ 100 000 heures de données chinoises et anglaises. De plus, l'équipe du projet prévoit d'ouvrir le code source d'un modèle de base formé avec 40 000 heures de données, ce qui aidera la communauté académique et des développeurs dans les futures recherches et développement.