ChatTTS 소개
ChatTTS는 대화형 시나리오를 위해 설계된 음성 생성 모델로, 대규모 언어 모델 보조 도구의 대화 작업, 대화형 오디오 및 비디오 소개 등에 적합하며, 중국어와 영어를 지원하며 약 10만 시간의 데이터로 훈련하여 음성 합성에서 높은 품질과 자연스러움을 보여줍니다. 4만 시간의 데이터로 훈련된 기본 모델에 대한 오픈 소스 계획도 있습니다.
ChatTTS이(가) 무엇인가요?
ChatTTS는 대화 시나리오를 위한 텍스트 음성 합성 모델로 GitHub의 2noise/chattts 프로젝트에서 개발되었습니다. ChatTTS는 대규모 언어 모델 어시스턴트의 대화 작업과 대화 오디오 및 비디오 소개와 같은 대화 작업에 특화되어 있습니다. 이 모델은 중국어와 영어를 지원하며 음성 합성에서 높은 품질과 자연스러움을 보여줍니다. 이러한 수준의 성능은 약 100,000시간의 중국어와 영어 데이터로 훈련하여 달성되었습니다. 또한 프로젝트 팀은 40,000시간의 데이터로 훈련된 기본 모델을 오픈 소스로 공개할 계획입니다. 이는 학계와 개발자 커뮤니티가 추가 연구 개발을 진행하는 데 도움이 될 것입니다.