ChatTTS 핵심 기능
ChatTTS는 대화형 시나리오를 위해 설계된 음성 생성 모델로, 대규모 언어 모델 보조 도구의 대화 작업, 대화형 오디오 및 비디오 소개 등에 적합하며, 중국어와 영어를 지원하며 약 10만 시간의 데이터로 훈련하여 음성 합성에서 높은 품질과 자연스러움을 보여줍니다. 4만 시간의 데이터로 훈련된 기본 모델에 대한 오픈 소스 계획도 있습니다.
ChatTTS의 핵심 기능
음성 합성
ChatTTS는 텍스트를 자연스럽고 매끄러운 음성으로 변환할 수 있으며, 여러 언어와 음성 스타일을 지원합니다.
다국어 지원
현재 중국어와 영어를 지원하며, 향후 더 많은 언어를 지원할 예정입니다.
고품질 음성
방대한 데이터로 훈련된 ChatTTS는 고품질 음성을 생성할 수 있으며, 톤은 자연스럽고 매끄럽습니다.
대화 시나리오 최적화
대화 시나리오를 위해 설계되었으며, 챗봇, 음성 어시스턴트 등 다양한 대화 작업에 적합합니다.
오픈 소스 모델
프로젝트 팀은 연구자와 개발자가 2차 개발을 할 수 있도록 기본 모델을 오픈 소스로 공개할 계획입니다.