ChatTTS 簡介
ChatTTS 是一款為對話場景設計的語音生成模型,適合大型語言模型助理的對話任務、對話式音頻和視頻介紹等應用,它支援中文和英文,並透過約 10 萬小時的資料訓練,在語音合成方面展現了高品質和自然度,並計劃公開一個使用 4 萬小時資料訓練的基本模型。
ChatTTS 是什麼
ChatTTS 是一款針對對話場景的語音合成模型,由 GitHub 上的 2noise/chattts 項目開發。ChatTTS 專注於對話任務,例如大型語言模型助理中的對話任務,以及對話音訊和影片介紹。該模型支援中文和英文,在語音合成方面表現出高品質和自然度。這種效能水準是通過在約 100,000 小時的中文和英文數據上進行訓練而實現的。此外,項目團隊計劃開源一個用 40,000 小時數據訓練的基本模型,這將有助於學術界和開發人員社群進一步研究和開發。