Seed Audio 常見問題解答
透過 Seed Audio 產生具表現力的 AI 配音與對話,採用 ElevenLabs 技術的文字轉語音工具,支援表演標籤、多語音選擇與快速 MP3 預覽。
Seed Audio 的常見問題解答
什麼是 Seed Audio?
Seed Audio 是一個基於 ElevenLabs 技術並整合到 NanoPhoto 平台的 AI 語音合成(Text-to-Speech)與文字轉對話工具。它可以將書面腳本轉換為帶有表情化表演標籤、多角色對話支援和快速 MP3 預覽的口語音訊。使用者編寫或貼上腳本,選擇語音,可選新增表演指示,無需離開瀏覽器即可在數秒內生成可聽的音訊。
文字轉語音和文字轉對話有什麼區別?
文字轉語音(TTS)從一段文字生成單一敘述者旁白,適合解說影片、廣告配音和旁白草稿。文字轉對話則為一篇腳本中的不同話輪分配不同的語音,支援多說話者對話,適用於播客、遊戲對白、示範和故事板。對話模式還支援每輪表演標籤,每個角色的表演可以獨立指導。
支援哪些表演標籤?
Seed Audio 識別諸如 [laughing]、[whispering]、[sighs]、[short pause]、[warmly]、[curious] 等標籤,這些標籤可以控制輸出的情感基調和節奏。標籤直接插入到腳本文字中需要改變表演的位置。它們同時適用於 TTS 和對話模式,讓使用者無需外部音訊編輯即可精細控制某句話的聽感。
Seed Audio 如何計費?
Seed Audio 採用基於點數的計費模式,每次音訊生成消耗 1 個點數。點數透過 NanoPhoto 平台購買,並在產品套件中通用。這種按次付費的模式適合工作量不固定的使用者,無論是偶爾的旁白草稿還是高容量的對話製作,都無需訂閱月費方案。
Seed Audio 為誰設計?
Seed Audio 面向內容創作者、影片編輯、播客製作者、遊戲開發者和產品團隊,他們需要快速可用的語音素材。它適合速度至上的工作流程,如廣告原型、教學配音、獨立遊戲的角色對話和播客草稿錄製。那些原本需要打開專業音訊軟體來處理每段短腳本的使用者,可以用它大幅縮短完成時間。
Seed Audio 輸出哪些音訊格式?
Seed Audio 生成 MP3 檔案,可在瀏覽器中直接預覽並下載,用於影片編輯軟體、播客製作工具、遊戲引擎和簡報。選擇 MP3 作為輸出格式,是因為它在檔案大小和音訊品質之間取得了良好平衡,既適合快速草稿,也適合最終成品。
Seed Audio 與獨立 TTS 工具有何不同?
與需要在腳本編輯、語音選擇和音訊匯出之間切換應用程式的獨立 TTS 工具不同,Seed Audio 將整個工作流程保留在 NanoPhoto 平台內。使用者在同一介面中編寫、指導、渲染、試聽和下載。內建的表演標籤系統和多說話者對話模式無需為了基本的表演調整而進行額外的音訊編輯,使得每次迭代時間從數分鐘縮短到數秒。
如何使用 Seed Audio
- 透過輸入旁白段落或兩到四輪對話來編寫原始腳本,也可以寫四輪專注於自然語音的對話。
- 選擇敘述者語音進行文字轉語音(TTS),或為每輪對話分配不同語音來實現角色對話,從而選擇語音和表達方式。
- 添加 [warmly]、[curious]、[laughing] 或 [short pause] 等表演標籤來引導情感表達,讓輸出聽起來像經過導演指導一樣。
- 在瀏覽器中預覽產生的 MP3 以檢查品質,然後下載音訊檔案用於影片剪輯、播客草稿、廣告樣片或產品展示。
