Seed Audio 常见问题解答
使用 Seed Audio 生成富有表现力的 AI 配音和对话,基于 ElevenLabs 技术的文本转语音工具,支持表演标签、多音色选择和快速 MP3 预览。
Seed Audio 的常见问题解答
什么是 Seed Audio?
Seed Audio 是一个基于 ElevenLabs 技术并集成到 NanoPhoto 平台的 AI 语音合成(Text-to-Speech)与文本转对话工具。它可以将书面脚本转换为带有表情化表演标签、多角色对话支持和快速 MP3 预览的口语音频。用户编写或粘贴脚本,选择语音,可选添加表演指示,无需离开浏览器即可在数秒内生成可听的音频。
文本转语音和文本转对话有什么区别?
文本转语音(TTS)从一段文本生成单个叙述者旁白,适合解说视频、广告配音和旁白草稿。文本转对话则为一篇脚本中的不同话轮分配不同的语音,支持多说话者对话,适用于播客、游戏对白、演示和故事板。对话模式还支持每轮表演标签,每个角色的表演可以独立指导。
支持哪些表演标签?
Seed Audio 识别诸如 [laughing]、[whispering]、[sighs]、[short pause]、[warmly]、[curious] 等标签,这些标签可以控制输出的情感基调和节奏。标签直接插入到脚本文本中需要改变表演的位置。它们同时适用于 TTS 和对话模式,让用户无需外部音频编辑即可精细控制某句话的听感。
Seed Audio 如何计费?
Seed Audio 采用基于点数的计费模式,每次音频生成消耗 1 个点数。点数通过 NanoPhoto 平台购买,并在产品套件中通用。这种按次付费的模式适合工作量不固定的用户,无论是偶尔的旁白草稿还是高容量的对话制作,都无需订阅月度套餐。
Seed Audio 为谁设计?
Seed Audio 面向内容创作者、视频编辑、播客制作者、游戏开发者和产品团队,他们需要快速可用的语音素材。它适合速度至上的工作流程,如广告原型、教程配音、独立游戏的角色对话和播客草稿录制。那些原本需要打开专业音频软件来处理每一段短脚本的用户,可以用它大幅缩短完成时间。
Seed Audio 输出哪些音频格式?
Seed Audio 生成 MP3 文件,可在浏览器中直接预览并下载,用于视频编辑软件、播客制作工具、游戏引擎和演示文稿。选择 MP3 作为输出格式,是因为它在文件大小和音频质量之间取得了良好平衡,既适合快速草稿,也适合最终成品。
Seed Audio 与独立 TTS 工具有何不同?
与需要在脚本编辑、语音选择和音频导出之间切换应用的独立 TTS 工具不同,Seed Audio 将整个工作流程保留在 NanoPhoto 平台内。用户在同一界面中编写、指导、渲染、试听和下载。内置的表演标签系统和多说话者对话模式无需为了基本的表演调整而进行额外的音频编辑,使得每次迭代时间从数分钟缩短到数秒。
如何使用 Seed Audio
- 通过输入旁白段落或两到四轮对话来编写源脚本,也可以写四轮专注于自然语音的对话。
- 选择叙述者语音进行文本转语音(TTS),或为每轮对话分配不同语音来实现角色对话,从而选择语音和表达方式。
- 添加 [warmly]、[curious]、[laughing] 或 [short pause] 等表演标签来引导情感表达,让输出听起来像有人导演过一样。
- 在浏览器中预览生成的 MP3 以检查质量,然后下载音频文件用于视频剪辑、播客草稿、广告样片或产品演示。
