Seed Audio FAQ
Créez des voix off et dialogues expressifs avec Seed Audio. Outil de synthèse vocale propulsé par ElevenLabs avec balises de performance, sélection multi-voix et aperçu MP3 rapide.
FAQ de Seed Audio
Qu'est-ce que Seed Audio ?
Seed Audio est un outil de synthèse vocale (Text-to-Speech) et de texte en dialogue propulsé par l'IA, basé sur la technologie ElevenLabs et intégré à la plateforme NanoPhoto. Il convertit des scripts écrits en audio parlé avec des balises d'interprétation expressives, la prise en charge de dialogues à plusieurs voix et un aperçu rapide en MP3. Les utilisateurs écrivent ou collent un script, choisissent une voix, ajoutent éventuellement des instructions de jeu et génèrent un audio audible en quelques secondes sans quitter le navigateur.
Quelle est la différence entre la synthèse vocale et le texte en dialogue ?
La synthèse vocale (TTS) génère une voix off d'un seul narrateur à partir d'un bloc de texte, idéale pour les vidéos explicatives, les lectures de publicités et les brouillons de voix off. Le texte en dialogue attribue différentes voix aux différentes répliques d'un script, prenant en charge les conversations à plusieurs intervenants pour les podcasts, les dialogues de jeux, les démos et les storyboards. Le mode dialogue accepte également des balises d'interprétation par réplique, permettant de diriger indépendamment le jeu de chaque personnage.
Quelles balises d'interprétation sont prises en charge ?
Seed Audio reconnaît des balises telles que [laughing], [whispering], [sighs], [short pause], [warmly], [curious] et d'autres qui orientent le ton émotionnel et le rythme de la sortie. Ces balises sont insérées directement dans le texte du script à l'endroit où l'interprétation doit changer. Elles fonctionnent à la fois en mode TTS et en mode dialogue, offrant aux utilisateurs un contrôle précis sur la sonorité d'une ligne sans nécessiter de montage audio externe.
Comment fonctionne la tarification de Seed Audio ?
Seed Audio utilise un modèle de tarification basé sur des crédits, où chaque génération audio coûte 1 crédit. Les crédits sont achetés via la plateforme NanoPhoto et s'appliquent à l'ensemble de la suite de produits. Ce modèle de paiement par génération convient aux utilisateurs dont la charge de travail varie, des brouillons de voix off occasionnels à la production de dialogues à volume élevé, sans nécessiter d'abonnement mensuel.
À qui Seed Audio est-il destiné ?
Seed Audio cible les créateurs de contenu, les monteurs vidéo, les podcasteurs, les développeurs de jeux et les équipes produit qui ont besoin d'actifs vocaux rapides et publiable. Il s'intègre dans les flux de travail où la vitesse compte, comme les maquettes publicitaires, les voix off de tutoriels, les dialogues de personnages pour les jeux indépendants et les enregistrements de brouillons de podcasts. Les utilisateurs qui devaient autrement ouvrir un studio audio dédié pour chaque script court peuvent accomplir la même tâche en une fraction du temps.
Quels formats audio Seed Audio produit-il ?
Seed Audio génère des fichiers MP3 qui peuvent être prévisualisés directement dans le navigateur et téléchargés pour être utilisés dans des logiciels de montage vidéo, des outils de production de podcasts, des moteurs de jeu et des présentations. Le MP3 a été choisi comme format de sortie pour son équilibre entre taille de fichier et qualité audio, ce qui le rend pratique aussi bien pour les brouillons rapides que pour les actifs finaux.
Comment Seed Audio se compare-t-il aux outils TTS autonomes ?
Contrairement aux outils TTS autonomes qui nécessitent de passer d'une application à l'autre pour l'édition du script, la sélection de la voix et l'exportation audio, Seed Audio maintient l'ensemble du flux de travail au sein de la plateforme NanoPhoto. Les utilisateurs écrivent, dirigent, rendent, écoutent et téléchargent dans une seule interface. Le système intégré de balises d'interprétation et le mode dialogue multi-intervenants éliminent le besoin de sessions de montage audio séparées pour les ajustements de base de l'interprétation, réduisant le temps d'itération de minutes à secondes par génération.
Comment utiliser Seed Audio
- Rédigez le script source en saisissant un paragraphe de voix off ou deux à quatre tours de dialogue, ou quatre tours axés sur une parole naturelle.
- Choisissez les voix et le rendu en sélectionnant une voix de narrateur pour la synthèse vocale (TTS) ou en attribuant une voix différente à chaque tour de dialogue pour un échange entre personnages.
- Ajoutez des indications de jeu comme [warmly] (chaleureusement), [curious] (curieusement), [laughing] (en riant) ou [short pause] (courte pause) pour guider l'expressivité émotionnelle et donner un résultat dirigé.
- Prévisualisez le MP3 généré dans le navigateur pour vérifier la qualité, puis téléchargez le fichier audio pour le montage vidéo, les brouillons de podcast, les maquettes publicitaires ou les démonstrations produit.
