Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentes Révision précédente
Prochaine révision
Révision précédente
utiliser_le_modele_text_to_audio_synthese_vocale [01/07/2022 10:06] vaudorneputiliser_le_modele_text_to_audio_synthese_vocale [12/03/2026 18:51] (Version actuelle) – modification externe 127.0.0.1
Ligne 1: Ligne 1:
 +====== Utiliser le modèle Text to Audio (synthèse vocale) ======
 +
 La synthèse vocale apporte un gain de temps dans la création et la mise à jour des ressources audio car elle permet de se passer de la manipulation des fichiers sons : le discours est simplement saisi au clavier. La synthèse vocale apporte un gain de temps dans la création et la mise à jour des ressources audio car elle permet de se passer de la manipulation des fichiers sons : le discours est simplement saisi au clavier.
 Elle permet de garantir la qualité sonore de la ressource (pas de problème de micro). Elle permet de garantir la qualité sonore de la ressource (pas de problème de micro).
 De plus, la synthèse vocale permet de disposer de nombreux profils d’orateurs, ce qui permet de travailler sur les accents nationaux. De plus, la synthèse vocale permet de disposer de nombreux profils d’orateurs, ce qui permet de travailler sur les accents nationaux.
  
-**1. Choisir le modèle //Text to Audio (Cloud)//**+==== 1. Choisir le modèle //Text to Audio (Cloud)// ==== 
 + 
 +{{:poodll_texttoaudio.png}} 
 + 
 +==== 2. Choisir le profil de l'orateur ==== 
 + 
 +<grid> 
 +<col xs="6" md="3"> 
 +<thumbnail> 
 +{{ :poodll_texttoaudio_speaker.png |}}  
 +<caption> 
 +//Les 3 menus déroulants du modèle tta (text-to-audio).// 
 +</caption> 
 +</thumbnail> 
 +</col> 
 +  Conserver le format //text// pour une saisie simple.\\ 
 +  Le format [[https://docs.aws.amazon.com/fr_fr/polly/latest/dg/supportedtags.html | SSML]], //Speech Synthesis Markup Language//, permet une mise en format avancée du contenu oralisé (tel que l'insertion de fichiers sons, de pauses, de la [[prononciation phonétique]], etc.) 
 +</grid> 
 + 
 + 
 +==== 3. Insérer le texte à oraliser entre les balises POODLL ==== 
 + 
 +Le fait de cliquer sur le bouton //Insérer// après avoir paramétré le profil de l'orateur génère un élément POODLL avec 2 balises. 
 +  * une balise ouvrante : <text background="info">{POODLL:type="tta",speaker="Male",language="English(GB)",format="text"}</text> 
 +  * une balise fermante : <text background="info">{POODLL:type="tta_end"}</text> 
 + 
 +Le texte à oraliser doit être saisi entre ces deux balises. 
 + 
 +<text background="info">{POODLL:type="tta",speaker="Male",language="English(GB)",format="text"}</text>**cinema**<text background="info">{POODLL:type="tta_end"}</text>
  
-{{:poodll_texttoaudio.png?500|}}+{{:tta_cinema.png?1000|}}
  
-**2. Choisir le profil de l'orateur**+Ensuite, il suffit de cliquer sur le bouton //Enregistrer// pour générer le fichier son.
  
-Conserver le format //text// pour une saisie simple.+==== 4Utiliser la syntaxe SSML ====
  
-Le format [[https://docs.aws.amazon.com/fr_fr/polly/latest/dg/supportedtags.html | SSML]], //Speech Synthesis Markup Language//, permet une mise en format avancée du contenu oralisé (tel que l'insertion de fichiers sons, de pauses, de la [[prononciation phonétique]], etc.)+**Exemple 1 - SSML avec IPA** \\ 
 +<code xml>{POODLL:type="tta",speaker="Male",language="English(US)",format="ssml"}<speak><phoneme alphabet="ipa" ph="kəˈθɑlɪkəli">catholically</phoneme></speak>{POODLL:type="tta_end"}</code>
  
-{{:poodll_texttoaudio_speaker.png?300|}}+**Exemple 2 - SSML avec x-sampa** \\ 
 +<code xml>{POODLL:type="tta",speaker="Male",language="English(US)",format="ssml"}<speak><phoneme alphabet="x-sampa" ph="k@"TAlIk@li">catholically</phoneme></speak>{POODLL:type="tta_end"}</code>
  • utiliser_le_modele_text_to_audio_synthese_vocale.1656669998.txt.gz
  • Dernière modification : il y a 10 jours
  • (modification externe)