Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentes Révision précédente
Prochaine révision
Révision précédente
utiliser_le_modele_text_to_audio_synthese_vocale [13/11/2023 14:51] vaudorneputiliser_le_modele_text_to_audio_synthese_vocale [12/03/2026 18:51] (Version actuelle) – modification externe 127.0.0.1
Ligne 5: Ligne 5:
 De plus, la synthèse vocale permet de disposer de nombreux profils d’orateurs, ce qui permet de travailler sur les accents nationaux. De plus, la synthèse vocale permet de disposer de nombreux profils d’orateurs, ce qui permet de travailler sur les accents nationaux.
  
-**1. Choisir le modèle //Text to Audio (Cloud)//**+==== 1. Choisir le modèle //Text to Audio (Cloud)// ====
  
-{{:poodll_texttoaudio.png?500|}}+{{:poodll_texttoaudio.png}}
  
-**2. Choisir le profil de l'orateur** +==== 2. Choisir le profil de l'orateur ====
- +
-  * Conserver le format //text// pour une saisie simple.{{ :poodll_texttoaudio_speaker.png|}}+
  
 +<grid>
 +<col xs="6" md="3">
 +<thumbnail>
 +{{ :poodll_texttoaudio_speaker.png |}} 
 +<caption>
 +//Les 3 menus déroulants du modèle tta (text-to-audio).//
 +</caption>
 +</thumbnail>
 +</col>
 +  * Conserver le format //text// pour une saisie simple.\\
   * Le format [[https://docs.aws.amazon.com/fr_fr/polly/latest/dg/supportedtags.html | SSML]], //Speech Synthesis Markup Language//, permet une mise en format avancée du contenu oralisé (tel que l'insertion de fichiers sons, de pauses, de la [[prononciation phonétique]], etc.)   * Le format [[https://docs.aws.amazon.com/fr_fr/polly/latest/dg/supportedtags.html | SSML]], //Speech Synthesis Markup Language//, permet une mise en format avancée du contenu oralisé (tel que l'insertion de fichiers sons, de pauses, de la [[prononciation phonétique]], etc.)
 +</grid>
  
-**3. Insérer le texte à oraliser entre les balises POODLL**+ 
 +==== 3. Insérer le texte à oraliser entre les balises POODLL ====
  
 Le fait de cliquer sur le bouton //Insérer// après avoir paramétré le profil de l'orateur génère un élément POODLL avec 2 balises. Le fait de cliquer sur le bouton //Insérer// après avoir paramétré le profil de l'orateur génère un élément POODLL avec 2 balises.
Ligne 23: Ligne 33:
 Le texte à oraliser doit être saisi entre ces deux balises. Le texte à oraliser doit être saisi entre ces deux balises.
  
-<text background="info">{POODLL:type="tta",speaker="Male",language="English(GB)",format="text"}</text>**How do you do?**<text background="info">{POODLL:type="tta_end"}</text>+<text background="info">{POODLL:type="tta",speaker="Male",language="English(GB)",format="text"}</text>**cinema**<text background="info">{POODLL:type="tta_end"}</text> 
 + 
 +{{:tta_cinema.png?1000|}}
  
 Ensuite, il suffit de cliquer sur le bouton //Enregistrer// pour générer le fichier son. Ensuite, il suffit de cliquer sur le bouton //Enregistrer// pour générer le fichier son.
 +
 +==== 4. Utiliser la syntaxe SSML ====
 +
 +**Exemple 1 - SSML avec IPA** \\
 +<code xml>{POODLL:type="tta",speaker="Male",language="English(US)",format="ssml"}<speak><phoneme alphabet="ipa" ph="kəˈθɑlɪkəli">catholically</phoneme></speak>{POODLL:type="tta_end"}</code>
 +
 +**Exemple 2 - SSML avec x-sampa** \\
 +<code xml>{POODLL:type="tta",speaker="Male",language="English(US)",format="ssml"}<speak><phoneme alphabet="x-sampa" ph="k@"TAlIk@li">catholically</phoneme></speak>{POODLL:type="tta_end"}</code>
  • utiliser_le_modele_text_to_audio_synthese_vocale.1699887062.txt.gz
  • Dernière modification : il y a 10 jours
  • (modification externe)