Title: La prosodie pour l
1La prosodie pour lIdentification Automatique des
Langues
- DEA IIL - IRIT - équipe IHM-PT
- Directeur de recherche Régine ANDRE-OBRECHT
- Responsable de stage François PELLEGRINO
- Jérôme FARINAS
2Plan de lexposé
- Cadre de létude
- La prosodie
- Evaluation des algorithmes dextraction de la
fréquence fondamentale - Une modélisation de la prosodie pour lIAL
- Conclusions et perspectives
31 Cadre de létude
- Identification Automatique des Langues (IAL)
- Projet de recherche de léquipe
- projet Discrimination Automatique Multilingue
- système complet dIAL
- un module de décodage acoustico-phonétique
- un modèle de langage
- un module prosodique
- Sujet de DEA
- recherche des algorithmes dextraction de la
fréquence fondamentale, - étude multilingue de la structure prosodique
suprasegmentale (recherche dunités prosodiques
et modélisation)
42 La prosodie
- définitions
- quelques fonctions
- difficultés liés à lextraction de paramètres et
à la modélisation
52 La prosodie définitions
- Au niveau acoustique
- Hauteur (fréquence fondamentale F0)
- intensité (énergie)
- durée
- Au niveau perceptuel
- rythme
- mélodie
- accentuation
62 La prosodie quelques fonctions
- Distinction entre homonymes
- a segment ? to segment
- plátano ? platano
- Structuration de lénoncé
- Linstituteur dit le directeur est un incapable
- Modalité
- Il va venir ? Il va venir. Il va venir
! - Fonctions non linguistiques
- calme ou énervé, triste ou gai, enthousiaste,
surpris...
72 La prosodie difficultés
- Au niveau de la modélisation
- nombreux modèles, pas de théorie unifiée
- apprentissage implicite
- enseignement implicite pour la langue naturelle
- prise en compte récente lors de lapprentissage
de langues étrangères Bagshaw 94 - Au niveau de lextraction de paramètres
- détection voisement
- confusion entre harmoniques
- signal téléphonique (F0 manquant, variabilité)
8(No Transcript)
9(No Transcript)
10Évaluation algorithmes...
- Comment évaluer un algorithme ?
- Difficultés dues aux erreurs de détections
- Autre source dinformation pour évaluer
- Bases de référence Bagshaw 94
- Intérêt de la combinaison dalgorithmes
dextraction de la fréquence fondamentale Hess
83
11Méthode combinatoire
124 Une modélisation de la prosodie pour lIAL
- Corpus utilisé
- Système général
- Extraction de paramètres
- Modélisation des unités prosodiques
- Modèle de langage
- résultats
134 Une modélisation corpus utilisé
- OGI-MLTS (Oregon Graduate Institute - Multi
Lingual Téléphone Speech Corpus) - corpus développé pour lIAL
- 11 langues (Français et Japonais utilisés)
- Fichiers de parole non-contrainte htl, htc,
meal, room, story-at, story-bt - Divisé en corpus APP et TST
144 Une modélisation système général
- Modélisations existantes
- approche classique adaptée à la prosodie
Muthusamy 93 Hazen 97 - approche basée sur F0 Itahashi 95
- Vue générale du module prosodique
Signal
Langue
Segmentation
Paramétrisation
Modèle prosodique
Modèle de langage
154 Une modélisation... extraction de paramètres
- Dénivelé de E et de F0
- Dérivée première de E et de F0
- Dérivée seconde de E et de F0
- Ecart-type de E et de F0
- Skewness de E et de F0
- Kurtosis de E et de F0
164 Une modélisation modèle prosodique
- Unité segment voisé
- 10 formes prosodiques ST, BU, TR, UPlo, UPmi,
UPhi, UPen, DWlo, DWmi, DWhi - une forme un Modèle de Markov Caché
17(No Transcript)
184 Une modélisation modèle de langage
- But modéliser les enchaînements entre les
formes contenues dans les phrases - Modèle langage bigramme (en utilisant le système
multigramme Deligne 96) - øi Forme prosodique
194 Une modélisation résultats
- Modélisation des unités prosodiques
- Identification des langues
205 Conclusion et perspectives
- Recherche dunités prosodiques spécifiques Ã
chaque langue - Essayer dautres modélisations des unités
prosodiques - Modélisation de la durée pour prendre en compte
le rythme de la parole