Title: Phontique et prosodie : styles et accents
1 - Phonétique et prosodie styles et accents
- Philippe Boula de Mareüil
- LIMSI-CNRS
- mareuil_at_limsi.fr
2Introduction
- Sociolinguistique ? 4 dimensions de variation
- diachronique
- styles
- diaphasique (lecture / parole spontanée)
- diatopique (géographique)
- accents
- diastratique (sociale)
- prosodie fil directeur
3Différentes fonctions de la prosodie
- Fonction distinctive ? niveau lexical
- Fonction démarcative ? " syntaxique
- Fonction modale ? " énonciatif (Q/R)
- Fonction expressive ? plan stylistique
- informationnelle, interactive
- émotionnelle, attitudinale
- impressive, identificatrice
- ? ?
- pour produire un effet involontaire
4Le style des années 40
- conditions techniques (micro)
- prononciation des phonèmes, qualité de voix
- impression demphase donnée par une
- dynamique rythmique rendue par certains
allongements et la - nécessité de surarticuler
- Quelle est la part de la prosodie dans ce
style ? - Quentend-on dailleurs par style ?
5Parole spontanée / parole lue
- euh dhésitation, pauses sonores et autres
régulateurs (pour maintenir/orienter léchange) - marqueurs discursifs
- ligateurs comme mais, donc, alors
- particules comme bon, (voi)là, ben, quoi, enfin,
en fait (presque
toujours des disfluences ) - répétitions (de mots outils) et faux départs
(auto-corrections, fragments de mots et/ou
constituants abandonnés) - moins de schwas et de liaisons
6Phonostylistique, sociolinguistique
- Styles distingués par Labov
- casual speech (discours familier)
- careful speech (discours surveillé)
- reading (lecture de textes et de listes de mots
isolés) - Insécurité linguistique (se traduisant par des
réactions - subjectives envers sa propre façon de parler
- fluctuations, mais régularités au sein de la
variation - selon léchelle sociale (sous-prolétariat,
classe ouvrière, petite bourgeoisie, moyenne et
grande bourgeoisie), combinant la profession,
léducation, le revenu et le lieu de résidence
7Les genres de loral (ou de lécrit)
- Problématique appartenant aussi au langage
courant - G1 les catégories de textes ou dinteractions
(ou genres ), définis dabord par des critères
externes - G2 les types de discours (narratif,
descriptif, argumentatif, explicatif, procédural,
didactique), définis dabord par des critères
internes (des traits linguistiques, comme lusage
des temps). -
(ex. interactions dans les commerces) - approche top-down ? script préexistant ?
- nature
du site, du format, du canal -
\ -
(ex. clos ou de plein air) - Fréquent mélange des genres (ex. infotainment)
8Quest-ce qui caractérise un accent ?
- suite de phonèmes et instanciation des faits de
coarticulation - qualité de voix, phénomènes de pauses sonores et
dhésitations - clichés mélodiques, registre de hauteur, profils
de durée, placement de laccent lexical et
autres schibboleths - ? selon les langues et les accents
9Rôle du segmental et du suprasegmentalphonèmes
prosodie
accent lt accentum (ad cantum) lt prosôidia
cf. Rossi, Ladd, Bloomfield
10La question de lintonation
- Souvent, les études se concentrent sur
larticulation des seules voyelles - (moins catégorielles que les consonnes).
- Même si
- les caractéristiques phonémiques et la dimension
prosodique sont importantes, - les caractéristiques prosodiques de la langue
maternelle sont extraites très tôt, - peu de place est consacrée à la prosodie.
11Quelques études prosodiques
- atlas prosodique des langues romanes (AMPER)
- différentes manifestations accentuelles dans les
patois du Nord/Nord-Est de la France, et plus
généralement dans toute la Francophonie (ex. je
vais à Nâncy) - identification de variétés dialectales en
néerlandais et en scots - identification de dialectes grecs à partir de
parole réitérée en /ma-ma/ - typologie prosodique des dialectes suédois
fondée sur laccent (I ou II) - système daccent tonal dans les différents
dialectes du japonais
12Quelques études dans le cadre autosegmental
- le réseau TIE (Tone and Intonation in Europe)
- ? approche de type Lab Phon
- le projet IViE (Intonational Variation in
English) ? high rising terminal tune ,
commun chez les jeunes femmes - frequency code ?
- le projet Dialektintonation pour les dialectes
dAllemagne - études sur lespagnol péninsulaire /
latino-américain - patrons intonatifs (notamment interrogatifs)
dans quelques variétés ditalien
13Quelques études sur le rythme
- identification des variétés dialectales de
langlais - discrimination entre portugais européen et
brésilien - identification des dialectes arabes
- Proportion dintervalles vocaliques (V) et
écart type des intervalles consonantiques (?C)
pour discriminer différentes classes rythmiques
en particulier à chronométrage syllabique vs
accentuel Ramus, 1998. - / PVI (Pairwise Variability Index)
- ? continuum Grabe Low, 2002
14Pour faire la part des choses
- Difficultés expérimentales liées à des problèmes
déquipement - pour étudier la prosodie isolément des propriétés
segmentales - Tirer profit des nouvelles technologies,
- en particulier de la synthèse de la parole
(outil déjà utilisé à des fins de
délexicalisation).
15Pour faire la part des choses
- Difficultés expérimentales liées à des problèmes
déquipement - pour étudier la prosodie isolément des propriétés
segmentales - Tirer profit des nouvelles technologies,
- en particulier de la synthèse de la parole
(outil déjà utilisé à des fins de
délexicalisation).
16Pour faire la part des choses
- Difficultés expérimentales liées à des problèmes
déquipement - pour étudier la prosodie isolément des propriétés
segmentales - Tirer profit des nouvelles technologies,
- en particulier de la synthèse de la parole
(outil déjà utilisé à des fins de
délexicalisation).
- modification / re-synthèse
17Accents régionaux
- Approche à base de corpus (PFC)
- ? différents accents
représentés - Un auditeur natif est-il capable de les
identifier ? - Avec quel degré de granularité peut-il les
distinguer ? - Plusieurs tranches dâge et styles de parole
étant représentés, quelle est leur influence
sur les performances ? - Dans quelle mesure les réponses à ces questions
dépendent-elle de lorigine géographique des
sujets interrogés ?
18Exemples de travaux antérieurs
- Les résultats dune tâche similaire de clustering
perceptif ne sont pas disponibles pour le
français. - Les études se focalisent sur les représentations
linguistiques de variétés spécifiques et ne
permettent pas de prédire les caractéristiques
les plus discriminantes.
19Le projet PFC(Phonologie du Français
Contemporain)
- Faisant suite à la grande enquête phonologique
de H. Walter (1982) - Couvrant la diversité du français sur un vaste
territoire - À travers des locuteurs ancrés dans leur lieu de
résidence
20Locuteurs
En chacun des 6 points, 3 hommes et 3 femmes,
répartis en 3 tranches dâge (1530 ans, 3060
ans, 60 ans et )
21Plan
- Pré-test sur lévaluation du degré daccent des
locuteurs - Expériences sur lidentification de lorigine
des locuteurs - expérience 1 (région parisienne)
- expérience 2 (région marseillaise)
22Stimuli
- Pour chacun des 36 locuteurs, 2 échantillons de
parole - une longue phrase lue (25 mots) tirée du milieu
du texte PFC - un extrait de parole spontanée, tiré dentretiens
guidés
23Stimuli
- Pour chacun des 36 locuteurs, 2 échantillons de
parole - une longue phrase lue (25 mots) tirée du milieu
du texte PFC - un extrait de parole spontanée, tiré dentretiens
guidés
24Mesures de débit
25Auditeurs
- 25 auditeurs de langue maternelle française,
sans problèmes daudition connus - résidant en région parisienne, membres du LIMSI
(pré-test et expérience 1) - résidant en région marseillaise, membres du LPL
dAix-en-Provence (expérience 2) - Âgés en moyenne de 32 ans (20 ans en
moyenne passés dans leur région de résidence) - Ils se disaient quasiment tous familiers des
accents de Marseille et de Suisse, et non
familiers des autre accents.
26Tâche
- Pré-test évaluer le degré daccent sur une
échelle - 0 pas daccent 1 petit accent
2 accent modéré 3 assez fort accent
4 fort accent 5 très fort accent - Expériences proprement dites (1 et 2)
identifier lorigine des locuteurs parmi les 6
régions proposées
27Protocole
- Dans un caisson acoustique, à travers une
interface conviviale, auditeurs munis dun casque
du même modèle - Niveau découte confortable, préalablement
égalisé - Échantillons sonores, au format Wave,
échantillonnés à 22,05 kHz, 16 bits, mono - brève familiarisation une fois la même phrase
lue par un locuteur ou une locutrice de chacune
des 6 régions, et de chacun des 6 degrés daccent - test proprement dit 2 stimuli non comptés dans
les résultats 72 stimuli présentés dans un
ordre aléatoire -
28Analyse acoustique du corpus
- À partir de la segmentation automatique en
phonèmes sur le texte lu dans le Nord et dans le
Sud - des appendices nasaux
- des schwas potentiels
- Fréquences formantiques au milieu des /O/ des
mots côte et connaît dans la phrase lue
29Triangles vocaliques
Nord - Sud
30Résultats pré-test
- Normandie ? Languedoc (du petit au fort
accent) - Plus les locuteurs sont âgés, plus laccent a
été jugé fort.
31Résultats expérience 1
- Matrice de confusion sur lensemble des données
pour - 25 auditeurs de région parisienne ().
- Suisse romande la mieux reconnue
- 3 régions du Sud confondues entre elles
32Résultats expérience 2
- Matrice de confusion sur lensemble des données
pour - 25 auditeurs de région marseillaise ().
- 43,9 de bonnes réponses (contre 42,1 pour
lexpérience 1), taux comparables entre les 8
auditeurs les plus aixois et les 8 auditeurs
les plus marseillais
33Analyses statistiques
- ANOVA ? effet majeur du facteur Degré, qui
interagit avec lÂge, mais pas du Style de parole
(corrélation significativement positive entre lu
et spontané) ni du Groupe dauditeurs (région
parisienne ou marseillaise) - Clustering scaling ? représentations
graphiques à partir de différents algorithmes,
utilisant 2 types de distance - euclidienne
- Manhattan
34Clustering
- Dendrogramme issu du clustering hiérarchique
agglomératif utilisant une distance euclidienne ?
opposition Nord/Sud
35Scaling
- Sortie
- espace à 2 dimensions
- ? 3 groupes (Nord de la France, Sud de la France
et Suisse)
- Entrée matrice de dissimilitude
36Bilan et perspectives
- Étude à base de perception, dalignement
automatique (pour les mesures acoustiques) et de
techniques danalyse de données - 3 accents Nord, Sud et Est, sans que le style
(lecture formelle ou parole spontanée) ni la
région dorigine des auditeurs ne semble affecter
les résultats - fusion de données pour ajouter de nouveaux points
- modélisation par la reconnaissance de la parole
- application à de plus grands corpus
- dimension sociale, ici quelque peu négligée
37Laccent des banlieues
- palatalisation des occlusives vélaires et
dentales, qui se centralisent et dégagent un yod
(voire une chuintante) devant les voyelles
antérieures - pharyngalisation du ? et recul de toute
larticulation (inverse du phénomène de
préciosité surtout féminin lavancée de ? en
) - allongement relatif et/ou patron accentuel
montant sur lavant-dernière syllabe, chute
abrupte de F0 sur la syllabe finale précédant une
frontière prosodique
38Caractéristiques prosodiques
39Caractéristiques prosodiques
40Laccent étranger
Quest-ce quon entend par accent étranger ?
Confrontation de deux systèmes phonologiques
Facteurs sociologiques ? anecdotes Quest-ce qui
fait que lon garde un accent dans L2 ? -
Question au cur des sciences cognitives
41Définition
- par rapport à une norme
- en production et en perception
- théorie motrice Troubetzkoy, Flege, Kuhl, Best
- crible SLM NLM PAM
t
langue cible (L2)
langue maternelle (L1)
42Aspects psycholinguistiques
- Chez lenfant, la langue maternelle fonctionne
vite comme un filtre. - Fameuse confusion entre /l/ et /r/ chez les
Japonais - plus performants que les Français pour
discriminer la longueur des phonèmes (tâche ABX) - sourds à la place de laccent lexical
- Phonotactique, distribution et fonction des
unités, structure syllabique - Adaptation de la prononciation
- ? savant mélange de contraintes et de plasticité
- ? problèmes théoriques importants
43Aspects phonétiques-linguistiques
/i/ pour les Portugais
/y/ français
/u/ pour les Anglais
/t/ pour les Russes
/?/ anglais
/s/ pour les Japonais
44Aspects sociolinguistiques
- Identification ethnique, génération, sexe,
éducation - Degré de motivation à apprendre, plus ou moins
grand intérêt pour la prononciation de L2 - Quantité, fréquence et circonstances dusage de
L1/L2 - Temps de résidence dans un environnement parlant
en prédominance L2 - État du développement neuro-cognitif au moment
de la première exposition à L2
45LHypothèse de la Période Critique
- Plus L2 est apprise tôt, plus la prononciation
sera correcte. - au plus tard vers la puberté
- Âge dacquisition de L2 corrélé ou confondu avec
dautres facteurs - (ex. interactions entre enfants à lécole ? entre
adultes) - Années dexpérience en L2
- ? plus dincidence au début de lapprentissage
- Bilingues parfaits ? autant dexceptions
46Aspects cognitifs
- Modèles du cerveau
- abstractioniste lexique mental mémorisé sous
forme de représentations symboliques
(phonologiques, prélexicales) - épisodique lexique stocké sous forme directe
dexemplaires de surface (de traces acoustiques
détaillées) - Arguments en faveur de la première théorie,
linguistique - dans le sens de lhypothèse du filtrage
phonologique et - à lencontre de lhypothèse de la période critique
47Perception de laccent étranger
- Également influencée par
- le voisinage géographique
- la proximité typologique entre les langues
- lorigine de lauditeur et ses connaissances en
L1, en L2 et dans dautres langues - Favorisée chez un ami dont on sait quil a vécu à
létranger - Accent plus facilement identifié sil nous est
familier ? détection de divergences par rapport
à la norme - traits propres à une autre langue
(peut-être seulement un ou deux, subtils et
ponctuels), que lon a mémorisés
48Première expérience espagnol / italien
- 10 locuteurs espagnols et italiens enregistrés
- Une douzaine de phrases qui se disent (presque)
de la même façon - dans les deux langues (ex. ha visto la casa del
presidente americano) - transplantation de prosodie sur des bases de
diphones - quest-ce qui est perçu quand on croise le
segmental et le suprasegmental de ces deux
langues ? - Tests perceptifs à Pise avec 20 natifs italiens,
à Barcelone avec - 20 natifs castillans et dans la région parisienne
avec 20 natifs français
49Al telefono, Antonio manifestò poca simpatia.
50Al teléfono, Antonio manifestó poca simpatÍa.
51Al telefono, Antonio manifestò poca simpatia.
52Al teléfono, Antonio manifestó poca simpatÍa.
53Résultats
- Tâche
- Italiens et Espagnols répondre espagnol ,
espagnol avec accent italien , italien avec
accent espagnol ou italien - Français répondre très probablement espagnol
, probablement espagnol , probablement
italien ou très probablement italien - ? La prosodie est le facteur dominant pour
identifier lespagnol, litalien ou un accent
espagnol / italien.
54Deuxième expérience laccent maghrébin en
français
- Avec plus de 900 000 locuteurs adultes vivant en
métropole, - larabe est la principale langue autre que le
français parlée en - France (source INED).
- Expérience proposée corpus et protocole
- Une vingtaine de locuteurs français et maghrébins
(kabyles et arabes - marocains, algériens ou tunisiens arrivés en
France depuis 2 ans en - moyenne) enregistrés
- Une douzaine de phrases françaises
- ? modification de la prosodie naturelle
55seraient témoins des millions délecteurs
(arabe algérien en haut, français en bas)
56seraient témoins des millions délecteurs
(arabe algérien en haut, français en bas)
57seraient témoins des millions délecteurs
(arabe algérien en haut, français en bas)
58seraient témoins des millions délecteurs
(arabe algérien en haut, français en bas)
59Résultats
- 2 types de test
- auprès de 15 auditeurs français
- ? évaluation du degré daccent sur une échelle
de 0 à 8 - auprès de 15 auditeurs algériens (arrivés en
France depuis 3 ans) - ? identification de lorigine (kabyle,
arabe algérien, marocain, tunisien) - Une voix maghrébine avec prosodie française est
jugée comme ayant - un plus fort degré daccent quune voix française
avec prosodie - maghrébine.
- Hormis pour les accents les plus forts, il est
difficile de reconnaître - lorigine des locuteurs maghrébins.
60Troisième expérience espagnol/italien
- Pour sassurer que les résultats obtenus sont dus
à la paire L1-L2 - plutôt quà la méthode employée
- Bilingues espagnol/ italien enregistrés
- Même corpus et même tâche que dans la première
expérience, - prosodie naturelle modifiée comme dans la
deuxième expérience - rôle plus important de la prosodie
61Discussion
- Intérêt à la fois pratique et théorique
- à démêler la part du segmental et du
suprasegmental - selon la paire L1-L2
- - plus grand effet de la prosodie dans laccent
espagnol / italien, - - plus grand effet de la voix dans laccent
maghrébin en français
62Quid des Espagnols et Italiens parlant français ?
- Peut-on reconnaître la langue maternelle dun
locuteur - allemand
- anglais
- arabe choix établi à partir de statistiques
- espagnol sur le tourisme et limmigration
- Italien
- portugais
- 36 natifs de ces différentes langues enregistrés
(24 ans, depuis 15 mois en France, ayant
commencé à apprendre le français à 17 ans en
moyenne) - ? un énoncé dune dizaine de sec. retenu pour
chacun
63Test perceptif
- Tâche
- auto-évaluer sa familiarité avec les langues et
les accents - évaluer le degré daccent des locuteurs
- identifier leurs langues maternelles (choix
forcé) - décrire les indices acoustiques marquants
- 25 auditeurs, dont
- 23 ne sont pas ou que peu familiers avec la
langue arabe - 20 ont une bonne connaissance de la langue
anglaise - (avec laccent)
64Résultats (taux did. gt 52 )
2,37
2,18
2,94
3,00
3,07
2,39
- Arabophones les mieux reconnus
- Confusions italien-espagnol et anglais-allemand
- Commentaires des auditeurs sur les indices
- segmentaux (notamment le timbre de la voyelle
/y/) et - suprasegmentaux (notamment le rythme)
65Analyses phonétiques
- À partir de la lecture du texte PFC (segmenté en
phonèmes en utilisant des modèles acoustique
standard pour le français) - F1, F2 filtrés pour écarter des valeurs
aberrantes - normalisation de Nearey
- Di ln(Fi) moyenne(ln(Fi))
- triangles vocaliques
- Analyses statistiques
- prononciation du /y/ discriminante
66Paramètres rythmiques
- Les classes rythmiques ( stress-timed vs
syllable-timed ) établies pour les langues
elles-mêmes restent-elles valables pour la parole
non native ? - Caractérisation de nos accents combinant les
paramètres de Ramus et Grabe sur les voyelles - peu robuste, confusions hormis pour litalien et
larabe (le plus proche du français)
67Conclusion générale
- Mêmes questions, en partie, pour les styles, les
accents régionaux, sociaux et étrangers - problèmes pour lhumain et la machine
- applications en reconnaissance automatique de la
parole
68Remerciements
- Merci à Iryna Lehka, Tomaá Dubeda, Annelise
Coquillon, Zsuzsanna Fagyal et Christopher
Stewart pour les échantillons sonores quils
mont envoyés - Merci de votre attention.
69Travaux pratiques
- Transplantation de prosodie
- Tracé de triangles vocaliques
- avec filtrage des mesures automatiques de
formants - avec normalisation (de Nearey)
- avec ellipses de taille réglable
- Caractérisation du rythme
- V/?C
- PVI
- Analyse de données
- clustering
- scaling
-