Title: 8e Journes INTEX NooJ
18e Journées INTEX / NooJ
- La flexion des verbes acadiens en NooJ
- Michael LONGUniv. De Moncton, CanadaUniv. du
Nouveau-Brunswick, Canada - avec un soutien du Gouvernement du CanadaConseil
de Recherche en Sciences Humaines
2Verbes acadiens
- Introduction - Le français acadien contexte et
influences - Trois Groupes - VFS VANG VVF
- VVF - Les défis
- VVF - 2 approches pour lidentification-
description flexionnelle - grammaires
morphologiques - VVF - du nouveau
- Conclusion
3IntroductionContexte et influences
- Le français acadien
- Langue parlé par le peuple acadien
- La nature du  territoire acadien
- Selon la région contexte de contacte
étroit avec langlais peu de contact avec
langlais - Influences
- le français standard
- langlais
4IntroductionCorpus
- Chiac Kasparian (1,988 ko 317,662 mots)
- Maillet (9,522 ko 188,191 mots)
- Malenfant (1,550 ko 20,777 mots)
- Nord-Est (2,806 ko 54,671 mots)
- Parkton (8.335 ko 192,293 mots)
773,594 mots
- Corpus oraux 2 de plus, dont une région avec
peu de contacte avec langlais. - Corpus lit. Riche en vieux formes étend la
couverture par rapport aux régions.
5Trois Groupes VFS VANG VVF
VFS - DELAF VENG - Â pis il dit, you know
mémére, you need a boy Contexte anglais
pas tellement traîtés encore VANG -  ils
allont runner out de prêtres  que mes
enfants turnont out de même - Contexte de
phrase français - VANG conjuguer en français
- description de lan dernier tient
6VANG trois graphes suffisent
Worker?Work
Giver?Give
Setter?Set
7Trois Groupes VFS VANG VVF
VVF -  on a arrangé le bas pour que sa saye
chaud que ce soit  cest souvent
quils veniont toute la famille quils
viennent  Le prêtre se gréyait dans ses pus
belles hardes shabillait
8VVF Les défis
- Terminaison  -ont ,  -iont ils parlont
ils parlent P ils parliont ils parlaient
I ils parliont quils parlent S - Régularisation de la racine ils devenont ils
deviennent P ils deveniont ils devenaient
I quils deveniont quils deviennent S - Emplois variés du passé simple à loral Â
fallit espérer après que le petit seyit au
monde.  il a fallu / fallait attendre que le
petit soit au monde.Â
9VVF Les défis
- Transcriptions  fautives - accents mére
vs. mère - consonnes raccomoder vs.
raccommoder - voyelles supprimées décidra vs.
décidera - pour souligner la prononciation? -
forme voulu? - manque de cohérence dans la
transcription? - Substitution / inversion de sons. - il counnaît
vs. il connaît - consarver vs. conserver -
erssouder vs. ressouder
10VVF Deux approches - (Flexion)
Avoir ltEgt/W ltBWgt (ai/P1s ont/P3p)
ltB3gt (ais/I12s aient/I3p) ltBWgt
aur(ais/C1s aient/C3p) ltBWgt
arr(aient/C3pacad iont/C3pacad) ltBWgt
(aie/S1s aient/S3p)
11VVF Deux approches - (Flexion)
Avoir ltEgt/W ltBWgt (ai/P1s ont/P3p
avont/P3pacad) ltB3gt (ais/I12s
aient/I3p iont/I3pacad) ltBWgt
aur(ais/C1s aient/C3p iont/C3pacad)
ltBWgt arr(aient/C3pacad iont/C3pacad)
ltBWgt (aie/S1s aient/S3p
ayiont/S3pacad)
- Avantage Consolidation de la description
- Contrainte Description limitée à Avoir(pas un
problème puisque nul autre verbe ne se conjugue
selon cette description)
12VVF Deux approches - (Flexion)
Tenir ltEgt/W ltBWgt tiendre/Wacad
tchendre/Wacad ltB4gt iens/P1s
enons/P1p ltBWgt tchens/P1sacad
tchenons/P1pacad ltB4gt ienne/S1s
enions/S1p ltBWgt tchenne/S1sacad
tchenions/S1pacad
13VVF Deux approches - (Flexion)
Tenir ltEgt/W ltBWgt tiendre/Wacad
tchendre/Wacad ltB4gt iens/P1s
enons/P1p ltBWgt tchens/P1sacad
tchenons/P1pacad ltB4gt ienne/S1s
enions/S1p ltBWgt tchenne/S1sacad
tchenions/S1pacad
3 formes infinitifs
14VVF Deux approches - (Flexion)
Tenir ltEgt/W ltBWgt tiendre/Wacad
tchendre/Wacad ltB4gt iens/P1s
enons/P1p ltBWgt tchens/P1sacad
tchenons/P1pacad ltB4gt ienne/S1s
enions/S1p ltBWgt tchenne/S1sacad
tchenions/S1pacad
formes multiples pour P
15VVF Deux approches - (Flexion)
Tenir ltEgt/W ltBWgt tiendre/Wacad
tchendre/Wacad ltB4gt iens/P1s
enons/P1p ltBWgt tchens/P1sacad
tchenons/P1pacad ltB4gt ienne/S1s
enions/S1p ltBWgt tchenne/S1sacad
tchenions/S1pacad
formes multiples pour S
16VVF Deux approches - (Flexion)
Tenir ltEgt/W ltBWgt tiendre/Wacad
tchendre/Wacad ltB4gt iens/P1s
enons/P1p ltBWgt tchens/P1sacad
tchenons/P1pacad ltB4gt ienne/S1s
enions/S1p ltBWgt tchenne/S1sacad
tchenions/S1pacad
- Problème Description fautive pour Venir qui se
conjugue comme Tenir en français standard.
Besoin donc de multiplier les conjugaisons
 modèlesÂ
17VVF Deux approches - (.nom)
On demande à NooJ de trouver la combinaison
(Variable 1)ar(Variable 2)
18VVF Deux approches - (.nom)
On lui met une contrainte, disant que sil trouve
 ér ou  er entre les même deux variables,
et que ce mot est accompagné du code  VÂ
19VVF Deux approches - (.nom)
Il doit associer le lemme du mot trouvé dans la
contrainte,ainsi que les informations
flexionnelles, Ã la combinaison (Variable
1)ar(Variable 2)
20VVF Deux approches - (.nom)
Il doit également lui associer une information
 source .
21VVF Deux approches - (.nom)
Cette information  source , (inclus dans le
fichier properties.def ) apparaît alors dans
le vocabulaire, etpermet de repérer la source
dune analyse donnée. Ce qui permet de vérifier
lefficacité du grammaire.
22VVF Deux approches
Transcriptions  fautives .nom -
accents mére vs. mère consonnes raccomode
r vs. raccommoder voyelles supprimées décidra
vs. décideraSubstitution / inversion de sons.
.nom - il counnaît vs. il connaît -
consarver vs. conserver - erssouder vs.
ressouder Terminaison  -ont ,  -iont .nom /
.nod ils parlont ils parlent Régularisation
de la racine .nod ils devenont ils deviennent
23VVF Deux approches - résultats
- Corpus base Acad.dic ont.nom les deux
- Chiac 4,841 5,261 4,858 5,273
- 1,108 994 1,092 982
- Maillet 25,750 25,980 25,988 26,177
- 2,189 2,099 2,019 1,960
- Malenfant 3,108 3,633 3,145 3,650
- 516 418 496 401
- NE 4,849 4,980 4,878 5,004
- 250 218 225 197
- Parkton 10,380 11,125 10,488 11,125
- 1,394 1,212 1,310 1,212
24VVF Deux approches - résultats
- Corpus base les deux autres delta
- Chiac 4,841 5,273 5,477 636
- 1,108 982 916 - 192
- Maillet 25,750 26,177 26,648 898
- 2,189 1,960 1,717 - 472
- Malenfant 3,108 3,650 3,697 589
- 516 401 387 - 129
- NE 4,849 5,004 5,041 192
- 250 197 190 - 60
- Parkton 10,380 11,125 11,307 927
- 1,394 1,212 1,105 - 289
25VVF Deux approches - résultats
- Corpus base les deux autres delta
- Chiac 4,841 5,273 5,477 636
- 1,108 982 916 - 192
- Maillet 25,750 26,177 26,648 898
- 2,189 1,960 1,717 - 472
- Malenfant 3,108 3,650 3,697 589
- 516 401 387 - 129
- NE 4,849 5,004 5,041 192
- 250 197 190 - 60
- Parkton 10,380 11,125 11,307 927
- 1,394 1,212 1,105 - 289
Tenir compte de la réduction en termes inconnu,
plus que laugmentation de termes connus (double
analyses)
26VVF du nouveau
Grammaire syntaxique qui comprend des éléments
orthographique qui permet de trouver des mots
inconnus, qui terminent par  is / it / i , et
qui sont précédés de ltPROgt
27VVF du nouveau
28VVF Deux approches - Intérrogation
- Inclusion du standard et des variants en un
dictionnaire permettra une ressource à base
large minimisera les analyses fausses-
implique redondance de paradigmes flexionnelles
- travail de longue haleine - Inclusion des variants en .nom identification
rapide de formes - multiplication de ressources
- introduction danalyses fausses - Autres possibilités- maintien du DELAF et ajout
de  filtre Acad.dic- hiérarchie de  .nomÂ
embriqués
29Conclusion
- Létude effectuée jusquà présent commence Ã
permettre de repérer les verbes  non standardsÂ
en français acadien, avec des résultats
encourageants. Le travail révèle que certains
éléments pourraient améliorer et/ou rendre plus
efficace le processus, dont - Inclure un élément journalistique dans le
corpus- pour étendre la base- pour voir un
français acadien dit un peu plus neutre - Souligner limportance d une transcription
conséquente - Trancher sur la question du dédoublement
(dictionnaires ou morphologie?)
308e Journées INTEX / NooJ
- La flexion des verbes acadiens en NooJ
- Michael LONGUniv. De Moncton, CanadaUniv. du
Nouveau-Brunswick, Canada - avec un soutien du Gouvernement du CanadaConseil
de Recherche en Sciences Humaines