8e Journes INTEX NooJ - PowerPoint PPT Presentation

1 / 30
About This Presentation
Title:

8e Journes INTEX NooJ

Description:

BW (aie/S 1 s ... aient/S 3 p) VVF Deux approches - (Flexion) ... BW (aie/S 1 s ... aient/S 3 p ayiont/S 3 p acad) Avantage : Consolidation de la ... – PowerPoint PPT presentation

Number of Views:76
Avg rating:3.0/5.0
Slides: 31
Provided by: mike1155
Category:
Tags: intex | nooj | aie | journes

less

Transcript and Presenter's Notes

Title: 8e Journes INTEX NooJ


1
8e Journées INTEX / NooJ
  • La flexion des verbes acadiens en NooJ
  • Michael LONGUniv. De Moncton, CanadaUniv. du
    Nouveau-Brunswick, Canada
  • avec un soutien du Gouvernement du CanadaConseil
    de Recherche en Sciences Humaines

2
Verbes acadiens
  • Introduction - Le français acadien contexte et
    influences
  • Trois Groupes - VFS VANG VVF
  • VVF - Les défis
  • VVF - 2 approches pour lidentification-
    description flexionnelle - grammaires
    morphologiques
  • VVF - du nouveau
  • Conclusion

3
IntroductionContexte et influences
  • Le français acadien
  • Langue parlé par le peuple acadien
  • La nature du  territoire  acadien
  • Selon la région contexte de contacte
    étroit avec langlais peu de contact avec
    langlais
  • Influences
  • le français standard
  • langlais

4
IntroductionCorpus
  • Chiac Kasparian (1,988 ko 317,662 mots)
  • Maillet (9,522 ko 188,191 mots)
  • Malenfant (1,550 ko 20,777 mots)
  • Nord-Est (2,806 ko 54,671 mots)
  • Parkton (8.335 ko 192,293 mots)

773,594 mots
  • Corpus oraux 2 de plus, dont une région avec
    peu de contacte avec langlais.
  • Corpus lit. Riche en vieux formes étend la
    couverture par rapport aux régions.

5
Trois Groupes VFS VANG VVF
VFS - DELAF VENG -  pis il dit, you know
mémére, you need a boy  Contexte anglais
pas tellement traîtés encore VANG -  ils
allont runner out de prêtres   que mes
enfants turnont out de même  - Contexte de
phrase français - VANG conjuguer en français
- description de lan dernier tient
6
VANG trois graphes suffisent
Worker?Work
Giver?Give
Setter?Set
7
Trois Groupes VFS VANG VVF
VVF -  on a arrangé le bas pour que sa saye
chaud  que ce soit  cest souvent
quils veniont toute la famille  quils
viennent  Le prêtre se gréyait dans ses pus
belles hardes  shabillait
8
VVF Les défis
  • Terminaison  -ont ,  -iont  ils parlont
    ils parlent P ils parliont ils parlaient
    I ils parliont quils parlent S
  • Régularisation de la racine ils devenont ils
    deviennent P ils deveniont ils devenaient
    I quils deveniont quils deviennent S
  • Emplois variés du passé simple à loral  
    fallit espérer après que le petit seyit au
    monde.   il a fallu / fallait attendre que le
    petit soit au monde. 

9
VVF Les défis
  • Transcriptions  fautives  - accents mére
    vs. mère - consonnes raccomoder vs.
    raccommoder - voyelles supprimées décidra vs.
    décidera - pour souligner la prononciation? -
    forme voulu? - manque de cohérence dans la
    transcription?
  • Substitution / inversion de sons. - il counnaît
    vs. il connaît - consarver vs. conserver -
    erssouder vs. ressouder

10
VVF Deux approches - (Flexion)
Avoir ltEgt/W ltBWgt (ai/P1s ont/P3p)
ltB3gt (ais/I12s aient/I3p) ltBWgt
aur(ais/C1s aient/C3p) ltBWgt
arr(aient/C3pacad iont/C3pacad) ltBWgt
(aie/S1s aient/S3p)
11
VVF Deux approches - (Flexion)
Avoir ltEgt/W ltBWgt (ai/P1s ont/P3p
avont/P3pacad) ltB3gt (ais/I12s
aient/I3p iont/I3pacad) ltBWgt
aur(ais/C1s aient/C3p iont/C3pacad)
ltBWgt arr(aient/C3pacad iont/C3pacad)
ltBWgt (aie/S1s aient/S3p
ayiont/S3pacad)
  • Avantage Consolidation de la description
  • Contrainte Description limitée à Avoir(pas un
    problème puisque nul autre verbe ne se conjugue
    selon cette description)

12
VVF Deux approches - (Flexion)
Tenir ltEgt/W ltBWgt tiendre/Wacad
tchendre/Wacad ltB4gt iens/P1s
enons/P1p ltBWgt tchens/P1sacad
tchenons/P1pacad ltB4gt ienne/S1s
enions/S1p ltBWgt tchenne/S1sacad
tchenions/S1pacad
13
VVF Deux approches - (Flexion)
Tenir ltEgt/W ltBWgt tiendre/Wacad
tchendre/Wacad ltB4gt iens/P1s
enons/P1p ltBWgt tchens/P1sacad
tchenons/P1pacad ltB4gt ienne/S1s
enions/S1p ltBWgt tchenne/S1sacad
tchenions/S1pacad
3 formes infinitifs
14
VVF Deux approches - (Flexion)
Tenir ltEgt/W ltBWgt tiendre/Wacad
tchendre/Wacad ltB4gt iens/P1s
enons/P1p ltBWgt tchens/P1sacad
tchenons/P1pacad ltB4gt ienne/S1s
enions/S1p ltBWgt tchenne/S1sacad
tchenions/S1pacad
formes multiples pour P
15
VVF Deux approches - (Flexion)
Tenir ltEgt/W ltBWgt tiendre/Wacad
tchendre/Wacad ltB4gt iens/P1s
enons/P1p ltBWgt tchens/P1sacad
tchenons/P1pacad ltB4gt ienne/S1s
enions/S1p ltBWgt tchenne/S1sacad
tchenions/S1pacad
formes multiples pour S
16
VVF Deux approches - (Flexion)
Tenir ltEgt/W ltBWgt tiendre/Wacad
tchendre/Wacad ltB4gt iens/P1s
enons/P1p ltBWgt tchens/P1sacad
tchenons/P1pacad ltB4gt ienne/S1s
enions/S1p ltBWgt tchenne/S1sacad
tchenions/S1pacad
  • Problème Description fautive pour Venir qui se
    conjugue comme Tenir en français standard.
    Besoin donc de multiplier les conjugaisons
     modèles 

17
VVF Deux approches - (.nom)
On demande à NooJ de trouver la combinaison
(Variable 1)ar(Variable 2)
18
VVF Deux approches - (.nom)
On lui met une contrainte, disant que sil trouve
 ér  ou  er  entre les même deux variables,
et que ce mot est accompagné du code  V 
19
VVF Deux approches - (.nom)
Il doit associer le lemme du mot trouvé dans la
contrainte,ainsi que les informations
flexionnelles, à la combinaison (Variable
1)ar(Variable 2)
20
VVF Deux approches - (.nom)
Il doit également lui associer une information
 source .
21
VVF Deux approches - (.nom)
Cette information  source , (inclus dans le
fichier properties.def ) apparaît alors dans
le vocabulaire, etpermet de repérer la source
dune analyse donnée. Ce qui permet de vérifier
lefficacité du grammaire.
22
VVF Deux approches
Transcriptions  fautives  .nom -
accents mére vs. mère consonnes raccomode
r vs. raccommoder voyelles supprimées décidra
vs. décideraSubstitution / inversion de sons.
.nom - il counnaît vs. il connaît -
consarver vs. conserver - erssouder vs.
ressouder Terminaison  -ont ,  -iont  .nom /
.nod ils parlont ils parlent Régularisation
de la racine .nod ils devenont ils deviennent
23
VVF Deux approches - résultats
  • Corpus base Acad.dic ont.nom les deux
  • Chiac 4,841 5,261 4,858 5,273
  • 1,108 994 1,092 982
  • Maillet 25,750 25,980 25,988 26,177
  • 2,189 2,099 2,019 1,960
  • Malenfant 3,108 3,633 3,145 3,650
  • 516 418 496 401
  • NE 4,849 4,980 4,878 5,004
  • 250 218 225 197
  • Parkton 10,380 11,125 10,488 11,125
  • 1,394 1,212 1,310 1,212

24
VVF Deux approches - résultats
  • Corpus base les deux autres delta
  • Chiac 4,841 5,273 5,477 636
  • 1,108 982 916 - 192
  • Maillet 25,750 26,177 26,648 898
  • 2,189 1,960 1,717 - 472
  • Malenfant 3,108 3,650 3,697 589
  • 516 401 387 - 129
  • NE 4,849 5,004 5,041 192
  • 250 197 190 - 60
  • Parkton 10,380 11,125 11,307 927
  • 1,394 1,212 1,105 - 289

25
VVF Deux approches - résultats
  • Corpus base les deux autres delta
  • Chiac 4,841 5,273 5,477 636
  • 1,108 982 916 - 192
  • Maillet 25,750 26,177 26,648 898
  • 2,189 1,960 1,717 - 472
  • Malenfant 3,108 3,650 3,697 589
  • 516 401 387 - 129
  • NE 4,849 5,004 5,041 192
  • 250 197 190 - 60
  • Parkton 10,380 11,125 11,307 927
  • 1,394 1,212 1,105 - 289

Tenir compte de la réduction en termes inconnu,
plus que laugmentation de termes connus (double
analyses)
26
VVF du nouveau
Grammaire syntaxique qui comprend des éléments
orthographique qui permet de trouver des mots
inconnus, qui terminent par  is / it / i , et
qui sont précédés de ltPROgt
27
VVF du nouveau
28
VVF Deux approches - Intérrogation
  • Inclusion du standard et des variants en un
    dictionnaire permettra une ressource à base
    large minimisera les analyses fausses-
    implique redondance de paradigmes flexionnelles
    - travail de longue haleine
  • Inclusion des variants en .nom identification
    rapide de formes - multiplication de ressources
    - introduction danalyses fausses
  • Autres possibilités- maintien du DELAF et ajout
    de  filtre  Acad.dic- hiérarchie de  .nom 
    embriqués

29
Conclusion
  • Létude effectuée jusquà présent commence à
    permettre de repérer les verbes  non standards 
    en français acadien, avec des résultats
    encourageants. Le travail révèle que certains
    éléments pourraient améliorer et/ou rendre plus
    efficace le processus, dont
  • Inclure un élément journalistique dans le
    corpus- pour étendre la base- pour voir un
    français acadien dit un peu plus neutre
  • Souligner limportance d une transcription
    conséquente
  • Trancher sur la question du dédoublement
    (dictionnaires ou morphologie?)

30
8e Journées INTEX / NooJ
  • La flexion des verbes acadiens en NooJ
  • Michael LONGUniv. De Moncton, CanadaUniv. du
    Nouveau-Brunswick, Canada
  • avec un soutien du Gouvernement du CanadaConseil
    de Recherche en Sciences Humaines
Write a Comment
User Comments (0)
About PowerShow.com