Traduction Automatique - PowerPoint PPT Presentation

1 / 22
About This Presentation
Title:

Traduction Automatique

Description:

L'esprit est fort, mais la chair est faible. 1. Historique. Page 5 ... Vocabulaire et morphosyntaxe. Constructions syntaxiques complexes. Rapidit vs pr cision ... – PowerPoint PPT presentation

Number of Views:409
Avg rating:3.0/5.0
Slides: 23
Provided by: thomasl157
Category:

less

Transcript and Presenter's Notes

Title: Traduction Automatique


1
Traduction Automatique
  • Approche critique des produits IdL
  • Cours 2 - Mardi 24 novembre 2009

2
Plan
  • Historique
  • Méthodes et écueils
  • Outils et logiciels
  • Evaluer la traduction automatique (TA)

3
Historique rapide
4
Historique TA-TAL (1)
1. Historique
  • Premier domaine de recherche en TAL
  •  Et jai crié, crié-é Staline ! 
  • 50s traduction Ru -gt En
  • Traduire un simple décryptage
  • Et pfuit !
  • Rapport ALPAC, 1966
  • Lesprit est fort, mais la chair est faible

5
Historique TA-TAL (2)
1. Historique
  • TA de 1ère génération
  • Fin 60s outils de très faible portée
  • TA de 2ème génération
  • Fin 70s  De quoi ça parle 
  • Analyse -gt Transfert -gt Génération
  •  Langage pivot 
  • Exemple METEO (Montréal 1977)

6
Historique TA-TAL (3)
1. Historique
  • Fin 80s Et si on réutilisait ?
  • Stocks importants de phrases pré-traduites
  • Comparaison avec lexistant
  • Pas de TAL, pas de réflexion linguistique
  • 90s Repartir de la linguistique ?
  • Alignement de corpus
  • Des vrais modèles de langue

7
Historique TA-TAL (4)
1. Historique
  • Maintenant Langages contrôlés
  • Ecrire le texte en fonction de la machine
  • Générer un texte  contrôlé  en plusieurs
    langues
  • METEO
  • Dépêches de la Bourse
  • Domaine aéronautique

8
2. Méthodes et écueils
9
TA ou TAO ?
2. Méthodes et écueils
  • TA Traduction automatique
  • Traduire entièrement un texte sans intervention
    de lhumain
  • TAO Traduction assistée par ordinateur
  • Lhumain traduit, avec laide du support
    informatique

10
Ecueils
2. Méthodes et écueils
  • Ecueils linguistiques propres à la langue
    naturelle
  • Ambiguïtés
  • Lexicales
  • Syntaxiques
  • Sémantique
  • Nécessité du contexte ! Mais comment le
    représenter informatiquement ?

11
Méthodes
2. Méthodes et écueils
  • Mot-à-mot arrangement de surface
  • Syntagmes arrangement de surface
  • Dictionnaire (ou base de données)
  • Régles (grammaticales et stylistiques)
  • Alignement de corpus
  • Meilleure prise en compte du contexte
  • Réalisations linguistiques  attestées 

12
3. Outils et logiciels
13
En traduction automatique
3. Outils logiciels
  •  Traduire nimporte quel texte source en un
    texte cible dans une langue différente 
  • Logiciels payants
  • Systran, Power Translator, Reverso
  • Logiciels libres
  • GPLTrans, Apertium
  • Logiciels en ligne
  • Les logiciels associés aux moteurs de recherche,
    Systran, Reverso, Apertium

14
En assistance à la traduction
3. Outils logiciels
  •  Logiciels informatiques pour aide à la
    traduction par lhumain 
  •  Mémoire  de traduction
  • Observation et mémorisation de récurrences
  • Cohérence terminologique et stylistique
  • Dictionnaires
  • Bilingue (Collins) Multilingue (Portail
    Lexilogos)
  • Vérificateurs orthographe grammaire
  • Alignement de corpus

15
4. Evaluer la TA
16
Protocole classique
4. Evaluer la TA
  • Quelques campagnes dévaluation existantes
  • OpenMT (Open Machine Translation, NIST)
  • CESTA (Technolangue)
  • Tâche à accomplir traduction dun texte dune
    langue source vers une langue cible
  • Protocole on donne un texte au système, on
    compare le résultat (texte candidat) à une
    traduction faite par lhumain (texte référent),
    et on attribue une note
  • Ressources
  • Textes en langue source
  • Traduction référence pour chaque texte

17
Protocole classique (2)
4. Evaluer la TA
  • Type dévaluation
  • Evaluation subjective
  • Juge humain
  • Métriques  subjectives  fluidité, adéquation
  • Evaluation objective
  • Fondée sur la référence
  • Métriques chiffrées

18
Métriques
4. Evaluer la TA
  • Subjectives
  • Adéquation et fluidité notées sur une échelle de
    1 à 5
  • Limites
  • Objectives
  • WER distance de Levenshtein (1966) normalisée
  • BLEU
  • Calcul de distance/similarité ( espace vectoriel)
  • Limites

19
Protocole classique Limites
4. Evaluer la TA
  • Quelle tâche de fond ?
  • Diffuser une information précise ?
  • Compréhension suffisante ?
  • Adéquation entre tâche et résultats ?
  • Exemple Reverso et les chercheurs / les
    traducteurs
  • Limites
  • Pas de prise en compte du contexte dutilisation

20
Evaluer laspect linguistique
4. Evaluer la TA
  • Vocabulaire et morphosyntaxe
  • Constructions syntaxiques complexes
  • Rapidité vs précision
  • Global vs local
  • Traitement des  styles 

21
Prendre en compte lergonomie
4. Evaluer la TA
  • Prise en compte de lutilisateur
  • Fenêtres, intitulés, actions possibles, barre de
    progression des tâches
  • Données en entrée
  • Données en sortie
  • Intégration/non à des logiciels
  • Ajout de règles, de termes, et dans quelle mesure
  • Existence de plug-in, dautres dictionnaires

22
(No Transcript)
Write a Comment
User Comments (0)
About PowerShow.com