Traduccin Automtica' - PowerPoint PPT Presentation

1 / 46
About This Presentation
Title:

Traduccin Automtica'

Description:

Mujeres y hombres de edad madura componen una mayor a de la sociedad. ... protons and negatively charged electrons *negatively charged protons and electrons. ... – PowerPoint PPT presentation

Number of Views:44
Avg rating:3.0/5.0
Slides: 47
Provided by: igorbogu
Category:

less

Transcript and Presenter's Notes

Title: Traduccin Automtica'


1
Traducción Automática.
  • Igor Boguslavsky
  • Universidad Politécnica de Madrid,
  • Academia de Ciencias de Rusia

2
Plan
  • Procesamiento de Lenguaje Natural.
  • TA Por qué es importante?
  • Estado actual
  • Por qué es difícil?
  • Estrategias de TA
  • Sistema ETAP

3
Para que sirve el procesamiento automático de
lenguaje natural?
  • Ayuda en preparación de textos
  • Recuperación de información
  • Extracción de información
  • Respuesta a las preguntas
  • Interfaces en lenguaje natural
  • Procesamiento de voz
  • Generación de texto
  • Traducción automática

4
TA Por qué es importante?
  • Aspecto social y político
  • Aspecto comercial
  • Aspecto científico
  • Aspecto filosófico

5
TA Por qué es importante?
  • Aspecto social y político
  • Aspecto comercial
  • Aspecto científico
  • Aspecto filosófico

6
TA Por qué es importante?
  • Aspecto social y político
  • Aspecto comercial
  • Aspecto científico
  • Aspecto filosófico

7
TA Por qué es importante?
  • Aspecto social y político
  • Aspecto científico
  • Aspecto comercial
  • Aspecto filosófico

8
Conocimiento lingüístico vs. extralingüístico
  • Nuestra sociedad gradualmente envejece. Mujeres
    y hombres de edad madura componen una mayoría de
    la sociedad.
  • Niños y hombres de edad madura componen una
    mayoría de la sociedad.
  • old women and men
  • children and old men

9
Conocimiento lingüístico vs. extralingüístico
  • protones y electrones cargados negativamente
  • protons and negatively charged electrons
  • negatively charged protons and electrons.

10
Estado actual de TA
  • Qué tenemos?
  • Dos posiciones difundidas
  • Traducción es una cosa muy fácil
  • Traducción es una cosa muy difícil
  • Para qué pueden servir los sistemas de hoy?

11
TA o traducción humana?
  • El ordenador va a reemplazar el traductor
    humano?
  • Demasiado trabajo
  • Traducción cruda
  • División del trabajo

12
El objetivo de los sistemas TA es interpretar el
sentido del texto por medio de otra lengua
  • Sentido lingüístico vs. extralingüístico
  • Heine Lermontov - Tjutchev
  • Para el ordenador la cosa más difícil en la
    comprensión del texto es
  • la ambigüedad

13
La diversidad de las unidades significativas
  • El sentido se expresa por unidades del lenguaje
    de varios tipos
  • Palabras
  • Elementos morfológicos
  • mesa - mesas (una - algunas)
  • estoy - estuve (ahora - antes)
  • Vínculos sintácticos
  • El cazador mató al oso - El oso mató al cazador
  • Entonación

14
Ambigüedad léxica
  • Grado
  • Hasta cierto grado
  • Alumno de primer grado
  • 20 grados bajo cero
  • Grado militar
  • Grados de comparación

15
Ambigüedad morfológica
  • En contextos distintos
  • cas-a sustantivo
  • negr-a singular, femenino
  • am-a 3 persona, presente, indicativo
  • En el mismo contexto
  • quier-a 1 o 3 persona, presente, subjuntivo
  • habl-a sustantivo o verbo?
  • habl-amos presente o pasado?

16
Ambigüedad sintáctica
  • 1. Palabras distintas conectadas.
  • Mi amigo prometió que vendría después de la
    clase.
  • Se prohíbe ser infiel a la mujer

17
Ambigüedad sintáctica
Se prohíbe ser infiel
a la mujer
la mujer no debe ser infiel (a su marido)
Se prohíbe ser infiel a
la mujer
(el marido) no debe ser infiel a su mujer
18
Ambigüedad sintáctica
  • 2. Palabras vs. grupos conectados
  • música y literatura medieval
  • Nadie compra ese producto durante más de un año
  • no (compra durante más de un año)
  • Nadie ha comprado ese producto durante más de un
    año
  • (no ha comprado) durante más de un año

19
Ambigüedad pragmática
  • Ponga su maletín aquí, por favor.

20
Ambigüedad
  • Cuántas interpretaciones tiene esta oración?
  • La creciente necesidad del uso de Internet para
    la diseminación cultural, la educación y la
    expansión comercial se enfrenta en la actualidad
    con un obstáculo que frena el potencial de la Red
    de Redes y que no es otro que la barrera de la
    diversidad lingüística.

21
67 184 640!
22
Ambigüedad ambigüedad léxica ambigüedad
sintáctica
  • Ambigüedad léxica
  • Necesidad (3 sentidos)
  • Uso (2 sentidos)
  • Cultura (3 sentidos)
  • Educación (2 sentidos)
  • Comercial (2 sentidos)
  • Enfrentar (2 sentidos)

23
Ambigüedad léxica
  • Actualidad (3 sentidos)
  • Frenar (2 sentidos)
  • Potencial (6 sentidos)
  • Red (3 sentidos)
  • Barrera (3 sentidos)
  • Lingüística (3 sentidos)

24
Ambigüedad léxica
3232223263333 419 904
25
Ambigüedad sintáctica
  • S de S de S (2 opciones)
  • S S S para S V (4 opciones)
  • S S S S, S (4 opciones)
  • S S S S S y S (5 opciones)
  • 2445 160
  • 419 904 160 67 184 640

26
Estrategia Directo vs. Indirecto Transfer vs.
Interlingua
Texto de entrada
Texto de salida
Traducción directa
Transfer
Traducción indirecta
Interlingua
27
Traducción directa
  • Whats the time?

28
Traducción directa
  • Whats the time? Qué

29
Traducción directa
  • Whats the time? Qué es

30
Traducción directa
  • Whats the time? Qué es el tiempo?

31
Traducción directa
  • Whats the time? Qué es el tiempo?
  • Qué hora es?

32
Traducción directa
  • Whats the time? Qué es el tiempo?
  • Qué hora es? What

33
Traducción directa
  • Whats the time? Qué es el tiempo?
  • Qué hora es? What hour

34
Traducción directa
  • Whats the time? Qué es el tiempo?
  • Qué hora es? What hour is?

35
Transfer vs. interlingua Qué es mejor?
  • Ventajas de la interlingua
  • Buena correspondencia con la teoría
  • Ámbito multilingüe
  • Inconvenientes de la interlingua
  • Mala correspondencia con la teoría
  • No se puede hacer uso de las similitudes entre
    las lenguas
  • Complejidad del análisis y de la síntesis.
  • Difícil de proyectar.

36
Transfer estructural
  • La película me gusta
  • I like the film.
  • Juan usually goes to the cinema on Saturdays
  • Juan suele ir al cine los sábados
  • He walked across the road
  • Cruzó la calle a pie

37
Papeles del hombre y de la maquina
  • TA pura
  • Human-aided machine translation
  • Pre-editing
  • Post-editing
  • Inter-editing (desambiguación interactiva)

38
Demostración de ETAP
  • Traducción
  • He did not want to answer the question I was
    interested in
  • Interactividad
  • We made a general remark that everything was OK

39
Niveles básicos de representación
  • Texto
  • Estructura morfológica
  • Estructura sintáctica
  • Estructura sintáctica normalizada (? profunda)

40
Estructura morfológica
  • Texto
  • estuvieron
  • Estructura morfológica
  • ESTAR, pret-indef, plur, 3-p

41
Dos tipos de estructuras sintácticas
  • Estructuras de constituyentes
  • muestran cómo la oración y sus partes se dividen
    en partes
  • Estructuras de dependencias
  • muestran cómo las palabras se conectan entre sí

42
Estructura de constituyentes
S
VP
NP
VP
NP
VP
PP
Juan ha mandado un
correo a Carolina
43
Estructura de dependencias
Juan ha mandado un
correo a Carolina
44
Estructura sintáctica normalizada
MANDAR,past,perf
1
3
2
JUAN
CORREO, def,sg
CAROLINA
45
El sistema ETAP
  • Procesador lingüístico multifuncional
  • TA (ruso-inglés, francés, alemán, coreano,
    español, inglés-árabe)
  • UNL
  • Paráfrasis (generación de sinonimia)
  • Sistema de anotación sintáctica de textos
  • Verificador de gramática

46
TA arquitecturas Transfer vs. Interlingua
Texto de entrada
Texto de salida
MorphS
MorphS
SyntS
SyntS
NormS
NormS
Transfer
Interlingua
Write a Comment
User Comments (0)
About PowerShow.com