Title: Traduccin Automtica'
1Traducción Automática.
- Igor Boguslavsky
- Universidad Politécnica de Madrid,
- Academia de Ciencias de Rusia
2Plan
- Procesamiento de Lenguaje Natural.
- TA Por qué es importante?
- Estado actual
- Por qué es difícil?
- Estrategias de TA
- Sistema ETAP
3Para que sirve el procesamiento automático de
lenguaje natural?
- Ayuda en preparación de textos
- Recuperación de información
- Extracción de información
- Respuesta a las preguntas
- Interfaces en lenguaje natural
- Procesamiento de voz
- Generación de texto
- Traducción automática
4TA Por qué es importante?
- Aspecto social y político
- Aspecto comercial
- Aspecto científico
- Aspecto filosófico
5TA Por qué es importante?
- Aspecto social y político
- Aspecto comercial
- Aspecto científico
- Aspecto filosófico
6TA Por qué es importante?
- Aspecto social y político
- Aspecto comercial
- Aspecto científico
- Aspecto filosófico
7TA Por qué es importante?
- Aspecto social y político
- Aspecto científico
- Aspecto comercial
- Aspecto filosófico
8Conocimiento lingüístico vs. extralingüístico
- Nuestra sociedad gradualmente envejece. Mujeres
y hombres de edad madura componen una mayoría de
la sociedad. - Niños y hombres de edad madura componen una
mayoría de la sociedad. - old women and men
- children and old men
9Conocimiento lingüístico vs. extralingüístico
- protones y electrones cargados negativamente
- protons and negatively charged electrons
- negatively charged protons and electrons.
10Estado actual de TA
- Qué tenemos?
- Dos posiciones difundidas
- Traducción es una cosa muy fácil
- Traducción es una cosa muy difícil
- Para qué pueden servir los sistemas de hoy?
11TA o traducción humana?
- El ordenador va a reemplazar el traductor
humano? - Demasiado trabajo
- Traducción cruda
- División del trabajo
12El objetivo de los sistemas TA es interpretar el
sentido del texto por medio de otra lengua
- Sentido lingüístico vs. extralingüístico
- Heine Lermontov - Tjutchev
- Para el ordenador la cosa más difícil en la
comprensión del texto es - la ambigüedad
13La diversidad de las unidades significativas
- El sentido se expresa por unidades del lenguaje
de varios tipos - Palabras
- Elementos morfológicos
- mesa - mesas (una - algunas)
- estoy - estuve (ahora - antes)
- Vínculos sintácticos
- El cazador mató al oso - El oso mató al cazador
- Entonación
14Ambigüedad léxica
- Grado
- Hasta cierto grado
- Alumno de primer grado
- 20 grados bajo cero
- Grado militar
- Grados de comparación
-
15Ambigüedad morfológica
- En contextos distintos
- cas-a sustantivo
- negr-a singular, femenino
- am-a 3 persona, presente, indicativo
- En el mismo contexto
- quier-a 1 o 3 persona, presente, subjuntivo
- habl-a sustantivo o verbo?
- habl-amos presente o pasado?
16Ambigüedad sintáctica
- 1. Palabras distintas conectadas.
- Mi amigo prometió que vendría después de la
clase. - Se prohíbe ser infiel a la mujer
-
17Ambigüedad sintáctica
Se prohíbe ser infiel
a la mujer
la mujer no debe ser infiel (a su marido)
Se prohíbe ser infiel a
la mujer
(el marido) no debe ser infiel a su mujer
18Ambigüedad sintáctica
- 2. Palabras vs. grupos conectados
- música y literatura medieval
- Nadie compra ese producto durante más de un año
- no (compra durante más de un año)
- Nadie ha comprado ese producto durante más de un
año - (no ha comprado) durante más de un año
19Ambigüedad pragmática
- Ponga su maletín aquí, por favor.
20Ambigüedad
- Cuántas interpretaciones tiene esta oración?
- La creciente necesidad del uso de Internet para
la diseminación cultural, la educación y la
expansión comercial se enfrenta en la actualidad
con un obstáculo que frena el potencial de la Red
de Redes y que no es otro que la barrera de la
diversidad lingüística.
2167 184 640!
22Ambigüedad ambigüedad léxica ambigüedad
sintáctica
- Ambigüedad léxica
- Necesidad (3 sentidos)
- Uso (2 sentidos)
- Cultura (3 sentidos)
- Educación (2 sentidos)
- Comercial (2 sentidos)
- Enfrentar (2 sentidos)
23Ambigüedad léxica
- Actualidad (3 sentidos)
- Frenar (2 sentidos)
- Potencial (6 sentidos)
- Red (3 sentidos)
- Barrera (3 sentidos)
- Lingüística (3 sentidos)
24Ambigüedad léxica
3232223263333 419 904
25Ambigüedad sintáctica
- S de S de S (2 opciones)
- S S S para S V (4 opciones)
- S S S S, S (4 opciones)
- S S S S S y S (5 opciones)
- 2445 160
- 419 904 160 67 184 640
26Estrategia Directo vs. Indirecto Transfer vs.
Interlingua
Texto de entrada
Texto de salida
Traducción directa
Transfer
Traducción indirecta
Interlingua
27Traducción directa
28Traducción directa
29Traducción directa
30Traducción directa
- Whats the time? Qué es el tiempo?
31Traducción directa
- Whats the time? Qué es el tiempo?
- Qué hora es?
32Traducción directa
- Whats the time? Qué es el tiempo?
- Qué hora es? What
33Traducción directa
- Whats the time? Qué es el tiempo?
- Qué hora es? What hour
34Traducción directa
- Whats the time? Qué es el tiempo?
- Qué hora es? What hour is?
35Transfer vs. interlingua Qué es mejor?
- Ventajas de la interlingua
- Buena correspondencia con la teoría
- Ámbito multilingüe
- Inconvenientes de la interlingua
- Mala correspondencia con la teoría
- No se puede hacer uso de las similitudes entre
las lenguas - Complejidad del análisis y de la síntesis.
- Difícil de proyectar.
36Transfer estructural
- La película me gusta
- I like the film.
- Juan usually goes to the cinema on Saturdays
- Juan suele ir al cine los sábados
- He walked across the road
- Cruzó la calle a pie
37Papeles del hombre y de la maquina
- TA pura
- Human-aided machine translation
- Pre-editing
- Post-editing
- Inter-editing (desambiguación interactiva)
38Demostración de ETAP
- Traducción
- He did not want to answer the question I was
interested in - Interactividad
- We made a general remark that everything was OK
39Niveles básicos de representación
- Texto
- Estructura morfológica
- Estructura sintáctica
- Estructura sintáctica normalizada (? profunda)
40Estructura morfológica
- Texto
- estuvieron
- Estructura morfológica
- ESTAR, pret-indef, plur, 3-p
41Dos tipos de estructuras sintácticas
- Estructuras de constituyentes
- muestran cómo la oración y sus partes se dividen
en partes - Estructuras de dependencias
- muestran cómo las palabras se conectan entre sí
42Estructura de constituyentes
S
VP
NP
VP
NP
VP
PP
Juan ha mandado un
correo a Carolina
43Estructura de dependencias
Juan ha mandado un
correo a Carolina
44Estructura sintáctica normalizada
MANDAR,past,perf
1
3
2
JUAN
CORREO, def,sg
CAROLINA
45El sistema ETAP
- Procesador lingüístico multifuncional
- TA (ruso-inglés, francés, alemán, coreano,
español, inglés-árabe) - UNL
- Paráfrasis (generación de sinonimia)
- Sistema de anotación sintáctica de textos
- Verificador de gramática
46TA arquitecturas Transfer vs. Interlingua
Texto de entrada
Texto de salida
MorphS
MorphS
SyntS
SyntS
NormS
NormS
Transfer
Interlingua