Semantica approcci computazionali - PowerPoint PPT Presentation

1 / 23
About This Presentation
Title:

Semantica approcci computazionali

Description:

Title: PowerPoint Presentation Last modified by: Maria Teresa Pazienza Created Date: 1/1/1601 12:00:00 AM Document presentation format: Presentazione su schermo – PowerPoint PPT presentation

Number of Views:49
Avg rating:3.0/5.0
Slides: 24
Provided by: uniroma2It
Category:

less

Transcript and Presenter's Notes

Title: Semantica approcci computazionali


1
Semanticaapprocci computazionali
  • Maria Teresa PAZIENZA
  • a.a. 2005-06

2
Analisi semantica robusta
  • Le grammatiche tradizionali generalmente non
    riflettono i contenuti semantici in maniera
    diretta ed esplicita le strutture sintattiche
    prodotte spesso non sono utili per effettuare
    lanalisi semantica utilizzando il principio
    della composizionalità infatti
  • elementi con un ruolo semantico chiave sono
    spesso distribuiti allinterno dellalbero
    sintattico rendendo molto complessa la
    composizionalità
  • gli alberi sintattici contengono molti
    costituenti sintattici che non hanno alcun ruolo
    nellelaborazione semantica
  • la generalità informativa di molti costituenti
    sintattici produce attchment semantici che
    possono creare rappresentazioni semantiche prive
    o quasi di significato

3
Analisi semantica robusta
  • Per risolvere questo problema si può agire in
    modi diversi per migliorare lefficienza delle
    operazioni
  • estendendo il ruolo delle grammatiche (con
    lintroduzione delle espressioni lambda e dei
    termini complessi,)
  • riscrivendo la grammatica per riflettere la
    semantica

4
Esempio-distribuzione di elementi con
significato allinterno dellalbero-molti nodi
non rilevanti per il significato della frase
5
Esempio -costituenti sintattici ad un giusto
livello di generalità per la sintassi, ma troppo
vaghi semanticamente
  • Si consideri la regola per il termine complesso
    (some) Italian food
  • Nominal-gtAdj Nominal
  • ?x Nominal.sem(x)AM(x,Adj.sem)
  • lapplicazione di un tale attachment produce
    questa rappresentazione
  • ?x Isa(x,Food)?AM(x,Italian)
  • che non sta ad indicare
  • cibo preparato in un modo particolare e speciale

6
Grammatiche semantiche
  • Le grammatiche semantiche (sviluppate per
    lanalisi del dialogo in sistemi di Q/A con un
    vocabolario ristretto e complessità grammaticale
    limitata) vanno nella direzione di supportare
    lanalisi composizionale (regole CFG con un set
    di terminali).
  • Le regole (scritte per soddisfare le necessità
    della semantica piuttosto che della sintassi) ed
    i costituenti della grammatica corrispondono
    esattamente alle entità ed alle relazioni del
    dominio analizzato
  • Il termine grammatica semantica si riferisce
    alla motivazione delle regole della grammatica
  • si generano esattamente le regole semantiche
    che servono
  • - è necessario sviluppare una nuova grammatica
    per ciascun nuovo dominio

7
Grammatiche semantiche Esempio
  • Si consideri una possibile regola per rispondere
    ad una richiesta di informazione del tipo
  • Request ? I want to go to eat FoodType TimeExpr
  • some attachment
  • Per Italian food potremmo usare la regola
  • FoodType -gt Nationality FoodType
  • che stabilisce che il tipo di cibo deve essere
    collegato alla caratteristica nazionale

8
Grammatiche semantiche
  • Regole difficilmente riusabili in contesti
    diversi
  • Possibile overgenerazione per esempio il termine
  • Canadian restaurant
  • non viene usato nella stessa accezione di Italian
    food, bensì nel senso di ristorante in Canada
  • La motivazione del significato è al di là delle
    parole, è nel dominio culturale dei cibi

9
Estrazione di informazione da testi IE
  • Nei sistemi per lestrazione di informazione da
    testi siamo interessati a riconoscere solo
    informazioni specifiche si richiede un approccio
    diverso
  • Tali sistemi devono gestire
  • Frasi reali (e quindi arbitrariamente lunghe e
    complesse)
  • Una semantica superficiale
  • Liste piatte di coppie attributo-valore
  • XML/SGML

10
Esempi
  • Analisi di articoli di quotidiani, notizie di
    agenzia per lidentificazione di uno specifico
    insieme di eventi di interesse
  • Analisi di siti web alla ricerca di prodotti,
    prezzi, etc
  • Questi testi hanno caratteristiche peculiari
  • Frasi lunghe, sintassi complessa (e talvolta
    incorretta) autori diversi,

11
Sistemi di IE
  • I sistemi di IE sono in genere basati su una
    cascata di automi per riconoscere fenomeni
    specifici e tralawsciare parti non rilevanti del
    testo anlizzato
  • Vengono riconosciuti elementi di
    sintassi/semantica isolati dal contesto e quindi
    usati in una fase successiva di processing fino
    ad ottenere il risultaqto finale
  • Il risultato finale dellelaborazione è un
    insieme di relazioni e valori che vengono
    successivamnete memorizzati in una base di dati

12
Esempio (MUC)
  • Bridgestone Sports Co. said Friday it has set up
    a joint venture in Taiwan with a local concern
    and a Japanese trading house to produce golf
    clubs to be shipped to Japan.
  • The joint venture, Bridgestone Sports Taiwan
    Co., capitalized at 20 million new Taiwan
    dollars, will start production in January 1990
    with production of 20,000 iron and metal wood
    clubs a month.

13
Esempio
  • Bridgestone Sports Co. said Friday it has set up
    a joint venture in Taiwan with a local concern
    and a Japanese trading house to produce golf
    clubs to be shipped to Japan.
  • The joint venture, Bridgestone Sports Taiwan
    Co., capitalized at 20 million new Taiwan
    dollars, will start production in January 1990
    with production of 20,000 iron and metal wood
    clubs a month.

14
Esempio
  • Bridgestone Sports Co. said Friday it has set up
    a joint venture in Taiwan with a local concern
    and a Japanese trading house to produce golf
    clubs to be shipped to Japan.
  • The joint venture, Bridgestone Sports Taiwan
    Co., capitalized at 20 million new Taiwan
    dollars, will start production in January 1990
    with production of 20,000 iron and metal wood
    clubs a month.

15
Esempio
  • Bridgestone Sports Co. said Friday it has set up
    a joint venture in Taiwan with a local concern
    and a Japanese trading house to produce golf
    clubs to be shipped to Japan.
  • The joint venture, Bridgestone Sports Taiwan
    Co., capitalized at 20 million new Taiwan
    dollars, will start production in January 1990
    with production of 20,000 iron and metal wood
    clubs a month.

16
FASTUS Output (Hobbs 1997)
17
Cascata di processi
18
Punti rilevanti
  • Il riconoscimento delle named entities di un
    testo permette di riconoscere nomi di persone,
    organizzazioni, luoghi, etc.
  • Le named entities vengono riconosciute in modo
    robusto con metodi riutilizzabili in applicazioni
    diverse

19
Punti rilevanti
  • E tutte le altre componenti del testo?
  • Possono essere ignorate!
  • Non servono per le successive fasi di processing
    e quindi non è necessario elaborarle

20
Punti rilevanti
  • Lapproccio metodologico dei sistemi di IE
    funziona in quanto ci si pone in un contesto
    applicativo limitato
  • Si ricerca solo un insieme limitato di item che
    può quindi apparire in un insieme limitato di
    regole

21
Esempio reale
  • The White House said President Bush has approved
    duty-free treatment for imports of certain types
    of watches that arent produced in significant
    quantities in the U.S., the Virgin Islands and
    other U.S. possessions.
  • WSJ Markup Example

22
Demo del sistema di IECROSSMARC
23
Riferimenti
  • La presentazione utilizza alcune informazioni
    esemplificative tratte dal libro
  • D.Jurafsky, J. H. Martin
  • Speech and Language Processing,
  • Prentice Hall, 2000, cap.14,15,16
Write a Comment
User Comments (0)
About PowerShow.com