Semantica - PowerPoint PPT Presentation

1 / 80
About This Presentation
Title:

Semantica

Description:

Title: Presentazione di PowerPoint Author: Legolas Last modified by: Maria Teresa Pazienza Created Date: 5/19/2003 1:26:55 PM Document presentation format – PowerPoint PPT presentation

Number of Views:70
Avg rating:3.0/5.0
Slides: 81
Provided by: Legolas
Category:

less

Transcript and Presenter's Notes

Title: Semantica


1
Semantica
  • Maria Teresa PAZIENZA
  • a.a. 2007-08

2

Programma
  • Breve introduzione allNLP
  • Linguaggi Naturali e Linguaggi Formali
  • Complessità
  • Morfologia
  • Teoria Morfologia del Linguaggio Naturale
  • Strumenti Automi e Trasduttori
  • Analisi Morfologica con automi e trasduttori
  • Part of Speech Tagging
  • Teoria Le classi morfologiche
  • Strumenti a Analisi modelli a regole e
    statistici
  • Sintassi
  • Teoria Sintassi del Linguaggio Naturale
  • Strumenti CFG
  • Analisi Sintattica parsing top-down, bottom-up,
    Early
  • Semantica
  • Introduzione
  • Distributional Lexical Semantics
  • Sentence Semantics

Info
3
NLP - Analisi semantica
  • Capire il significato di una frase è
    unoperazione necessaria per andare al di là
    della frase stessa, per inserire il suo
    significato allinterno di un contesto condiviso
    nella comunicazione, per ragionare e per poter
    rispondere a domande relative al dominio di
    conoscenza coinvolto dalla frase (o domanda)
    stessa.
  • Alcune attività che richiedono una analisi
    semantica
  • Porre domande / rispondere
  • Leggere un menù e decidere cosa ordinare
  • Leggere un manuale duso e capire cosa fa un
    software
  • ..
  • Ragionare su un task espresso linguisticamente

4
NLP - Analisi semantica
  • Capire il significato di una frase
  • Ragionare su un task espresso linguisticamente
    richiede lattivazione di processi cognitivi che
    accedano a qualche tipo di rappresentazione che
    colleghi gli elementi linguistici, coinvolti nel
    processo di comprensione, a componenti cognitive
    (quindi non linguistiche) necessarie alla loro
    realizzazione.

5
NLP - Analisi semantica
  • Lanalisi semantica è fondamentale in questa fase
    a supporto del ragionamento e si basa sulla
    rappresentazione formale del significato della
    frase.
  • Per capire il significato di una frase non è
    necessario aver realizzato completamente le
    fasi di analisi morfologica e sintattica della
    frase stessa si può utilizzare anche la
    rappresentazione della conoscenza di dominio

6
NLP - Analisi semantica
  • Capire il significato di una frase e
  • ragionare su
  • Necessario un approccio sistematico e formale per
    collegare la rappresentazione del significato
    della frase con tutti i fatti e gli eventi del
    mondo che esistono (ovvero sono rappresentati
    nella base di conoscenza relativa)
  • Un sistema potrà allora fare inferenza, ovvero
  • ragionare a partire dalla frase
  • fare deduzioni valide rispetto sia alla
    rappresentazione formale del significato della
    frase in ingresso sia alla conoscenza di base del
    sistema stesso.

7
NLP - Analisi semantica
  • La comprensione del significato di una
    espressione linguistica richiede conoscenza
    linguistica e non-linguistica (conoscenza del
    mondo e/ del dominio) tale significato è
    espresso da strutture formali (rappresentazione
    del significato della frase che supporta,
    facilitando lanalisi semantica)
  • La sintassi e la semantica di queste
    rappresentazioni saranno fornite da appositi
    linguaggi per la rappresentazione del
    significato.
  • Espressione linguistica -gt analisi semantica
  • -gt comprensione del significato -gt supporto al
    ragionamento

8
Rappresentazione del significato
  • La rappresentazione del significato può avvenire
    in linguaggi formali diversi (FOPC calcolo dei
    predicati, reti semantiche, diagrammi delle
    dipendenze concettuali, frames, etc),
  • che usano strutture di simboli per esprimere il
    significato della frase specifica (così come di
    un generico evento dello stesso tipo)

9
Rappresentazione del significato
  • Per capire il significato letterale di una frase
    (es. una domanda)
  • Identificare rappresentazioni legate al
    significato convenzionale delle parole senza
    considerare il contesto
  • Usare una rappresentazione per determinare la
    relazione tra il significato della frase ed il
    mondo a noi noto (BdC), quindi determinare il
    valore di verità della rappresentazione
  • Effettuare il matching tra la rappresentazione
    del significato in input e la base di conoscenza
    (verificabilità)
  • Gestire la vaghezza di una frase che rende
    difficile determinare cosa fare a fronte di una
    frase in input (es. io mangio cibi italiani).
    Vaghezza non è ambiguità!

10
Rappresentazione del significato
  • Capire il significato di una frase (es. una
    domanda) significa usare una rappresentazione
    formale per determinare la relazione esistente
    tra il significato della frase ed il mondo in
    cui tale frase ha senso.
  • Implementare un algoritmo di verifica matching
    tra la rappresentazione della specifica frase in
    ingresso e le rappresentazioni esistenti nella
    base di conoscenza di riferimento, che
    costituiscono la conoscenza del mondo

11
Rappresentazione del significato
  • A causa della ricchezza espressiva del linguaggio
    naturale, si possono avere più espressioni
    linguistiche (frasi diverse) che esprimono lo
    stesso fatto di conseguenza si avranno
    rappresentazioni formali diverse .
  • I Giapponesi amano la moda italiana
  • La moda italiana è amata dai Giapponesi
  • I Giapponesi impazziscono per la moda italiana
  • Si dice che i Giapponesi amino la moda italiana
  • E a tutti noto che i Giapponesi amino la moda
    italiana
  • ..

12
Rappresentazione del significato
  • Non sempre tutte le rappresentazioni formali
    coesistono in tal caso non tutte trovano il
    matching nella base di conoscenza (mondo di
    riferimento), si va incontro a situazioni di
    indeterminatezza e vaghezza dellinterpretazione
    del significato.
  • Una soluzione a tale problema assegnare a tutte
    le rappresentazioni lo stesso significato.
  • Forma canonica stessa rappresentazione associata
    ad espressioni linguistiche con uguale significato

13
Rappresentazione del significato
  • Non sempre si può rispondere ad una domanda, ad
    una richiesta di informazione con un approccio
    basato sul pattern matching in molti casi si
    deve ricorrere a fasi di concettualizzazione (un
    metalivello rispetto a quello linguistico) che
    sono possibili se il linguaggio di
    rappresentazione del significato supporta luso
    di variabili.
  • Gli stranieri amano la moda italiana
  • Domanda I Giapponesi amano la moda italiana?

14
Significato e linguaggio
  • Riconoscere le relazioni che esistono tra i
    concetti (associati a diverse parole) e le
    componenti frasali di ciascuna espressione
    linguistica
  • I verbi (predicati) assumono un ruolo rilevante
    imponendo vincoli sulla struttura grammaticale e
    sulla posizione di altri elementi (argomenti) che
    devono accompagnarli nella struttura sintattica
    di una frase
  • Identificare il significato completo di una
    frase come risultato della composizione del
    significato dei singoli elementi linguistici in
    ingresso (i costituenti del parser sintattico).

15
Significato e linguaggio
  • I Giapponesi amano la moda italiana
  • NP V NP
  • Il predicato ha due argomenti di tipo nominale NP
  • Il primo argomento precede il verbo ed assume il
    ruolo di soggetto (colui che compie lazione
    espressa dal verbo)
  • Il secondo argomento segue il verbo ed assume il
    ruolo di oggetto (che subisce lazione espressa
    dal verbo)

16
Significato e linguaggio
  • Regolarità nei comportamenti degli elementi
    associati ai verbi (classi di verbi) possono
    assumere un significato particolare ed indicare
    un ruolo semantico specifico
  • Le strutture verbali di sottocategorizzazione
    evidenziano il legame tra le strutture
    superficiali (sintattiche) ed il ruolo semantico
    che esse assumono nella rappresentazione del
    significato di una frase

17
Significato e linguaggio
  • I verbi (classi di) possono imporre delle
    restrizioni sulla tipologia degli argomenti retti
    (frasi nominali, frasi preposizionali, )
  • es. gli elementi delle frasi nominali presenti
    nella struttura sintattica possono assumere
    valore solo in alcune categorie concettuali
    (selectional restriction)
  • Lho visto guidare una automobile.
  • Lui sarà sicuramente un uomo perché solo gli
    umani possono guidare unautomobile.

18
Significato e linguaggio
  • In una frase non sono solo i verbi a reggere le
    strutture argomentali predicative le
    preposizioni possono essere considerate dei
    predicati con 2 argomenti
  • il primo argomento è lentità che la preposizione
    pone in (una qualche) relazione con il secondo
    argomento
  • Giovanni comprò unautomobile di prestigio

19
Significato e linguaggio
  • Ulteriori strutture possono esprimere legami
    predicativi tra argomenti
  • Preparare la presentazione-ppt per la lezione di
    2 ore di Intelligenza Artificiale di domani
  • Lazione non è esplicitata esclusivamente dal
    verbo (preparare), ma anche dal sostantivo che
    esso regge (nominalizzazione)
  • Il predicato (presentare) è associato al termine
    (presentazione-ppt) e regge 4 argomenti

20
Significato e linguaggio
  • I linguaggi per la rappresentazione del
    significato devono poter specificare la semantica
    delle strutture predicative argomentali
    (predicate-argument structures).
  • Le strutture argomentali asseriscono che
    relazioni specifiche hanno luogo tra i diversi
    concetti sottostanti i costituenti (parole e
    frasi) che compongono una frase.
  • Grazie a queste strutture argomentali si realizza
    un significato unico (unificante) tra le varie
    componenti della frase.

21
Predicate-argument structure sintesi
  • Predicati
  • soprattutto verbi, frasi verbali, frasi
    preposizionali, frasi (V, VP, PP, S)
  • talvolta nomi e frasi nominali (N, NP)
  • Argomenti
  • soprattutto nomi, strutture nominali, frasi
    nominali, frasi preposizionali (N, NP, PP)
  • anche altre forme in relazione al contesto

22
Calcolo dei predicati FOPC richiami
  • Fornisce solide basi computazionali per
    supportare le operazioni di matching, per fare
    inferenza, e non pone molti vincoli su come
    rappresentare le entità coinvolte.
  • Il mondo è composto da oggetti, proprietà di
    oggetti e relazioni tra oggetti.
  • Grazie alla nozione di termine si possono
    rappresentare oggetti di varia tipologia
    (funzioni, costanti, variabili) cui possono
    essere associati i nomi degli elementi del
    dominio in esame.
  • Le funzioni possono anche essere considerate come
    predicati ad un unico argomento. Le variabili
    permettono di fare delle affermazioni sia
    relativamente ad entità non note, sia
    relativamente a classi di entità.
  • I quantificatori (esistenziale ed universale)
    associati alle variabili permettono di assegnare
    significato ad una generica entità o ad una
    classe

23
Calcolo dei predicati FOPC richiami
  • I predicati permettono di asserire, tramite un
    nome, la relazione esistente tra un numero
    predefinito di elementi di uno specifico dominio.
  • I Giapponesi amano la moda italiana
  • Amare(Giapponesi,ModaItaliana)
  • Rappresentazioni di frasi complesse possono
    essere realizzate introducendo dei connettivi
    logici.
  • I Giapponesi amano la moda italiana e fotografano
    monumenti
  • Amare(Giapponesi,ModaItaliana) ?
    Fotografare(Giapponesi,Monumenti)

24
Calcolo dei predicati FOPC richiami
  • Le entità espresse grazie al calcolo dei
    predicati assumono un significato in base alla
    corrispondenza con il mondo che si sta
    modellando ciascuna formula logica può assumere
    un valore (vero, falso).
  • Una formula logica è vera
  • se è presente nella base di conoscenza,
  • o
  • se può essere dedotta da altre formule della base
    di conoscenza.
  • Linterpretazione delle formule avviene in
    relazione alle tavole di verità dei connettivi
    logici

25
Analisi semantica
  • Gli approcci computazionali allanalisi semantica
    si riferiscono
  • al processo in base a cui
  • le diverse rappresentazioni del significato di
    una frase
  • vengono composte
  • per poi essere poste in corrispondenza
  • dei vari elementi linguistici.
  • Necessità di usare sorgenti di conoscenza
    diversificate a supporto della rappresentazione
    del significato tra esse
  • i significati delle parole
  • i significati associati alle strutture
    sintattiche
  • la conoscenza della struttura del discorso
  • conoscenza del contesto
  • conoscenza (almeno) di base del dominio

26
Analisi semantica guidata dalla sintassi
  • 1.Le frasi sono composte da parole ciascuna delle
    quali assume un significato (principio di
    composizionalità).
  • 2.Le parole si organizzano tra loro secondo
    regole specifiche e relazionano tra loro per
    formare una frase con un determinato significato.
  • Io vedo ciò che mangio
  • Io mangio ciò che vedo
  • 3.Il significato di una frase non è basato
    esclusivamente sulle parole che la compongono, ma
    deve tener conto dellordine con cui compaiono,
    dei raggruppamenti esistenti, e delle
    interrelazioni.
  • Nellanalisi semantica basata sulla sintassi, la
    composizionalità dei significati terrà quindi
    conto delle diverse componenti sintattiche e
    delle relazioni esistenti.

27
Analisi semantica guidata dalla sintassi
  • Lanalizzatore semantico elaborerà il risultato
    dellanalisi sintattica nelle diverse (ambigue)
    risultanze con un (probabile) incremento
    dellambiguità.
  • Le ambiguità residue potranno essere risolte
    grazie sia alla conoscenza di dominio che di
    contesto le quali permetteranno di selezionare la
    rappresentazione (più) corretta.

28
Esempio
  • AyCaramba serves meat
  • Viene descritto l evento del servire che
    richiede lesistenza di qualcuno che serva e di
    qualcosa che venga servito.

29
Analisi composizionale
30
Augmented Rules
  • Ciò può essere realizzato by attaching semantic
    formation rules alle regole sintattiche della
    CFG.
  • Esempi di augmented rules
  • dove ciascun a è un costituente sintattico della
    regola. Ovvero
  • La semantica che viene associata ad A può essere
    calcolata da qualche funzione applicata alla
    semantica delle parti di A.

31
Augmented Rules
  • Gli attachment sono costituiti da istruzioni che
    specificano come calcolare il significato della
    frase A.sem dai significati dei suoi costituenti,
    ovvero
  • dallattivazione della funzione f su qualche
    sottoinsieme degli attachment semantici dei
    costituenti di A.

32
Analisi composizionale
33
Example AyCaramba serves meat
  • Easy parts
  • NP -gt PropNoun
  • NP -gt MassNoun
  • PropNoun -gt AyCaramba
  • MassNoun -gt meat
  • These attachments consist of assigning constants
    and copying semantics from children up to
    parents.
  • (processo di propagazione della semantica)
  • Attachments
  • PropNoun.sem
  • MassNoun.sem
  • AyCaramba
  • Meat

34
Esempio AyCaramba serves meat
35
Esempio AyCaramba serves meat
  • VP domina sia serves che meat.
  • E necessario incorporare il significato della
    NP nel significato del verbo e assegnare la
    rappresentazione risultante alla VP.sem
  • Ciò consiste nel sostituire la variabile y con il
    termine logico meat come secondo argomento del
    ruolo Served dellevento Serves

36
Esempio AyCaramba serves meat
  • Possiamo ora combinare composizionalmente quanto
    fatto per i vari costituenti sintattici
  • E necessario incorporare il significato sia
    della NP che della VP nel significato della frase
    e assegnare la rappresentazione risultante alla
    S
  • Ciò consiste nel sostituire la variabile x con il
    termine logico AyCaramba come secondo argomento
    del ruolo Server dellevento Serves

37
Esempionotazione lambda estensione FOPC
  • VP.sem(NP.sem)
  • Verb.sem(NP.sem )
  • S -gt NP VP
  • VP -gt Verb NP
  • Verb -gt serves

Ciò consiste nel prendere la semantica di un
figlio ed applicarla come una funzione alla
semantica dellaltro figlio
38
Composizionalità forte
  • La semantica del tutto (la frase) è stata
    derivata solamente dalla semantica delle singole
    componenti/parti
  • (i.e. noi ignoriamo cosa ci sia nelle altre parti
    dellalbero).

39
Esempio complesso
  • Dovè la complessità?
  • Quale ruolo assume Harry?

40
Esempio complesso
  • La VP per told è VP -gt V NP Vpto
  • Quale dovrebbe essere il suo attachment
    semantico?
  • Associare la funzione semantica collegata a Vpto
    con la semantica della NP ciò fa emergere Harry
    come lattore (goer) dellazione dellandare.
  • Associare la semantica di V alla semantica della
    NP ciò fa emergere Harry come loggetto (tellee)
    dellazione del dire
  • Quindi il risultato delle associazioni ci
    fornisce il giusto valore delle cose dette.
  • V.Sem(NP.Sem, Vpto.Sem(NP.Sem))

41
Esempio (a)
  • Consideriamo gli attachment per VP
  • VP -gt Verb NP NP (gave Mary a book)
  • VP -gt Verb NP PP (gave a book to Mary)
  • Assumiamo che le rappresentazioni del significato
    di entrambe siano le stesse.
  • 1-Associando una valenza forte al lessico, i VP
    attachments sono
  • VP.Sem(NP.Sem, NP.Sem)
  • VP.Sem(NP.Sem, PP.Sem)

42
Esempio (b)
  • Invece
  • 2-Associando una valenza forte alla sintassi noi
    potremmo avere qualcosa del genere
  • VP -gt V NP NP
  • V.sem Recip(NP1.sem)
    Object(NP2.sem)
  • VP -gt V NP PP
  • V.Sem Recip(PP.Sem) Object(NP1.sem)
  • Ovvero il verbo contribuisce da solo al
    predicato, la grammatica conosce i ruoli.

43
Integrazione
  • Se si integra lanalisi semantica nel parser
    mentre è in funzione
  • Si possono usare i constraint semantici per
    eliminare interpretazioni sintattiche senza senso
  • - Si assegna una rappresentazione del significato
    ai costituenti che non prendono parte nella
    maniera corretta alla analisi sintattica

44
Frasi con quantificazioni
  • Consideriamo la frase inglese
  • A restaurant serves meat.
  • assumiamo che A restaurant possa essere
    rappresentato come
  • con la notazione lambda si ha

45
Termini complessi
  • Permettere al sistema composizionale di
    utilizzare rappresentazioni (come oggetti con le
    parti) del tipo
  • Complex-Term ? ltQuantifier var bodygt

46
Conversione
  • Termini complessi vengono racchiusi (embedded)
    allinterno di predicati.
  • Quindi vengono fatti emergere opportunamente per
    ridistribuire le componenti della
    rappresentazione
  • P(ltquantifier, var, bodygt)
  • diventa
  • Quantifier var body connective P(var)

47
Esempio
48
Quantificatori e connetivi logici
  • Se si è in presenza del quantificatore
    esistenziale, allora il connettivo è (and)
  • Se si è in presenza del quantificatore
    universale, allora il connettivo è -gt
    (implicazione)

49
(più) Termini complessi
  • La tecnica della conversione sposta i
    quantificatori fuori e prima dellinizio della
    forma logica
  • Ciò causa ambiguità se cè più di un termine
    complesso allinterno della stessa frase.

50
Ambiguità dei quantificatori
  • Consideriamo la frase
  • Every restaurant has a menu
  • che può avere più di un significato
  • ogni ristorante ha un menù
  • oppure
  • esiste qualche (mega) menù e tutti i ristoranti
    hanno quel menù

51
Ambiguità dei quantificatori
  • Consideriamo la frase
  • Every restaurant has a menu

52
Ambiguità dello scopo del quantificatore
53
Ambiguità
  • Questo problema è simile al problema dell
    attachment delle frasi preposizionali
    (prepositional phrase attachment )
  • Il numero delle possibili interpretazioni cresce
    esponenzialmente con il numero di termini
    complessi presenti nella frase
  • In assenza di soluzioni generali, ciò che
    possiamo fare è utilizzare metodi deboli (weak
    methods) per preferire una interpretazione ad
    unaltra

54
Non-composizionalità
  • Nel linguaggio corrente esistono molti casi in
    cui non ha senso applicare il principio della
    composizionalità, il significato (mal definito)
    del termine non può essere derivato dal
    significato delle sue componenti/parti
  • Idiomi, giochi di parole, espressioni ironiche o
    sarcastiche, metafore, richieste indirette,

55
Non-composizionalità
  • Occhio di bue, prendere al volo lofferta, di
    palo in frasca, due piccioni con una fava, cadere
    dalle nuvole, la grande guerra, etc
  • In molte di queste costruzioni il significato
    dellespressione come unico evento è a seconda
    dei casi
  • totalmente scorrelato dal significato delle
    singole parti
  • correlato in qualche modo oscuro e molto vago

56
Esempio
  • La punta delliceberg
  • (inizio di qualcosa enorme di cui non si
    prevedono le dimensioni)
  • Di questa frase possiamo dire varie cose
    trattasi di
  • Una frase specifica con un significato
    particolare
  • Una frase flessibile sintatticamente e
    lessicalmente con un significato particolare
  • Una frase flessibile sintatticamente e
    lessicalmente con un significato parzialmente
    composizionale

57
Esempio
  • Si consideri la frase
  • Enron is the tip of the iceberg.
  • NP -gt the tip of the iceberg
  • Non va proprio bene per esempio
  • the tip of Mrs. Fords iceberg
  • the tip of a 1000-page iceberg
  • the merest tip of the iceberg
  • E cosa dire di
  • Thats just the icebergs tip.

58
Esempio
  • NP -gt the tip of the iceberg
  • Ciò che sembra che ci serva è una regola
    grammaticale specificamente scritta per gestire
    il fenomeno, qualcosa del tipo
  • NP -gt
  • una NP iniziale con tip come sua head seguita da
  • una successiva PP con of come sua head e che
    abbia iceberg come head della sua NP
  • e che permetta modificatori del tipo merest,
    Mrs. Ford, e 1000-page per modificare le forme
    semantiche rilevanti

59
Analisi semantica robusta
  • Le grammatiche tradizionali generalmente non
    riflettono i contenuti semantici in maniera
    diretta ed esplicita le strutture sintattiche
    prodotte spesso non sono utili per effettuare
    lanalisi semantica utilizzando il principio
    della composizionalità infatti
  • elementi con un ruolo semantico chiave sono
    spesso distribuiti allinterno dellalbero
    sintattico rendendo molto complessa la
    composizionalità
  • gli alberi sintattici contengono molti
    costituenti sintattici che non hanno alcun ruolo
    nellelaborazione semantica
  • la generalità informativa di molti costituenti
    sintattici produce attchment semantici che
    possono creare rappresentazioni semantiche prive
    o quasi di significato

60
Analisi semantica robusta
  • Per risolvere questo problema si può agire in
    modi diversi per migliorare lefficienza delle
    operazioni
  • estendendo il ruolo delle grammatiche (con
    lintroduzione delle espressioni lambda e dei
    termini complessi,)
  • riscrivendo la grammatica per riflettere la
    semantica

61
Esempio-distribuzione di elementi con
significato allinterno dellalbero-molti nodi
non rilevanti per il significato della frase
62
Esempio -costituenti sintattici ad un giusto
livello di generalità per la sintassi, ma troppo
vaghi semanticamente
  • Si consideri la regola per il termine complesso
    (some) Italian food
  • Nominal-gtAdj Nominal
  • ?x Nominal.sem(x)AM(x,Adj.sem)
  • lapplicazione di un tale attachment produce
    questa rappresentazione
  • ?x Isa(x,Food)?AM(x,Italian)
  • che non sta ad indicare linterpretazione
    sottintesa
  • cibo preparato in un modo particolare e speciale

63
Grammatiche semantiche
  • Le grammatiche semantiche (sviluppate per
    lanalisi del dialogo in sistemi di Q/A con un
    vocabolario ristretto e complessità grammaticale
    limitata) vanno nella direzione di supportare
    lanalisi composizionale (regole CFG con un set
    di terminali).
  • Le regole (scritte per soddisfare le necessità
    della semantica piuttosto che della sintassi) ed
    i costituenti della grammatica corrispondono
    esattamente alle entità ed alle relazioni del
    dominio analizzato
  • Il termine grammatica semantica si riferisce
    alla motivazione delle regole della grammatica
  • si generano esattamente le regole semantiche
    che servono
  • - è necessario sviluppare una nuova grammatica
    per ciascun nuovo dominio

64
Grammatiche semantiche Esempio
  • Si consideri una possibile regola per rispondere
    ad una richiesta di informazione del tipo
  • Request ? I want to go to eat FoodType TimeExpr
  • some attachment
  • Per Italian food potremmo usare la regola
  • FoodType -gt Nationality FoodType
  • che stabilisce che il tipo di cibo deve essere
    collegato alla caratteristica nazionale

65
Grammatiche semantiche
  • Regole difficilmente riusabili in contesti
    diversi
  • Possibile overgenerazione per esempio il termine
  • Canadian restaurant
  • non viene usato nella stessa accezione di
    Italian food, bensì nel senso di ristorante in
    Canada
  • La motivazione del significato è al di là delle
    parole, è nel dominio culturale dei cibi

66
Estrazione di informazione da testi IE
  • Nei sistemi per lestrazione di informazione da
    testi siamo interessati a riconoscere solo
    informazioni specifiche si richiede un approccio
    diverso
  • Tali sistemi devono gestire
  • Frasi reali (e quindi arbitrariamente lunghe e
    complesse)
  • Una semantica superficiale
  • Liste piatte di coppie attributo-valore
  • XML/SGML

67
Esempi
  • Analisi di articoli di quotidiani, notizie di
    agenzia per lidentificazione di uno specifico
    insieme di eventi di interesse
  • Analisi di siti web alla ricerca di prodotti,
    prezzi, etc
  • Questi testi hanno caratteristiche peculiari
  • Frasi lunghe, sintassi complessa (e talvolta
    incorretta) autori diversi,

68
Sistemi di IE
  • I sistemi di IE sono in genere basati su una
    cascata di automi per riconoscere fenomeni
    specifici e tralasciare parti non rilevanti del
    testo anlizzato
  • Vengono riconosciuti elementi di
    sintassi/semantica isolati dal contesto e quindi
    usati in una fase successiva di processing fino
    ad ottenere il risultato finale
  • Il risultato finale dellelaborazione è un
    insieme di relazioni e valori che vengono
    successivamnete memorizzati in una base di dati

69
Esempio (MUC)
  • Bridgestone Sports Co. said Friday it has set up
    a joint venture in Taiwan with a local concern
    and a Japanese trading house to produce golf
    clubs to be shipped to Japan.
  • The joint venture, Bridgestone Sports Taiwan
    Co., capitalized at 20 million new Taiwan
    dollars, will start production in January 1990
    with production of 20,000 iron and metal wood
    clubs a month.

70
Esempio
  • Bridgestone Sports Co. said Friday it has set up
    a joint venture in Taiwan with a local concern
    and a Japanese trading house to produce golf
    clubs to be shipped to Japan.
  • The joint venture, Bridgestone Sports Taiwan
    Co., capitalized at 20 million new Taiwan
    dollars, will start production in January 1990
    with production of 20,000 iron and metal wood
    clubs a month.

71
Esempio
  • Bridgestone Sports Co. said Friday it has set up
    a joint venture in Taiwan with a local concern
    and a Japanese trading house to produce golf
    clubs to be shipped to Japan.
  • The joint venture, Bridgestone Sports Taiwan
    Co., capitalized at 20 million new Taiwan
    dollars, will start production in January 1990
    with production of 20,000 iron and metal wood
    clubs a month.

72
Esempio
  • Bridgestone Sports Co. said Friday it has set up
    a joint venture in Taiwan with a local concern
    and a Japanese trading house to produce golf
    clubs to be shipped to Japan.
  • The joint venture, Bridgestone Sports Taiwan
    Co., capitalized at 20 million new Taiwan
    dollars, will start production in January 1990
    with production of 20,000 iron and metal wood
    clubs a month.

73
FASTUS Output (Hobbs 1997)
74
Cascata di processi
75
Punti rilevanti
  • Il riconoscimento delle named entities di un
    testo permette di riconoscere nomi di persone,
    organizzazioni, luoghi, etc.
  • Le named entities vengono riconosciute in modo
    robusto con metodi riutilizzabili in applicazioni
    diverse

76
Punti rilevanti
  • E tutte le altre componenti del testo?
  • Possono essere ignorate!
  • Non servono per le successive fasi di processing
    e quindi non è necessario elaborarle

77
Punti rilevanti
  • Lapproccio metodologico dei sistemi di IE
    funziona in quanto ci si pone in un contesto
    applicativo limitato
  • Si ricerca solo un insieme limitato di item che
    può quindi apparire in un insieme limitato di
    regole

78
Esempio reale
  • The White House said President Bush has approved
    duty-free treatment for imports of certain types
    of watches that arent produced in significant
    quantities in the U.S., the Virgin Islands and
    other U.S. possessions.
  • WSJ Markup Example

79
Argomenti trattati in questa lezione
  • Capire il significato di una frase per fare
    inferenza
  • Rappresentazione del significato (metodologie)
  • An. Sem. guidata dalla sintassi
  • Predicate-argument structure
  • Augmented rules
  • Composizionalità
  • Termini complessi e gestione dei quantificatori
  • Analisi semantica robusta
  • Grammatiche semantiche

80
Elaborazione del linguaggio naturale
  • Le presentazioni sugli argomenti di elaborazione
    del linguaggio naturale fanno in alcuni passi
    riferimento ad alcune presentazioni dei colleghi
    prof. Fabio Massimo Zanzotto e dottor Marco
    Pennacchiotti, del dottor Patrick Pantel
    (ISI-USC), oltre che ad alcune parti del libro
    Speech and Language Processing, Prentice Hall,
    2000, autori D.Jurafsky, J. H. Martin.
Write a Comment
User Comments (0)
About PowerShow.com