Grammatiche, Linguaggio e Automi - PowerPoint PPT Presentation

1 / 21
About This Presentation
Title:

Grammatiche, Linguaggio e Automi

Description:

Title: Fondamenti di Informatica 1 Author: Roberto Basili Last modified by: basili Created Date: 12/10/2000 8:10:44 PM Document presentation format – PowerPoint PPT presentation

Number of Views:86
Avg rating:3.0/5.0
Slides: 22
Provided by: Roberto342
Category:

less

Transcript and Presenter's Notes

Title: Grammatiche, Linguaggio e Automi


1
Grammatiche, Linguaggio e Automi
  • R. Basili
  • TAL - a.a. 2009-2010

2
Sommario
  • Grammatiche definizione di base
  • La gerarchia di Chomsky
  • Grammatiche e Lingue Naturali
  • Cenni alla Teoria degli Automi

3
Motivazioni
  • Un sistema di riconoscimento della sintassi di
    una lingua deve esibire proprietà
  • Descrittive. Deve cioè spiegare la motivazioni
    alla base della accettabilità grammaticale degli
    enunciati di una lingua in termini di
  • Proprietà lessicali delle classi di oggetti
    elementari della lingua
  • Proprietà strutturali degli enunciati
  • Procedurali Deve fornire meccanismi
    computazionali in grado di
  • Riconoscere la accettabilità grammaticale
  • Costruire le strutture grammaticali che
    soggiacciono ai singoli enunciati accettabili

4
Grammatiche Formali
  • Un linguaggio L e caratterizzato da un insieme
    di stringhe, cioe sequenze finite di elementi di
    un vocabolario di partenza A
  • I will consider a language to be a set (finite
    or infinite) of sentences, each finite in length
    and constructed out of a finite set of elements
    All natural languages are languages in this
    sense Similarly, the set of sentences of some
    formalized system of mathematics can be
    considered a language Chomsky 1957

5
Grammatiche Formali (2)
  • Dato un vocabolario A, linsieme di tutte le
    stringhe costruite su A (A) più loperazione di
    concatenazione (formazione di stringhe complesse
    a partire da stringhe semplici) costituisce una
    struttura algebrica definita come monoide libero
    su A.
  • Normalmente, non tutte le stringhe del monoide
    costituiscono frasi ben formate di L per es,
    dato un frammento del lessico italiano, non tutte
    le sequenze arbitrarie sono frasi dellitaliano
  • Il bambino corre Corre il bambino
  • il corre bambino bambino corre il ..

6
Grammatiche Formali (3)
  • Quindi L con vocabolario A è in genere un
    sottoinsieme proprio di A, i.e. L ? A
  • IL compito della grammatica di L è di catturare
    il sottoinsieme in questione generando tutte e
    sole le stringhe che lo compongono (capacità
    generativa debole) e di esprimere la struttura
    delle frasi di L (capacità generativa forte).
  • il bambino legge il libro e non
  • il bambino legge il libro

7
  Grammatiche Formali (4)
  • Per lo studio delle proprietà formali, è utile
    considerare linguaggi semplificati, con lessici
    molto ridotti e sintassi semplice, per es,
    linguaggi come i seguenti
  • ab, abab, ababab, abababab,
  • ab, aab, aabbbb, aaaaabb,...
  • ab, aabb, aaabbb, aaaabbbb...
  • aa, bb, abba, baab, abaaba, aaabbaaa, ...
  • a, abab, abbabb, abbababbab,...
  • abc, aabbcc, aaabbbccc, aaaabbbbcccc

8
Grammatiche Formali (5)
  • Una grammatica formale è un sistema deduttivo di
    assiomi e regole di inferenza, che genera le
    frasi della lingua come suoi teoremi (capacità
    generativa debole). Inoltre, assegna
    rappresentazioni strutturali alle frasi (capacità
    generativa forte).  

9
Grammatiche Formali (6)
  • Una grammatica formale è definita da una
    quadrupla
  • (i) Un vocabolario terminale VT
  • (ii) Un vocabolario non terminale VN
  • (iii) Un assioma, o simbolo iniziale S?VN
  • (iv) Un insieme di regole di riscrittura ? ? ?
  • Nella sua forma più generale, la parte sinistra e
    la parte destra della regola di riscrittura sono
    stringhe qualsiasi costruite sui due vocabolari,
    con la sola restrizione che la parte sinistra
    deve contenere almeno un simbolo di VN .

10
Derivazione da una GF
  • Una derivazione è una sequenza di stringhe che
    parte dallassioma S e arriva fino a generare una
    stringa w1, , wN del linguaggio tramite le
    regole, eliminando via via i simboli non
    terminali.
  • Modalità top-down parte da S e cerca tutte le
    sostituzioni sufficienti a generare w1, , wN
  • Modalità bottom-up parte da w1, , wN e ne
    riscrive i frammenti usando le regole sino a
    riscrivere lassioma S

11
Esempio
  • Glt VT , VN , S, Rgt
  • VT a, b, VN S, A, B Assioma S
  • Regole
  • S ? A B S S ? e AB ? BA BA ? AB
    A ? a B ? b
  • Esempio di derivazione
  • S gtABS gtBAS gtBAABS gtBAAB gtbAAB gtbaAB gtbaaBgtbaab
  • e è la stringa vuota, lelementi neutro
    rispetto alla concatenazione
  • e ? ? e ?

12
Alberi
  • La rappresentazione del risultato del parsing e
    una struttura che deve esprimere
  • Lordine degli elementi costituenti una
    espressione
  • Il tipo grammaticale dei costituenti
  • Lorganizzazione gerarchica dei costituenti
  • Le strutture dati che garantiscono tali proprietà
    sono detti alberi

13
Alberi (2)
  • Gli alberi sono strutture dati definite da una
    5-pla ltN,Q,D,P,Lgt dove
  • N e un insieme finito di nodi
  • Q e un insieme finito di etichette (label)
  • D e una relazione dordine parziale debole in
    N?N detta relazione di dominanza
  • P e una relazione dordine parziale stretta in N
    ? N, detta precedenza
  • L e la funzione di etichettatura da N a Q

14
Alberi (3) esempio
  • Il gatto beve il latte
  • N1,2,3,4,5,6,7,8,9,10,11,12,13,14
  • QS,NP,VP,Det,N,V
  • Dlt1,3gt,lt1,2gt,lt2,4gt, lt2,5gt, lt3,7gt, lt3,6gt, lt7,8gt,
    lt7,9gt,
  • Llt1,Sgt, lt3,VPgt, , lt6,NPgt, lt8,Detgt,

15
Grammatiche ed Alberi
  • Il gatto beve il latte
  • VnS,NP,VP,Det,N, Assioma S
  • Produzioni S?NP VP, VP?V NP, NP?Det N
  • Derivazioni
  • S gt NP VP gt Det N VP gt Il N VP gt Il gatto VP gt Il
    gatto V NP gt Il gatto beve NP gt Il gatto beve Det
    N gt Il gatto beve il N gt Il gatto beve il latte

16
Grammatiche ed Alberi
  • Il gatto beve il latte
  • VnS,NP,VP,Det,N, Assioma S
  • Produzioni S?NP VP, VP?V NP, NP?Det N
  • Derivazioni
  • S gt NP VP gt Det N VP gt Il N VP gt Il gatto VP gt Il
    gatto V NP gt Il gatto beve NP gt Il gatto beve Det
    N gt Il gatto beve il N gt Il gatto beve il latte

derivazione top-down
Il10 gatto11 beve12 il13 latte14
17
Grammatiche ed Alberi
  • Il gatto beve il latte
  • VNS,NP,VP,Det,N, Assioma S
  • Produzioni S?NP VP, VP?V NP, NP?Det N
  • Derivazioni
  • Il gatto beve il latte gt Det beve il latte gt Det
    N beve il latte gt NP beve il latte gt NP V il
    latte gt NP V Det latte gt NP V Det N gt NP V NP gt
    NP VP gt S

derivazione bottom-up
Il10 gatto11 beve12 il13 latte14
18
Esercizi
  • Date le seguenti frasi scrivere una grammatica
    che le rappresenta e descrivere almeno in due
    casi lalbero sintattico di derivazione.
  • Mario mangia
  • Giovanni scrisse un poema
  • Il libro fu scritto da due autori
  • Le prime sezioni erano noiose

19
Esercizi (2)
  • Estendere la grammatica precedente alle seguenti
    frasi
  • Mario mangia di notte
  • Giovanna di notte scrisse il primo capitolo del
    libro
  • Le ore insonni scorrevano attraverso la notte a
    Roma
  • Descrivere gli alberi sintattici generati dalla
    grammatica sulle tre frasi.

20
Esercizi (3)
  • Quanti non terminali (categorie grammaticali)
    sono necessarie?
  • Quante frasi generano interpretazioni
    grammaticali multiple?
  • Quali informazioni semantiche sono necessarie per
    la disambiguazione?
  • Descriverne alcune in forma testuale.

21
Riferimenti Bibliografici
  • Lyons, Introduzione alla Linguistica Teorica, II.
    Grammatica,
  • Capitoli 4.1, 4.2, 4.3, 6.1, 6.2, 8.1
Write a Comment
User Comments (0)
About PowerShow.com