Induktiv logikprogrammering - PowerPoint PPT Presentation

About This Presentation
Title:

Induktiv logikprogrammering

Description:

Induktiv logikprogrammering Henrik Bostr m Regler S kstrategier Flerklassproblem veranpassning Ensembler Regler N gra till mpningar Molekyl rbiologi ... – PowerPoint PPT presentation

Number of Views:59
Avg rating:3.0/5.0
Slides: 21
Provided by: Henrik81
Category:

less

Transcript and Presenter's Notes

Title: Induktiv logikprogrammering


1
Induktiv logikprogrammering
Henrik Boström
  • Regler
  • Sökstrategier
  • Flerklassproblem
  • Överanpassning
  • Ensembler

2
Regler
illegal(WKr,WKc,BKr,BKc,BRr,BRc) - WKr BRr,
WKc ? BRc, WKr ? BKr.
active(M) - atom(M,A1,E,C1), atom(M,A2,E,C2),
C1 gt C2.
sentence(L1,L2) - determiner(L1,L3),
noun(L3,L4), verb(L4,L2).
-
-
-

-
-

-
-

-
-

?
-

-


-
-



-

-
-

-



-
-
-
-
-
-
-
-
-
-
-
-
-

-
-
-
-

-


?
-

-
-
-
-
-

-
?
-

-
-
-
-
-
3
Några tillämpningar
  • Molekylärbiologi (läkemedelsaktivitet,
    mutagenicitet, sekundär- strukturer hos
    protein) active(M)- atom(M,A1,E1,T1,C1),
    atom(M,A2,E2,T2,C2), ...
  • Naturligt språkbehandling (morfologi,
    part-of-speech tagging, grammatik) rmv(A,B,dt)-
    nounp(B,C),noun(C,D), pos(D,E), nounp(E,F).
  • Diagnos-, styr- och modelleringssystem (diagnos
    av fel i kommunikationssatteliter, manövrera
    F-16 simulator, kvalitativa modeller)

4
Induktionsproblemet
  • Givet
  • en mängd bakgrundspredikat B och två disjunkta
    mängder grunda atomer P och N Finn
  • en hypotes (regelmängd) H, så att H ??B ? p,
    för alla p ? P och H ??B ? n, för alla n ? N

5
Exempel
  • B
  • suit(Suit)- black(Suit).suit(Suit)- red(Suit).
  • rank(Rank)- num(Rank).rank(Rank)- face(Rank).
  • black(spades). black(clubs).
  • red(hearts). red(diamonds).
  • num(1). ... num(10).
  • face(jack). face(queen). face(king).P
    reward(spades,7), reward(clubs,3)
  • N reward(hearts,5), reward(clubs,jack)

6
Top-Down vs. Bottom-Up Induction
  • Top-Down (General-to-specific) induction
  • Starta med en hypotes som täcker några positiva
    exempel och specialisera den tills inga negativa
    exempel täcks.
  • Bottom-Up (Specific-to-general) induction
  • Starta med en hypotes som täcker
    endast positiva exempel och generalisera den så
    långt det går utan att negativa exempel täcks.

7
Separate-and-Conquer
  • Indata E (positiva exempel), E (negativa
    exempel) och T (målpredikat)
  • Utdata H (hypotes) H ? och Pos E
  • Så länge Pos ? ?
  • C T
  • Så länge C täcker något negativt exempel
  • Specialisera C
  • Addera C till H
  • Subtrahera de element i Pos som täcks av
    H Returnera H

System Foil, Progol
8
Divide-and-Conquer
  • Indata E (positiva exempel), E (negativa
    exempel) och T (målpredikat)
  • Utdata H (hypotes) H T
  • Så länge någon klausul C i H täcker ett
    negativt exempel
  • Om C täcker något positivt exempel så ersätt
    C med split(C) annars subtrahera C från
    H Returnera H

System CART, C4.5, Spectre, Tilde
9
Heuristik för val av specialisering
  • Divide-and-Conquer
  • Separate-and-Conquer

10
Kung-Torn vs. Kung-Bonde
11
Grammatik
12
Tic-Tac-Toe
13
Replikationsproblemet
  • p(X1,X2,X3,X4)- X11, X21. p(X1,X2,X3,X4)-
    X31, X41. p(X1,X2,X3,X4)- X31,
    X42.p(X1,X2,X3,X4)- X31, X41.p(X1,X2,X3,X4
    )- X31, X42.p(X1,X2,X3,X4)- X31, X43,
    X11, X21.p(X1,X2,X3,X4)- X31, X44, X11,
    X21. p(X1,X2,X3,X4)- X32, X11,
    X21.p(X1,X2,X3,X4)- X33, X11,
    X21.p(X1,X2,X3,X4)- X34, X11, X21.

SAC
DAC
14
Separate-and-Conquer vs. Divide-and-Conquer

































  • Divide-and-Conquer är effektivare än
    Separate-and- Conquer (O(E) vs. O(E2) ).
  • Hypotesrymden är större för Separate-and-Conquer
    än för Divide-and-Conquer.
  • För varje hypotes i hypotesrymden för
    Separate-and- Conquer så finns det en
    ekvivalent hypotes i hypotesrymden för
    Divide-and-Conquer.
  • Divide-and-Conquer är i motsats till
    Separate-and- Conquer ej applicerbar för
    inlärning av rekursiva regler.

15
Flerklassproblem
  • Inga problem för Divide-and-Conquer - endast
    heuristiken behöver modifieras - reglerna är
    ej överlappande, så ordningen spelar ingen
    roll
  • Två möjligheter för Separate-and-Conquer i)
    betrakta reglerna som ordnade (decision
    lists) ? strategi för att bestämma i vilken
    ordning reglerna skall läras
    behövs ii) betrakta reglerna som oordnade ?
    strategi för att resolvera konflikter
    behövs

System CN2
16
Överanpassning
  • Sannolikhetsmått
  • Pre- och Post-Pruning
  • Incremental Reduced Error Pruning

17
Sannolikhetsmått
Relativ frekvens Laplace mått m-estimate
18
Pre- och Post-pruning
  • Pre-pruning - specialisering av regel som
    täcker exempel från flera klasser utförs inte
    om ej tillräckligt bra alternativ finns (t.ex.
    ingen informations- vinst) - effektiv men
    riskfylld metod
  • Post-pruning - reglerna generaliseras efter att
    en konsistent hypotes har genererats - mer
    kostsam men ger ofta upphov till mer korrekt
    hypotes

19
Incremental Reduced Error Pruning
  • Applicera Post-pruning direkt på en regel
    efter att den lagts till hypotesen av SAC
  • Stor effektivitetsvinst då ju en större mängd
    exempel kan subtraheras vid varje iteration
  • Dock risk för s.k. hasty generalisation

System IREP, Ripper, Flipper
20
Ensembler av klassificerare
En uppsättning klassificerare får rösta (ev. med
olika vikter) när ett nytt exempel skall
klassificeras. De mest populära metoderna för att
genera en ensemble är
  • Randomisation
  • Bagging
  • Boosting
Write a Comment
User Comments (0)
About PowerShow.com