Data Mining Engineering - PowerPoint PPT Presentation

1 / 37
About This Presentation
Title:

Data Mining Engineering

Description:

Peter Brezany Institut f r Softwarewissenschaft Universit t Wien, Liechtensteinstra e 22 1090 Wien Tel. : 01/4277 38825 E-mail : brezany_at_par.univie.ac.at – PowerPoint PPT presentation

Number of Views:46
Avg rating:3.0/5.0
Slides: 38
Provided by: PeterB226
Category:

less

Transcript and Presenter's Notes

Title: Data Mining Engineering


1
Kapitel 4 Aussagen-, Prädikatenlogik
Peter Brezany Institut für Softwarewissenschaft U
niversität Wien, Liechtensteinstraße 22 1090 Wien
Tel. 01/4277 38825 E-mail
brezany_at_par.univie.ac.at Sprechstunde Dienstag,
11.30-12.30
2
Logik und Mathematische Logik
Logik ist in der Theoretischen Informatik (TI)
keine Wissenschaft, die uns richtiges Denken
lehrt, sondern dass sie nur Aussagen darüber
macht, unter welchen Bedingungen man aus der
Gültigkeit von Voraussetzungen auf die Gültigkeit
von Folgerungen schließen kann. Weil hier also
Logik betrieben und aufgebaut wird wie eine
mathematische Theorie, heißt sie mathematische
Logik.
3
Aussagenlogik
  • Unter einer Aussage wollen wir einen Satz der
    natürlichen Sprache verstehen.
  • Es interessiert uns dabei nicht der syntaktische
    Aufbau (Subjekt Prädikat Objekt), sondern die
    charakteristische Eigenschaft des betrachteten
    Gebildes, wahr oder falsch zu sein.
  • Aussagen unterscheiden sich von anderen
    sprachlichen Gebilden dadurch, dass wir ihnen
    einen bestimmten Wahrheitswert zuteilen können
    den Wahrheitswert W, wenn sie wahr, den
    Wahrheitswert F wenn sie falsch sind, es aber
    keine weitere Möglichkeit gibt.
  • Beispiele solcher Aussagen sind
  • Baden ist eine Stadt in Niederösterreich.
  • Alle Menschen müssen sterben.
  • 7 ist größer als 4.
  • Sie haben alle den Wahrheitswert W.

4
Aussagenlogik (2)
  • Folgende Aussagen haben den Wahrheitswert F
  • Junge Pferde nennt man Welpen.
  • 6 ist größer als 8.
  • Eine Aussage wird im Folgenden durch A, B, C, ...
    repräsentiert. Da eine Aussage einen der beiden
    Werte annemen kann, spricht man auch von einer
    Aussagenvariablen für eine Variable A darf
    man beliebige Aussagen einsetzen, was die
    Zuweisung eines der Werte W oder F bedeutet.
  • Sätze der Umgangssprache werden auf vielfache
    Weise miteinander verknüpft durch die
    Verwendung von Bindewörtern wie und, oder,
    wenn - dann. In der Aussagenlogik lassen sich
    Verknüpfungen von Aussagen ebenfalls
    beschrieben.
  • Die Definition einer Verknüpfung von Aussagen A,
    B wird dadurch beschrieben, dass der
    Wahrheitswert der Verknüpfung in Abhängigkeit von
    der Wahrheitswerten der Aussagen A, B angegeben
    wird. Das geschieht in Form einer sogenannten
    Wahrheitstabelle oder Wahrheitstafel.

5
Aussagenlogische Formeln (AF)
  • Im Allgemeinen können wir Aussagen durch
    sogenannte aussagenlogische Formeln beschreiben.
    Folgende Elemente können in diesen Formeln
    erscheinen
  • Namen wie x für nicht-zusammengesetzte Aussagen
    (im weiteren werden wir solche Namen als atomare
    Formeln oder Atome bezeichnen). Zum Beispiel 5
    ist eine ungerade Zahl.
  • Verknüpfungsoperatoren (Konnektoren) wie ?, ?,
    usw., mit denen man aus einfachen Formeln
    komplexere zusammensetzen kann.
  • Jetzt wollen wir zur Aussagenlogik einen formalen
    Kalkül vorstellen. Dabei werden wir unter anderem
    untersuchen,
  • wie die Symbole ?, ?, usw. zusammenhängen
    Syntax der Aussagenlogik,
  • wie man komplexe Formeln auswertet, d.h. wie man
    feststellt, ob sie insgesamt wahr oder falsch
    sind Semantik der Aussagenlogik, und
  • wie man Formeln umformt, um sie in bestimmte
    einfachere Formen, sogenannte Normalformen, zu
    bringen.

6
Aussagenlogische Formeln (2)
  • Aussagenlogische Formeln heißen auch logische
    oder Booloesche Ausdrücke (BA) (nach dem
    englischen Mathematiker George Boole 19.
    Jahrhundert, der das algebraische Studium von
    Wahrheitswerten initialisiert hat).
  • BA sind ähnlich artitmetischen Ausdrücken dort
    sind Operanden, die die Werte W und F (statt
    integers) representieren, und Operatoren, and
    (?), or (?) statt ?, ) und Klammern werden
    angewendet, um die Reihenfolge der Auswertung
    bestimmen zu helfen.
  • Man muß lernen, wie man die auf Deutsch oder
    Englisch ausgedrückten Behauptungen als Formeln
    ausdrückt.

7
Syntax der Aussagenlogik
  • Zunächst wollen wir definieren, was wir unter
    einer Formel (der Aussagenlogik) verstehen eine
    einfache oder mit den schon bekannten Konnektoren
    zusammengesetzte Aussage.
  • Definition Gegeben sei eine nichtleere,
    abzählbare Menge Var von atomaren Formeln (auch
    Atome oder manchmal auchVariablen genannt), deren
    Elemente wir üblicherweise mit x, y, z, x o.ä.
    bezeichnen. Eine Formel der Aussagenlogik (AL)
    (über Var) ist induktiv wie folgt definiert
  • Induktionsbeginn Jede atomare Formel aus Var ist
    eine Formel.
  • Induktionsschritt Sind F und G bereits Formeln
    der AL, so sind auch
  • ?F, (F ? G), (F ? G)
  • Formeln der AL. ?F heißt auch Negation, (F ?
    G) heißt auch Konjuktion, und (F ? G) heißt auch
    Disjunktion.
  • Ein Literal ist eine atomare Formel oder die
    Negation einer atomaren Formel.
  • FAL ist die Menge aller aussagenlogischen
    Formeln.
  • Var (F) ist die Menge aller der atomaren
    Formeln, die in der Formel F vorkommen.

8
Syntax der Aussagenlogik BNF Grammatik (2)
  • ltAFgt W F ltidentifiergt
  • (? ltAFgt)
  • (ltAFgt ? ltAFgt)
  • (ltAFgt ? ltAFgt)
  • (ltAFgt ? ltAFgt)
  • (ltAFgt ltAFgt)

9
Semantik der Aussagenlogik
  • Die Semantik der AL festzustellen heißt
    anzugeben, was eine Formel bedeutet. Genauer
    gesagt geht es darum, zu definieren, wann eine
    AL-Formel wahr oder falsch ist.
  • Wahr (W) und falsch (F) (oder true und
    false) heißen Wahrheitswerte. Wir setzen voraus,
    dass jede atomare Formel entweder den
    Wahrheitwert W oder F annimmt, das heißt, wir
    arbeiten mit einer zweiwertigen Logik.
  • Bemerkung Es gibt auch andere Logiken, z.B.
    die dreiwertige, die mit den Wahrheitswerten W, F
    und ? arbeitet (der dritte steht für
    unbestimmt), oder die Fuzzy Logic, bei der die
    Variablen Werte aus dem Kontinuum 0,1 annehmen.
    Je näher an 1 der Wert einer Formel ist, umso
    wahrer ist sie.

10
Semantik der Aussagenlogik (2)
  • Eine atomare Formel x steht für irgendeine
    Aussage, vieleicht für Das Wort Opossum enthält
    genau soviel o wie p oder für Das Wort
    Lemur hat genau halb so viele Buchstaben wie das
    Wort Gürteltier. Ob x wahr ist oder falsch,
    hängt davon ab, für welche Aussage x steht.
  • Auch eine zusammengesetzte Formel steht für
    viele verschiedene Aussagen, manche davon wahr,
    andere falsch, je nachdem, wofür die atomaren
    Formeln stehen. Für zusammengesetzte Formeln kan
    man z.B. aber sagen F ? G ist wahr genau dann,
    wenn sowohl F als auch G wahr sind. Man kann also
    von der Bedeutung einer Formel abstrahieren und
    ihren Wahrheitswert angeben in Abhängigkeit von
    den Wahrheitswerten der Teilformeln. Da man das
    auch für Teilformeln wieder tun kann bis hinunter
    auf die Ebene der Atome, kann man insgesamt den
    Wahrheitswert einer Formel angeben in
    Abhängigkeit von den Wahrheitswerten der Atome,
    die darin vorkommen. Wenn wir jeder atomaren
    Formel einen (beliebigen, aber festen)
    Wahrheitswert zuweisen, so heißt das eine
    Belegung.

11
Semantik der Aussagenlogik (3)
  • Definition Ein Wahrheitwert ist ein Wert aus
    der Menge W, F. Eine Belegung ist eine
    Abbildung A Var ? W, F, die jeder atomaren
    Formel einen Wahrheitswert zuweist.
  • Wir erweitern A auf eine Abbildung A FAL ? W,
    F, die jeder AL-Formel einen Wahrheitswert
    zuweist wie in den folgenden Wahrheitstafeln
    spezifiziert wird.

12
Wahrheitstafeln
  • Konjuktion ? (und)
  • A B A ? B
  • F F F
  • F W F
  • W F F
  • W W W
  • Disjunktion ? (oder)
  • A B A ? B
  • F F F
  • F W W
  • W F W
  • W W W

13
Wahrheitstafeln (2)
  • Implikation ? A heißt die Prämisse,
    B die Conclusio
  • A B A ? B der Folgerung
  • F F W
  • F W W
  • W F F
  • W W W
  • Äquivalenz ?
  • A B A ? B
  • F F W
  • F W F
  • W F F
  • W W W

Schlagwort aus etwas Falschem kann man
alles folgern
14
Wahrheitstafeln (3)
  • Negation ?
  • A ?A
  • F W
  • W F

Definition Tautologie Eine Formel heißt
allgemeingültig (oder Tautologie), wenn sie für
alle Werte der in ihr vorkommenden
Aussagenvariablen den Wert W annimmt. Anders
ausgedrückt heißt eine Formel Tautologie, wenn
sie für alle Belegungen den Wert W
annimt. Beispiele für allgemeingültige Formeln
sind A ? ?A oder A ? (A ? B) ? B
15
Wahrheitstafeln (4)
  • Konjunktion, Disjunktion, Implikation und
    Äquivalenz werden als zweistellige Junktoren
    genannt. Die Negation eine einstellige
    Verknüpfung.

16
Auswertung von konstanten AF
  • Konstante AF sie enthält nur Konstanten als
    Operanden
  • Fall 1 Der Wert von W ist W der Wert von F ist
    F.
  • Fall 2 Der Wert von (?A), (A ? B), ..., wo A und
    B sind Konstanten W oder F ist durch die
    Wahrheitstafeln gegeben.
  • Fall 3 Der Wert einer konstanten AF, die mehr
    als 1 Operator enthält wird durch die wiederholte
    Anwendung des Falls 2 bestimmt.

17
Auswertung von AF in einem Zustand
  • AF wie (?A ? B) kann in einem Programm auf
    mehreren Stellen erscheinen, z.B. C (?A ? B)
    oder if (?A ? B) then ... . Wenn einer dieser
    Anweisungen ausgeführt wird, wird AF im aktuellen
    maschinen Zustand ausgewertet, um W oder F zu
    produzieren.
  • Definition Ein Zustand s ist eine Funktion
  • s Id ? W, F
  • Id Identifikatoren
  • Definition AF ist well-defined im Zustand s,
    wenn jeder Identifikator in AF mit entweder W
    oder F assoziert ist.

18
Auswertung von AF in einem Zustand (2)
  • Definition Sei AF e well-defined im Zustand s.
    Dann s(e), der Wert von e in s, ist der Wert, den
    man bekommt, wenn man alle Identifikatoren B in e
    durch ihre Werte s(B) ersetzt und evaluiert den
    resultierenden konstanten AF.

19
AF als Mengen von Zuständen
  • Eine AF representiert, oder beschreibt, die
    Menge von Zuständen in denen sie wahr ist.
    Umgekehrt, für jede Menge Zuständen, die nur
    Identifikatoren assoziiert mit W und F enthalten,
    können wir eine AF ableiten, die diese Menge
    repräsentiert.
  • Die leere Menge, die Menge, die keine Zustände
    enthält, ist durch die AF F repräsentiert, weil F
    in keinem Zustand wahr ist.
  • Die Menge aller Zustände ist durch die AF W
    repräsentiert, weil W in allen Zuständen wahr ist.

20
AF als Mengen von Zuständen (2)
  • Beispiel
  • Die Menge von 2 Zuständen
  • (B, W), (C, W), (D, W) und
  • (B, F), (C, W), (D, F)
  • ist repräsentiert durch die AF
  • (B ? C ? D) ? (?B ? C ??D)
  • ---------------------------------------
  • Bemerkung Die Verbindung zwischen einer AF
    und der von ihr repräsentierten Menge von
    Zuständen ist so stark, dass wir oft beide
    Konzepte gleichsetzen. Z.B. statt zu schreiben
    die Menge von Zuständen, in denen B ? ?C wahr
    ist, können wir schreiben die Zustände in B ?
    ?C.

21
Modell für eine Formel
  • Definition Ein Modell für eine Formel F ist
    eine wahrmachende Belegung, also eine Belegung A
    mit A(F) W.
  • Beispiel Ein Modell für die Formel (x ? (y ?
    ?z)) ist z.B. die Belegung A1 mit
  • A1(x) true, A1(y) false und A1(z) false.
  • Aber auch die folgende Belegung A2 ist ein
    Modell
  • A2(x) false, A2(y) false und A2(z) true.

22
Erfüllbare, unerfüllbare Formeln, Tautologie
  • Definition Eine Formel F heißt erfüllbar,
    falls sie mindestens ein Modell besitzt,
    ansonsten heißt sie unerfüllbar. Wenn F von jeder
    Belegung erfüllt wird, heißt F Tautologie oder
    gültig.
  • Satz Eine Formel F ist eine Tautologie genau
    dann, wenn ?F unerfüllbar ist.

23
SAT und TAUT
  • Definition
  • SAT F ? FAL F is erfüllbar
  • TAUT F ? FAL F is Tautologie
  • SAT und TAUT bezeichnen Sprachen, Sprache der
    erfüllbaren (saturierbaren) bzw. der gültigen
    AL-Formeln, und die Wörter dieser Sprachen sind
    AL-Formen.
  • SAT und TAUT bezeichnen aber auch Probleme,
    nämlich die Fragen Ist F ? SAT? und Ist F ?
    TAUT?
  • Beide Probleme sind entscheidbar man kann
    einen Algorithmus angeben, der für jede AL-Formel
    F in endlicher Zeit entscheidet, ob F erfüllbar
    bzw. gültig ist das Verfahren der
    Wahrheitstafeln.

24
Äquivalenz von Formeln
  • Äquivalenz von Formeln
  • A1 ? A2 A2 ? A1
  • A1 ? A2 A2 ? A1
  • (A1 ? A2) ? A3 A1 ? (A2 ? A3 )
  • (A1 ? A2) ? A3 A1 ? (A2 ? A3 )
  • (A1 ? A2) ? A3 (A1 ? A3) ? (A2 ? A3 )
  • (A1 ? A2) ? A3 (A1 ? A3) ? (A2 ? A3 )
  • A1 ? A1 A1 A1 ? A1 A1
  • ? (A1 ? A2) ? A1 ? ? A2
  • ? (A1 ? A2) ? A1 ? ? A2

de Morganschen Regeln
25
Konjuktive und disjunktive Normalform
  • Manchmal ist es vorteilhaft, Formeln durch
    Umformungen zu vereinfachen. Wir werden jetzt 2
    Normalformen für AL-Formeln vorstellen.
  • Normalformen sind Einschränkungen auf der
    Syntax der AL, aber so, dass man jede beliebige
    Formel umformen kann in eine äquivalente Formel
    in Normalform.
  • Normalformen sind auch wichtig für die
    maschinelle Verarbeitung von logischen Formeln
    (und es gibt inzwischen sehr viele Algorithmen,
    die AL-Formeln verarbeiten und dadurch logische
    Schlüsse ziehen z.B. intelligente Agenten)
    Wenn alle Formeln nur noch eine eingeschränkte
    Syntax haben, dann muß ein Algorithmus nicht so
    viele mögliche Formel-Formen berücksichtigen.

26
Konjuktive und disjunktive Normalform (2)
  • Definition
  • Eine Formel F ist in konjuktiver Normalform (KNF)
    genau dann, wenn F eine Konjuktion von
    Disjunktionen von Literalen ist.
  • Eine Formel F ist in disjunktiver Normalform
    (DNF) genau dann, wenn F eine Disjunktion von
    Konjunktionen von Literalen ist.
  • Beispiel Die Formel F ?(x ? (?(y ? z) ? w))
    ist in keiner Normalform. Die Formel F (?x ? y)
    ? (?x ? z) ? (?x ? w) ist zu F äquivalent und in
    DNF. Die Formel F ?x ? (y ? z ? ?w) ist zu F
    äquivalent und in KNF.

27
Regelsysteme
  • In der Logik werden Regelsysteme (Ableitungs-
    oder Inferenzregeln) angegeben, die es erlauben,
    aus einer Menge von als wahr angenommenen Formeln
    (Axiome) weitere Formeln (Theoreme) abzuleiten.
  • Die Ableitung einer Formel heißt auch
    (formaler) Beweis der Formel.
  • Beispiel für andere eine Anwendung
    Intelligente Softwareagenten (siehe folgende
    Folien).

28
Regeln
  • Die allgemeine Form einer Regel kann wie folgt
    geschrieben
  • werden
  • wenn Prämisse(n) dann Konklusion(en)
  • (statt Prämisse werden auch oft die Begriffe
    Bedingung,
  • Vorausetzung oder Situation und statt
    Konklusion Aktion
  • oder Hypothese verwendet.)Obige Form der Regel
    sagt aus, daß
  • im Falle der Erfüllung der Prämisse(n) die
    Konklusion(en) zur
  • Ausführung gelangt (gelangen).
  • Regeln können folgende Form haben
  • wenn P dann Q
  • wenn P1 und P2 und ... und Pn dann Q1 und Q2 und
    ... und Qm
  • wenn P1 oder P2 oder ... oder Pn dann Q
  • Regeln, die neue Fakten produzieren, werden
    Produktionsregeln
  • genannt.

29
Regeln (2)Architektur eines Produktionssystem
Inferenzmecha- nismus
Faktenbasis
Wissensbasis
Recognize
Select
Regeln
Fakten
Act
30
Arbeitsweise eines Produktionssystems
  • Beispiel Insgesamt gibt es in unserer
    Wissensbasis vier Regeln
  • R1 wenn A gt 50 dann B 45
  • R2 wenn B lt 40 dann C 0
  • R3 wenn B gt 40 dann D 100
  • R4 wenn A gt 60 dann E 20
  • Die Faktenbasis enthält das faktum A 100.
    Recognize R1 und R4 sind Kandidaten Select R1
    ist ausgewählt Action B 45 wird in die
    Faktenbasis geschrieben. Dann R3 usw.

31
Ein Agent in seiner Umgebung
32
Agentenbeschreibung Simple-Reflex-Agent
  • Wie beschreiben wir nun Agenten? Wir könnten eine
    Funktion
  • action P ? A (P
    perceptions (Wahrnehmungen), A Aktionen)
  • benutzen.

Condition-action rules
33
Agentenbeschreibung Simple-Reflex-Agent (2)
  • function SIMPLE-REFLEX-AGENT (percept) returns
    action
  • static rules // a set of condition-action
    rules
  • env-state ? INTERPRET-INPUT(percept)
  • rule ? RULE-MATCH(env-state, rules)
  • action ? RULE-ACTIONrule
  • return action

34
Prädikatenlogik
  • Bei der Einführung des Prädikatenbegriffs werden
    wir uns auf die Menge IN der natürlichen Zahlen
    beschränken (der Einfachkeit halber).
  • Mögliche Aussagen sind a ist eine gerade Zahl, b
    ist teilbar durch 3, c ist eine Primzahl, d ist
    eine Summe von a und b, usw. eine solche
    Aussage über einzelne Elemente, über Paare von
    Elementen oder allgemeiner über n-Tupel von
    Elementen wird als Prädikat über der Menge IN
    bezeichnet.
  • Man spricht von einem n-stelligen Prädikat über
    IN, wenn es die Aussage über je n Elemente macht.
    In Abhängigkeit von den gewählten Elementen
    nimmt ein Prädikat den Wahrheitswert W oder F an.
  • Ist P ein n-stelliges Prädikat über der Menge M,
    so wird der Funktionswert von P für das n-Tupel
    (x1, .., xn) mit P(x1, .., xn) bezeichnet. Die
    Symbole P, Q, ... Prädikatsvariablen.

35
Allquantor
  • Definition
  • Es sei P ein einstelliges Prädikat über M. Dann
    wird durch ?x P(x) genau dann eine wahre Aussage
    bezeichnet, wenn P für alle x ? M den Wert W
    annimmt. P heißt dann Allquantor oder
    Generalisator.
  • ?x P(x) wird gelesen als für alle x?M ist P(x)
    wahr.
  • Z.B. kann man die Tatsache, daß durch 6
    teilbare Zahlen auch durch 3 teilbar sind,
    ausdrücken als ?x ? N (x mod 6 0 ? x mod 3 0).

36
Existenzquantor
  • Definition
  • Es sei P ein einstelliges Prädikat über M. Dann
    wird durch ?x P(x) genau dann eine Wahre Aussage
    bezeichnet, wenn es in M (mindestens) ein Element
    a gibt, für das P den Wahrheitswert W annimmt. P
    heißt dann Existenzquantor oder Partikulisator.
  • Beispiel Es gibt mindestens ein Wort der
    deutschen Sprache, das genau 5 e und keine
    anderen Vokale enthält oder in Zeichen ?x (D(x)
    ? E(x)), falls D(x) heißt x ist ein Wort der
    deutschen Sprache und E(x) steht für x enthält
    genau 5 e und keine anderen Vokale.

37
Freie und gebundene Variablen
  • Nehmen wir das Prädikat
  • ?i m ? i lt n x?i gt 0
    (1.)
  • Die Wahrheit dieses Prädikats im Zustand s ist
    von den Werten von m, n und x in s, aber nicht
    vom Wert i abhängig, und die Bedeutung dieses
    Prädikat wird sich nicht ändern, wenn wir i durch
    j ersetzen.
  • Identifikatoren m, n und x sind freie Variablen
    des Prädikats.
  • Der Identifikator i ist gebunden in (1.) und
    ist gebunden zu dem Quantifier ? in diesem
    Prädikat.
Write a Comment
User Comments (0)
About PowerShow.com