Zpracov - PowerPoint PPT Presentation

1 / 21
About This Presentation
Title:

Zpracov

Description:

Zpracov n informac a znalost Datov struktury a algoritmy pro vyhled v n informac Doc. RNDr. Jan Rauch, CSc. Katedra informa n ho a znalostn ho ... – PowerPoint PPT presentation

Number of Views:44
Avg rating:3.0/5.0
Slides: 22
Provided by: Rauc6
Category:

less

Transcript and Presenter's Notes

Title: Zpracov


1
Zpracování informací a znalostí Datové struktury
a algoritmy pro vyhledávání informací
  • Doc. RNDr. Jan Rauch, CSc.
  • Katedra informacního a znalostního inženýrství

2
Datové struktury a algoritmy pro vyhledávání
informací
  • Literatura
  • Rauch, J. Metody zpracování informací II,
    kapitoly 13, 14
  • KUCERA, L. Kombinatorické algoritmy. Praha, SNTL
    1983, 280 str.
  • SALTON, G. - McGILL, M. Introduction to Modern
    Information Retrieval. Tokyo, McGraw-Hill Book
    Company Japan 1983, 448 s.

3
Datové struktury a algoritmy pro vyhledávání
informací
  • Základní pojmy
  • Sekvencní vyhledávání
  • Binární vyhledávání
  • Invertovaný soubor

4
Základní pojmy
  • záznam (bibliografický záznam)
  • pole
  • klíc je pole, podle jehož hodnoty vyhledáváme

.
Novák Vyhledávání informací GRADA 2000 pocítac,
tezaurus, knihovna
Kadlec Historie pocítacu PASEKA 1999 pocítac,
historie, DOS
Zounar Informacní služby UK 2001 pocítac,
tezaurus, knihovna

5
Základní pojmy
Hodnocení algoritmu - typická operace
(napr. porovnání klícu) - maximální pocet
typických operací - prumerný pocet
typických operací - složitost aktualizace
potrebných datových struktur - viz
literatura

6
Datové struktury a algoritmy pro vyhledávání
informací
  • Základní pojmy
  • Sekvencní vyhledávání
  • Binární vyhledávání
  • Invertovaný soubor

7
Sekvencní vyhledávání
Situace A - neusporádaný seznam N záznamu
(Autor - Název - Deskriptory obsahu), - muže
být více záznamu s jednou hodnotou klíce
(napr. více záznamu s jedním autorem) Úloha
Nalézt všechny záznamy se zadanou
hodnotou daného klíce (napr. všechny knihy,
jejichž autorem je Novák)
8
Sekvencní vyhledávání
Situace A (muže být více záznamu s jednou
hodnotou klíce) Príklad N záznamu


- Pocet potrebných
porovnání N - Aktualizace bez problému
Novák ABC...
Kadlec ZDU
Adam REP..
Novák XYZ
Zounar ZJK..
9
Sekvencní vyhledávání
Situace B - neusporádaný seznam záznamu - práve
jeden záznam pro danou hodnotu klíce (slovník
autoru) Úloha Nalézt záznam se zadanou hodnotou
klíce
10
Sekvencní vyhledávání
Situace B (práve jeden záznam pro danou hodnotu
klíce) Príklad N záznamu
Novák ABC...
Kadlec ZDU
Adam REP..
Jonáš XYZ
Zounar ZJK..

Po nalezení záznamu lze skoncit! Pocet porovnání
pro nalezení N záznamu 1 2 3 N N(N
1) / 2 Prumerný pocet porovnání na nalezení 1
záznamu (N 1) / 2 Aktualizace bez problému
11
Sekvencní vyhledávání
Situace C - neusporádaný seznam záznamu -
maximálne jeden záznam pro danou hodnotu klíce
(neúplný slovník autoru) Úloha Nalézt záznam
se zadanou hodnotou klíce
12
Sekvencní vyhledávání
Situace C (maximálne jeden záznam pro danou
hodnotu klíce) Príklad 5 záznamu
Novák ABC...
Kadlec ZDU
Adam REP..
Jonáš XYZ
Zounar ZJK..
K nenalezení autora Jonáše nutno 5 porovnání
(obecne N) Prumerný pocet porovnání na nalezení 1
záznamu nelze urcit, záleží na poctu hledání
nevyskytujících se autoru Maximální pocet
porovnání na nalezení 1 záznamu N (obecne)
Aktualizace bez problému
13
Modifikované sekvencní vyhledávání
  • - Práve jeden záznam pro danou hodnotu klíce
  • Známe pravdepodobnosti požadavku na
  • vyhledávání podle jednotlivých hodnot klíce

14
Modifikované sekvencní vyhledávání
autor Novák Kadlec Jonáš Kovár Zounar
Pravdepodobnost požadavku na vyhledání 0.2 0.04 0.4 0.06 0.3
Úsilí na vyhledání 0.2 1 0.04 2 0.4
3 0.06 4 0.3 5 3.22
Po prerovnání
autor Jonáš Zounar Novák Kovár Kadlec
Pravdepodobnost požadavku na vyhledání 0.4 0.3 0.2 0.06 0.04
Úsilí na vyhledání 0.4 1 0.3 2 0.2
3 0.06 4 0.04 5 2.04
15
Datové struktury a algoritmy pro vyhledávání
informací
  • Základní pojmy
  • Sekvencní vyhledávání
  • Binární vyhledávání
  • Invertovaný soubor

16
Binární vyhledávání
Príklad Vyhledáváni osob podle rodných císel
hledáme ženu s rodným císlem
736021/0054 I) Usporádáme záznamy podle
velikosti (císla nevidíme)

741212/0053
725612/7865
730930/0067
737214/0012
736021/0054
17
Binární vyhledávání
Príklad Vyhledáváni osob podle rodných císel
hledáme ženu s rodným císlem
736021/0054 Princip rešení I) Usporádání do
pole (napr. vzestupne) podle rodných císel II)
Pulení intervalu - Inicializace interval
celé pole - Vyhledávanou hodnotu porovnáme s
prostredním záznamem intervalu
... nalezeno, konec lt ... dále hledáme v
první polovine intervalu gt ... dále
hledáme ve druhé poloviné intervalu -
Interval nelze rozpulit nenalezeno, konec

18
Binární vyhledávání
Maximální pocet potrebných porovnání úmerný
Log2(N1) Aktualizace Složitá, treba zachovat
usporádání, viz doplnkovou literaturu.

19
Porovnání sekvencního a binárního vyhledávání
Predpoklady - jeden záznam pro danou
hodnotu klíce, - 1 operace 1/1000 vteriny.
pocet prumerný prípad pro
nejhorší prípad pro záznamu sekvencní
vyhledávání binární vyhledávání
operací cas (vteriny) operací
cas (vteriny)
31 16 0.016
5 0.005 119
60 0.060
7 0.007 1 999 1 000
1 11 0.011
9 999 5 000 5
14 0.014 999 999 500
000 500 20
0.020
20
Datové struktury a algoritmy pro vyhledávání
informací
  • Základní pojmy
  • Sekvencní vyhledávání
  • Binární vyhledávání
  • Invertovaný soubor

21
Invertovaný soubor
Invertovaný soubor MZI II kapitola 14
oprava MZI II, str. 83 má být
místo
Write a Comment
User Comments (0)
About PowerShow.com