Bilgi Erisim Sorunu - PowerPoint PPT Presentation

About This Presentation
Title:

Bilgi Erisim Sorunu

Description:

Bilgi Eri im Sorunu Ya ar Tonta Hacettepe niversitesi tonta_at_hacettepe.edu.tr yunus.hacettepe.edu.tr/~tonta/ BBY220 Bilgi Eri im lkeleri Plan Bilgi art ... – PowerPoint PPT presentation

Number of Views:119
Avg rating:3.0/5.0
Slides: 90
Provided by: yunusHace7
Category:
Tags: bilgi | erisim | sorunu

less

Transcript and Presenter's Notes

Title: Bilgi Erisim Sorunu


1
Bilgi Erisim Sorunu
Yasar Tonta Hacettepe Üniversitesi tonta_at_hacettepe
.edu.tr yunus.hacettepe.edu.tr/tonta/ BBY220
Bilgi Erisim Ilkeleri
2
Plan
  • Bilgi artisi
  • Bilgi erisim sorunu
  • Tanim
  • Bilgi erisim sistemlerinin mantiksal yapisi
  • Erisim kurallari
  • Performans ölçümleri
  • Bilgi erisim ve Internet

3
Bilgi Toplumuna Giden Yol
Toffler (1981)
4
Bilginin Degisen Rolü
  • Tarim Toplumunda bilgi sorun çözmede yardimci
    olan kritik bir girdi idi
  • Sanayi Toplumunda ticari bir ürün, en temel
    ekonomik kaynak, kalkinmanin can damari haline
    gelen bilgi çözümün kendisi oldu.
  • Bilgi Toplumunda ise yaratilabilecek,
    iletilebilecek, depolanabilecek sinirsiz bilgi
    giderek bir sorun haline gelmeye basladi.

(http//discovery.cofc.edu/about.html).
5
Bilgi Teknolojisi Dünyayi Nasil Degistiriyor?
  • Esli, aygittan aygita ag baglantisi
  • Her aygit ve uygulamada kesin yerel mekan bilgisi
    de gömülü
  • Sicaklik, hareket, basinç, hizlanma, akis,
    elektrik kullanimi, isinim, kimyasal kompozisyonu
    ölçen algilama aygitlarinin bütünlestirilmesi

Source Gage, 2002
6
Bilgi Ekonomisi
  • Ekonomi Kit kaynaklarin tahsisi
  • . . . Bilginin yeni rolü tam olarak
    degerlendirilmeden, zenginligin rolü konusundaki
    hiçbir tahmin tutarli olmayacaktir.
  • . . . Isleri hizlandirarak zamanla iliskimizi
    degistirdigimizde, bilginin bir bölümünü
    kaçinilmaz bir sekilde eskitiyoruz. Dolayisiyla,
    etrafimizda sürükledigimiz eski bilgi miktarini
    artiriyoruz.

Toffler, Zenginlik Devrimi, s. 185-6
7
Bilgi . . .
  • Bilgi depolama ortamlari
  • beyin, kültürel birikim, dis ortamlar
  • Bilgi iletim ortami
  • dagitik aglar 14 saniyede Kongre Kütüphanesinin
    içerigini bir yerden bir yere iletmek mümkün
  • Bilgi isleme ortamlari
  • beyin, bilgisayarlar, insanlardan daha akilli
    makineler, yapay beyin

8
Depolama Maliyetleri
Kaynak http//www.berghell.com/whitepapers/Storag
e20Costs.pdf
9
Depolama Maliyetleri
Fiyatlar her yil 45 düsüyor
421 USD
0,42 USD
Kaynak http//www.berghell.com/whitepapers/Storag
e20Costs.pdf
10
Iletim Maliyetleri
Kaynak ULAKBIM Faaliyet Raporu, 2003
(www.ulakbim.gov.tr/hakkimizda/faaliyet/faaliyet03
.uhtml)
11
Bilgi Patlamasi - 2002
  • 5 Exabyte (5 x 1018 byte)
  • 2002de dünyada üretilen yeni bilgi miktari (5 x
    1018 byte)
  • 5 Exabytelik bilgi 37,000 yeni Kongre
    Kütüphanesi!
  • Yüzey webde yaklasik 100 milyar belge var (1670
    Terabyte) var
  • Derin webde 550 milyar belge var(di) (91857
    Terabyte)
  • Kaynak BrightPlanet Lyman and Varian

12
Bir Exabyte (EB) ne kadar büyük?
Kilobyte (KB) 1,000 bytes OR 103bytes
Kilobyte (KB) 2 Kilobytes A Typewritten page.
Kilobyte (KB) 100 Kilobytes A low-resolution photograph.
Megabyte (MB) 1,000,000 bytes OR 106 bytes
Megabyte (MB) 1 Megabyte A small novel OR a 3.5 inch floppy disk.
Megabyte (MB) 2 Megabytes A high-resolution photograph.
Megabyte (MB) 5 Megabytes The complete works of Shakespeare.
Megabyte (MB) 10 Megabytes A minute of high-fidelity sound.
Megabyte (MB) 100 Megabytes 1 meter of shelved books.
Megabyte (MB) 500 Megabytes A CD-ROM.
Gigabyte (GB) 1,000,000,000 bytes OR 109 bytes
Gigabyte (GB) 1 Gigabyte a pickup truck filled with books.
Gigabyte (GB) 20 Gigabytes A good collection of the works of Beethoven.
Gigabyte (GB) 100 Gigabytes A library floor of academic journals.
Terabyte (TB) 1,000,000,000,000 bytes OR 1012 bytes
Terabyte (TB) 1 Terabyte 50000 trees made into paper and printed.
Terabyte (TB) 2 Terabytes An academic research library.
Terabyte (TB) 10 Terabytes The print collections of the U.S. Library of Congress.
Terabyte (TB) 400 Terabytes National Climactic Data Center (NOAA) database.
Petabyte (PB) 1,000,000,000,000,000 bytes OR 1015 bytes
Petabyte (PB) 1 Petabyte 3 years of EOS data (2001).
Petabyte (PB) 2 Petabytes All U.S. academic research libraries.
Petabyte (PB) 20 Petabytes Production of hard-disk drives in 1995.
Petabyte (PB) 200 Petabytes All printed material.
Exabyte (EB) 1,000,000,000,000,000,000 bytes OR 1018 bytes
Exabyte (EB) 2 Exabytes Total volume of information generated in 1999.
Exabyte (EB) 5 Exabytes All words ever spoken by human beings.
Kaynak How much information 2003, Tablo 1.1
13
Bilgi Artisi
Tablo 1. 2002de dünyada üretilen özgün dijital bilgi üretimi. Iyimser tahminlerde bilginin dijital olarak tarandigi varsayildi, alt tahminlerde dijital içerigin sikistirildigi varsayildi. Tablo 1. 2002de dünyada üretilen özgün dijital bilgi üretimi. Iyimser tahminlerde bilginin dijital olarak tarandigi varsayildi, alt tahminlerde dijital içerigin sikistirildigi varsayildi. Tablo 1. 2002de dünyada üretilen özgün dijital bilgi üretimi. Iyimser tahminlerde bilginin dijital olarak tarandigi varsayildi, alt tahminlerde dijital içerigin sikistirildigi varsayildi. Tablo 1. 2002de dünyada üretilen özgün dijital bilgi üretimi. Iyimser tahminlerde bilginin dijital olarak tarandigi varsayildi, alt tahminlerde dijital içerigin sikistirildigi varsayildi. Tablo 1. 2002de dünyada üretilen özgün dijital bilgi üretimi. Iyimser tahminlerde bilginin dijital olarak tarandigi varsayildi, alt tahminlerde dijital içerigin sikistirildigi varsayildi. Tablo 1. 2002de dünyada üretilen özgün dijital bilgi üretimi. Iyimser tahminlerde bilginin dijital olarak tarandigi varsayildi, alt tahminlerde dijital içerigin sikistirildigi varsayildi.
Depolama ortami 2002 Üst tahmin (Terabyte olarak) 2002 Alt tahmin (Terabyte olarak) 1999-2000 Üst tahmin 1999-2000 Alt tahmin Degisim Üst tahminler
Kâgit 1,634 327 1,200 240 36
Film 420,254 76,69 431,690 58,209 -3
Manyetik 5187130 3,416,230 2,779,760 2,073,760 87
Optik 103 51 81 29 28
TOPLAM 5,609,121 3,416,281 3,212,731 2,132,238 74.5
Kaynak Lyman ve Varian
14
(No Transcript)
15
Bilgi Miktari
  • 5,4 Exabyte (milyar x milyar byte 54 milyar
    Economist dergisinin içerigine esit)
  • ABDde her yil 80 milyar fotograf çekiliyor
  • 2 milyar röntgen filmi çekiliyor
  • Günde 610 milyar e-posta mesaji gönderiliyor
  • Her yil 15 trilyon sayfa yazicilardan çikti
    aliniyor

16
Bilgi Patlamasi - 2006
http//www.emc.com/about/destination/digital_unive
rse/pdf/Expanding_Digital_Universe_IDC_WhitePaper_
022507.pdf
17
5 Exabayt ? 161 Exabayt
http//www.emc.com/about/destination/digital_unive
rse/pdf/Expanding_Digital_Universe_IDC_WhitePaper_
022507.pdf
18
Depolama Kapasitesi
http//www.emc.com/about/destination/digital_unive
rse/pdf/Expanding_Digital_Universe_IDC_WhitePaper_
022507.pdf
19
The Horizon Report
  • Cep telefonlari
  • Bulut hesaplama / (cloud computing)
  • Mekansal bilgiler
  • Kisisel web
  • Anlama dayali uygulamalar
  • Akilli nesneler (nesnelerin Interneti)

http//net.educause.edu/ir/library/pdf/CSD5612.pdf

20
Bilgi Edinme Platformu Olarak Web
Kaynak http//www.oreillynet.com/pub/a/oreilly/tim
/news/2005/09/30/what-is-web-20.html
21
Web 2.0 Nedir?
Source http//www.oreillynet.com/pub/a/oreilly/ti
m/news/2005/09/30/what-is-web-20.html
22
Web 2.0 Tanimi
  • Yaraticiligi artirmayi, bilgi paylasimini ve en
    önemlisi kullanicilar arasindaki isbirligini
    amaçlayan Web teknolojisi ve web tasarimi.
  • Sosyal ag siteleri, wikiler, günlükler (blogs)
    ve folksonomiler gibi Web tabanli topluluklarin
    ve barindirilan hizmetlerin gelismesi ve
    evrimlesmesi

Kaynak http//en.wikipedia.org/wiki/Web_2.0
23
Web 2.0 Özellikleri
  • Platform olarak Web
  • Kullanici katilimi yoluyla ortak akil
  • Dinamik içerik
  • Paketlenmis yazilim yerine hizmetler
  • Hafif programlama modelleri
  • Web standartlari ve ölçeklenebilirlik
  • Zengin kullanici deneyimi
  • açiklik
  • özgürlük

Kaynak OReilly (2005) http//en.wikipedia.org/
wiki/Web_2.0
24
Sosyal Aglar Yeni Web Portallari
  • Sosyal aglar Web içinde webler
  • Web 2.0 kullanarak sosyallesme arti tek noktadan
    çesitli hizmetler sagliyor
  • Facebookta 52,000 farkli uygulama var
  • Yahoo!, Google ve Facebookta kullanicilar sadece
    Ekim 2008de 200 milyar dakika (139 milyon gün)
    harcamislar
  • Googlein misyonu dünyanin içerigini
    düzenlemek, sosyal aglarinki ise dünyanin
    insanlarini
  • Amaç sanal güzergahlar olusturmak degil baglanti,
    iletisim ve içerigi birlestirerek yildiz kümeleri
    olusturmak

25
Bulduklarimiz kim oldugumuzu belirliyor
26
Morville ve Bilgi Teknolojileri
  • Cep telefonu-el bilgisayari küresel iletisim ve
    bilgi aglarina erisim (kablosuz e-posta,
    mesajlasma ve web tarama kolayliklari)
  • Bilgiye erisim için yeni arayüz ve araçlarin
    gelistirilmesi
  • Dijital aglar araciligiyla kisi, yer, ürün ve
    mülk bilgilerine erisim (s.1-2)

27
Delicious Library
  • iMac ve FireWire dijital video kamerasi
    çokluortam kataloglama sistemine dönüsüyor.
  • Herhangi bir kitap, film, CD, video oyunu
    üzerindeki çubuklu kodu okuttugunuzda webden
    toplanan tonlarca bilgiyle birlikte
    kitabin/CDnin vs. kapagi dijital rafinizda
    yerini aliyor.
  • Bu seksi, mekanin farkinda olan, esli (peer to
    peer) kisisel ödünç verme kütüphanesi
    koleksiyonunuzu arkadaslariniz ve komsularinizla
    paylasmaniza izin verir.
  • RFID teknolojisi stok kontrolü kolaylastiriyor.
    (s. 3-4)
  • Vücudunuza gömülen yongalar kimliginizi, nerede
    oldugunuzu ve bankadaki hesabinizda kaç para
    oldugunu biliyor.

28
Dijital Vatandaslik Testi
  1. Bunu okuyabilir misiniz? kdz n colleG? ms em? U2
    cn lrn txtN
  2. Ipodunuz (çocuklariniz ya da torunlarinizin
    degil) var mi?
  3. Wiii denediniz mi? En çok hangi oyunu
    begendiniz?
  4. Akilli telefon kullaniyor musunuz (yani, e-posta,
    video, fotograf özellikleri olan )?
  5. Aninda mesaj (IM) kullaniyor musunuz? Blog
    kullaniyor musunuz? Blogdan ne ögreniyorsunuz?
  6. Lonely Girl 15in kim oldugunu biliyor musunuz?
  7. TV olmadan TV programlarini izlemek için üç
    popüler yol önerebilir misiniz?
  8. Hiç Starbucksta WiFi kullandiniz mi?
  9. Mashup sitelerinin önemini biliyor musunuz?
    Mash Up yarismasina katildiniz mi?
  10. MID ne demektir?
  11. Sharepoint mi yoksa Wiki mi daha fazla isbirligi
    olanagi saglar? Aralarindaki fark nedir?

Kaynak Fred Stein, Digital Immigrants, Digital
Natives and the Information Age
28
29
Dijital Yerliler
  • Bilgiye hizli erisim
  • Paralel isleme
  • Metin yerine grafik
  • Rastgele erisim (hipermetin)
  • Sürekli ag üzerinde
  • Oyunlar

30
Dijital Göçmenler
31
Dijital Göçmenler Dijital Yerliler Örnegi
Dijital Göçmenler
Dijital göçmen-dijital yerli spektrumunda
neredesiniz?
  • Bilgiyi kisisellestirmek için Mashuplari
    kullaniyor
  • Uygulamalar için Pipes i kullaniyor
  • Webi kisisellestirmek için RSS kullaniyor

Webe bagli tasinabilir MP3 çalar
E-posta/adi posta kavramiyla mücadele halinde
Wiki veya bloglar hakkinda hiçbir fikri yok
Baglantili olmayi varsayar ve
gerektirir Isteklere cevap verirler Gezgin
sosyal yazilim kullanirlar
Kablosuz resim ve TV telefonlari Aninda
baglantililik
DYler niçin Sosyal Aglardan hoslanirlar? DYler
niçin Sosyal Bookmarklari kullanirlar?
Kablosuz telefon bilgisayar oluyor (Eposta,
Web IM . Video vs)
Kablosuz haritali el bilgisayarlari
Tamamen bagli.. tamamen dijital birden çok
görevi yapabilir tamamen gezgin (veri,
görüntü, ses) ...Uzunçalar/plak nedir
bilmezler
Dijital Yerli
31
Kaynak Fred Stein, Digital Immigrants, Digital
Natives and the Information Age
32
Dijital Yerliler, Dijital Göçmenler
Different kinds of experiences lead to different
brain structures. -Dr. Bruce D. Berry, Baylor
College of Medicine
http//www.marcprensky.com/writing/Prensky20-20D
igital 20Natives,20Digital20Immigrants20-20Pa
rt1.pdf
Children raised with the computer think
differently from the rest of us. They develop
hypertext minds. They leap around. Its as though
their cognitive structures were parallel, not
sequential. . . . Linear thought processes that
dominate educational systems now can actually
retard learning for brains developed through
game and Web-surfing processes on the computer.
http//d.scribd.com/docs/25yfw2gwramobinjk3vt.pdf
33
Google Bizi Aptallastiriyor mu?
Webden ya da basili uzunca bir makaleyi okuma
ve anlama yetenegimi hemen hemen tamamen
kaybettim. Bruce Freedman
34
Kütüphaneler. . .
35
Web 2.0 Library Library 2.0 (Miller, 2005)
  • Library 2.0 kütüphane dünyasinda hizmetlerin
    kullanicilara sunulmasindaki geçisi
    yansitmaktadir
  • Library 2.0 geribildirim vermeye ve katilmaya
    cesaretlendirerek kütüphane hizmetlerinin
    tasarimi ve kurulumunda kütüphane kullanicisina
    da rol vermek
  • Library 2.0 modeli çift yönlü hizmet sunar ve
    kullanicidan kütüphaneye bilgi akisini artirir.

Source http//en.wikipedia.org/wiki/Library_2.0
36
Bilgi Edinme Platformu olarak Library 2.0
Kaynak http//www.flickr.com/photos/42538191_at_N00/
113222147/
37
Library 2.0de kullanilan Web 2.0 teknolojileri
  • Dagitim
  • RSS
  • Wiki
  • Blog
  • Podcast
  • Aninda
  • mesajlasma
  • Twitter
  • Sosyal aglar (Folksonomiler)
  • Basit APIler
  • Mashup/Remixes
  • Yogunlasma
  • Google
  • Amazon
  • Flickr
  • Facebook
  • Kütüphane yönetim çevresi
  • Kullanici verisi
  • Etiketler
  • Derlemeler
  • Dolasim
  • Tiklamalar

Source http//orweblog.oclc.org/archives/001556.h
tml
38
Kullanici ve Kütüphane Çevreleri Birbirinin Içine
Geçmis
Kaynak http//orweblog.oclc.org/archives/001556.h
tml
39
Second Life
40
Second Life
41
OCLC WorldCat Facebook içinden taranabilir
42
Herkes OCLC WorldCat hesabi açabilir
WorldCat tavsiyeleri
43
OCLC WorldCat katalogunda search engines
44
OCLC WorldCat katalogunda tonta
45
Kitabin bulundugu kütüphaneler
46
Farkli atif stillerine göre kitabin gösterimi
47
Kaydin Endotea aktarilmasi
48
Kullanicinin yarattigi listelere kaydedilmesi
49
Paylasim
50
OCLC WorldCat kullanicilarin ekledigi bilgiler .
. . Tagler
Kayitli kullanicilar kendi taglerini
ekleyebilirler
51
. . . Eklenen tagler OCLC WorldCat kaydinin bir
parçasi oluyor
Eklenen tagler
52
OCLC WorldCat kullanicinin ekledigi Notlar
Not
53
. . . Notlar kaydin bir parçasi oluyor
Içindekiler eklenebilir
54
Kullanici tarafindan eklenen Içinekiler sayfasi .
. .
Içindekiler (kes-yapistir ile)
55
. . . Içindekiler kaydin bir parçasi oluyor
56
Kayda kitap elestirisi eklenebilir
Kitap elestirisi
57
Elestirinin URL adresi
Türk Kütüphaneciliginde çikan elestirinin URL
adresi
58
OCLC WorldCatte yazarin diger kitaplari
Diger kitaplar
59
Ortak yazarlar
60
OCLC WorldCat kitaplarla sinirli degil
Dergi makalesi
Internet kaynaklari
61
Kayit isaretlenebilir ve paylasilabilir
62
Sosyal isaretleme sistemleri
63
Google Bookmark
Google Bookmark olarak eklenebilir
64
bookmark delicious üzerinde kaydedilebilir
65
http//delicious.com/ytonta
66
Kayit Facebook hesabinizdaki duvarinizda. . .
67
. . . Açiklayici bir notla birlikte
yayimlanabilir. . .
68
Böylece kullanicinin Facebook arkadas
listesindeki herkes bu notu görebilir
69
Bilgi kaynaklari Insanlarin bilgi kaynaklariyla
ve birbirleriyle iliskileri
  • Googlein misyonu dünyanin içerigini
    düzenlemek, sosyal aglarinki ise dünyanin
    insanlarini
  • Bilgi erisim artik sadece bilgi kaynaklari
    merkezli olmamali, insanlar arasindaki iliskilere
    de odaklanmali (kaynak merkezli iliski merkezli
    yaklasim) (Lagoze, 2000)
  • Kisisellestirme
  • Tavsiye sistemleri
  • Standart içerikle kullanicinin yarattigi içerigin
    birlestirilmesi
  • Web 3.0 Social semantic Web

70
http//yunus.hacettepe.edu.tr/tonta/yayinlar/
http//yunus.hacettepe.edu.tr/tonta/yayinlar/tont
a-belgrade-2008-full-text-son.pdf
http//yunus.hacettepe.edu.tr/tonta/yayinlar/tont
a-lcats-2008.pdf
71
Bilgi Erisim SorunuTanim ve Tarihçe
Yasar Tonta Hacettepe Üniversitesi tonta_at_hacettepe
.edu.tr yunus.hacettepe.edu.tr/tonta/ BBY220
Bilgi Erisim Ilkeleri
72
Bilgi Erisim Tanimi
  • bilgi toplama, siniflama, kataloglama, depolama,
    büyük miktardaki verilerden arama yapma ve bu
    verilerden istenen bilgiyi üretme (veya gösterme)
    teknigi ve süreci

73
Bilgi Erisim Sorunu
  • Wells, World Encyclopedia (1936)
  • Bush, As we may think, Atlantic Monthly,
    (1945)
  • Memex (memory expansion)
  • bilgi erisim (IR) teriminin ilk kez kullanimi
    (Calvin Mooers, 1952)
  • Otomatik dizinleme KWIC/KWOC (Luhn, 1958)
  • Boole modeli (Lockheed, 1960lar)
  • Mantiksal model (Mooers, Cooper Maron, Van
    Rijsbergen, 1960- )
  • Olasilik modeli (Maron-Kuhns, 1960
    Robertson-Jones, 1976 Robertson-Maron-Cooper,
    1982 Croft, 1979 )
  • Vektör uzayi modeli (Gerard Salton, 1961)
  • Istatistiksel agirliklandirma (tfidf, 1970ler)
  • Dil modelleri (Ponte-Croft, 1998)
  • Performans ölçümleri
  • Cranfield, Medlars, SMART, STAIRS, TREC, 1960-
    (Cleverdon, Lancaster, Salton, Blair-Maron,
    Harman)

74
Memex ve Türkler
  • The owner of the memex, let us say, is
    interested in the origin and properties of the
    bow and arrow. Specifically he is studying why
    the short Turkish bow was apparently superior to
    the English long bow in the skirmishes of the
    Crusades. He has dozens of possibly pertinent
    books and articles in his memex. First he runs
    through an encyclopedia, . . . Thus he goes,
    building a trail of many items. . . Thus he
    builds a trail of his interest through the maze
    of materials available to him.And his trails do
    not fade. Several years later, his talk with a
    friend turns to the queer ways in which a people
    resist innovations, even of vital interest. He
    has an example, in the fact that the outraged
    Europeans still failed to adopt the Turkish bow.
    In fact he has a trail on it. A touch brings up
    the code book. . . . It is an interesting trail,
    pertinent to the discussion. So he sets a
    reproducer in action, photographs the whole trail
    out, and passes it to his friend for insertion in
    his own memex, there to be linked into the more
    general trail.

?
75
Bilgi Erisimin Entellektüel Temelleri
  • Sistem felsefesi
  • Bilim felsefesi
  • Dil felsefesi

76
Dil Felsefesi ve Bilgi Erisim
  • Bilgi düzenleme ve bilgi erisim de dil
    kullaniminin özel bir türü
  • Sistematik dizinleme (J. Otto Kaiser)
  • Dilbilimsel yapilar
  • Sözdagari
  • Anlambilim
  • Sözdizimi
  • Kataloglama, siniflama, dizinleme

77
Siniflama Kurami
  • Siniflama dile dayaniyor
  • Dil belirsizlikler içeriyor
  • Kavramlar üzerinde anlasma saglamak zor
  • Domates meyve mi sebze mi?
  • George Lakoff, Women, Fire and Dangerous Things
  • Alternatif tip hangi konuya girer?
  • Felsefe?
  • Din?
  • Saglik ve tip?

78
Well, it all started with an unsuccessful
subject search
79
Bilgi Erisimin Temel Ikilemi
  • Hakkinda bilgi bulmak için bilmedigin bir seyi
    tanimlama geregi (Hjerrpe)

80
Bilgi Kesfetme, Tanimlama, Düzenleme ve Erisim
Kesfetme
Kesfetme
Tanimlama
Tanimlama
Düzenleme
Düzenleme
Erisim
Erisim
81
Belge Erisim Sisteminin Mantiksal Düzenlemesi
Belgeler
Kullanicilar
Gömü - Sözlük
Sorgu formülasyonu
Dizinleme
Dizin tutanaklari
Formel sorgu cümlesi
Erisim kurali
Kaynak Maron, 1984
82
Ideal Bilgi Erisim Sistemi
  • Ilgili belgelerin tümüne ve salt ilgili belgelere
    erisim saglamali
  • Ilgililik kavrami
  • Nesnel ilgililik
  • Öznel ilgililik
  • Birbirine benzeyen bilgileri bir araya getirmek,
    benzemeyenleri ayirmak

83
Erisim Kurallari
Boole mantigi
Set kuramina dayaniyor. Boole isleçleri VE,
VEYA, DEGIL- kullaniliyor
Vektör uzayi modeli
tk k teriminin belgedeki degeri qk k
teriminin sorgudaki degeri
?(D,Q) ?(tkxqk) / ??(tk)2 x ??(qk) 2
Olasilik modeli
P (ilgili) n / N P(? ilgili) 1 P(ilgili)
N n / N
n ilgili belge sayisi N toplam belge sayisi
Istatistiksel agirliklandirma (tfidf)
Agirliklandirma ilkesi Ilgili belgelerde sik AMA
derlemin tamaminda seyrek geçen terimleri daha
yüksek agirliklandir
?
84
Benzerlik Skorunun Hesaplanmasi


Pekmez
Slide 38 of 79
?
Zile
http//www.sims.berkeley.edu/courses/is296a-3/f98/
lectures/ir-background/sld038.htm
85
Bilgi Erisim Sistemleri Mükemmel Degil!
Bilgi Erisim Sistemleri Mükemmel Degil!
N
y
v
u
x
ILGILI
ERISILEN
u tipi hatalar
v tipi hatalar
86
Bilgi Erisim Performansi
ILGILI ILGISIZ
ERISILEN x u n1
ERISILE-MEYEN v y
n2
N
y
v
u
x
ILGILI
ERISILEN
Duyarlik x / n1 Erisilen ilgili belgelerin
erisilen tüm belgelere orani
Anma x / n2 Erisilen ilgili belgelerin tüm
ilgili belgelere orani
Posa u / u y Erisilen ilgisiz belgelerin tüm
ilgisiz belgelere orani
Genellik n2 / N Tüm dermedeki ilgili belgelerin
orani
87
Diger Performans Ölçümleri
  • Kapsama Orani Rk / U
  • Gerçekte erisilen ilgili belgelerin kullanicinin
    ilgili oldugunu önceden bildigi belgelere orani
  • Yenilik Orani Ru / Ru Rk
  • Gerçekte erisilen ilgili belgelerin kullanicinin
    ilgili oldugunu önceden bilmedigi belgelere orani
  • U kullanicinin ilgili oldugunu önceden bildigi
    belgeler seti
  • Rk Erisilen ve kullanicinin önceden ilgili
    oldugunu bildigi belgelerin sayisi
  • Ru Erisilen ve kullanicinin önceden ilgili
    oldugunu bilmedigi belgelerin sayisi

88
Normallestirilmis Siralama
Siralama 1 2 3 4 5 6 7 8 9
Sira1 - - - -
Sira2 - - - -
Sira3 - - - -
Duyarlik üç arama için de 5/9
Hangisini tercih edersiniz?
89
Yetersizlik Aksiyomlari I
  • Bir bilgi ihtiyaci baglamdan bagimsiz olarak
    ifade edilemez.
  • Bir makineye bir soruyu uygun arama terimlerine
    çevirmesini ögretmek olanaksizdir.
  • Bir belgenin ilgili olup olmamasi görülen diger
    belgelere baglidir.
  • Bütün ilgili belgelerin bulunup bulunmadigini
    dogrulamak asla mümkün degildir.
  • Makineler anlami taniyamaz -gt entellektüel
    dizinleme kadar basarili degildir, vs.

90
Yetersizlik Aksiyomlari II
  • Sözcük sikligi istatistikleri ne anlami temsil
    edebilir, ne de anlam yerine geçebilir.
  • Bir bilgi erisim sisteminin bir tekrarli süreci
    destekleme yetenegi insanlar tarafindan sadece
    bir kez yapilan ilgililik degerlendirmesiyle
    degerlendirilemez.
  • Ya saglam ilgililik degerlendirmesi ya da çok
    etkili mekanik süreçlere sahip olabilirsiniz, ama
    ikisine birden asla.
  • Yani, tutarli bir sekilde etkin olan tamamen
    otomatik dizinleme ve erisim mümkün degildir.

Kaynak Swanson, 1988
91
Internet
  • Zaman ve mekân engelinin ortadan kalkmasi
  • Bilgi kaynaklarina ve hizmetlerine günde 24 saat
    haftada 7 gün uzaktan erisim
  • Aninda memnuniyet

92
Bilgi Erisim ve Internet...
  • Yangin hortumundan su içmek
  • Dijital belgeler devingen, sinirlari belirsiz,
    kendi kendini degistirebilen belge
  • Dizinleme ve bilgi erisim teknikleri yetersiz
  • Erisim dogrusal ve hantal
  • Insan beyninde ise dizinleme ve erisim
    bagintili
  • Acaba yakin gelecekte taklit edilebilir mi?
  • Ses, koku, vs. bilgisine erisim?
  • Beyin disinda kayitli bilgiler insanin düsünme ve
    sorun çözme gücünün bir parçasi haline
    getirilebilir mi?

93
Bilgi Erisim Sorunu
Yasar Tonta Hacettepe Üniversitesi tonta_at_hacettepe
.edu.tr yunus.hacettepe.edu.tr/tonta/ BBY220
Bilgi Erisim Ilkeleri
Write a Comment
User Comments (0)
About PowerShow.com