Medizinische Statistik und Informationsverarbeitung - PowerPoint PPT Presentation

About This Presentation
Title:

Medizinische Statistik und Informationsverarbeitung

Description:

Medizinische Statistik und Informationsverarbeitung Quade Institut f r Medizinische Statistik, Dokumentation und Datenverarbeitung Quade – PowerPoint PPT presentation

Number of Views:198
Avg rating:3.0/5.0
Slides: 54
Provided by: Dr231006
Category:

less

Transcript and Presenter's Notes

Title: Medizinische Statistik und Informationsverarbeitung


1
Medizinische Statistik und Informationsverarbeitun
g
Quade Institut für Medizinische
Statistik, Dokumentation und Datenverarbeitung
Quade
2
Netzwerke
Netzwerke verbinden Computer untereinander. Verein
barungen für den Informationstransport und
-Austausch nennt man Protokolle. Netzwerke
werden nach dem OSI Referenzmodell in 7 Schichten
eingeteilt. Dabei nimmt die unterste Schicht
großen Einfluß auf die Leistungsdaten eines
Netzwerkes.
Quade
3
(No Transcript)
4
Quade
5
Netzwerke
  • In einem lokalen physikalischen Netzwerk
    erkennen sich die Teilnehmer mittels der
    MAC-Adresse (Media Access Control (Schicht 2 des
    OSI Referenz Modells)) der Netzwerk Karte (arp a
    unter Windows).
  • Die Abbildung in die uns bekannte IP-Adresse
    geschieht mittels des Adress Resolution
    Protokolls (ARP)

6
IP-Netzwerkadressen
  • Eine IP-Adresse besteht aus 4 Zahlen zwischen 0
    und 255. Die Netzwerkmaske (z.B. 255.255.x.x)
    bestimmt den Netzwerkteil und den Knotenteil. Die
    höchste und die niedrigste Knotenadresse ist
    jeweils für Broadcasts reserviert. Alle Rechner
    im Netzwerk lauschen auf den Broadcast-Adressen.

7
IP-Netzwerke
  • Ip-Netz 131.220.23.0 Broadcast 0 255
  • Maske 255.255.255.0 oder /24
  • 131.220. 23 . 0
  • IP-Binär 131.220. 0001 0111 . 0000 0000
  • Maske 255.255. 1111 1111 . 0000 0000
  • 255.255. 255 . 0
  • Daher können sich Rechner mit den IP-Adressen
    131.220.23.1 bis 131.220.23.254 in einem lokalen
    Netzwerk sehen.

8
Befehle um die Netzwerkkonfiguration zu sehen
  • ipconfig
  • Windows-IP-Konfiguration
  • Ethernetadapter Drahtlose Netzwerkverbindung
  • Medienstatus. . . . . . . . . . . Es
    besteht keine Verbindung
  • Ethernetadapter LAN-Verbindung
  • Verbindungsspezifisches DNS-Suffix
    meb.uni-bonn.de
  • IP-Adresse. . . . . . . . . . . .
    172.30.1.70
  • Subnetzmaske. . . . . . . . . . .
    255.255.255.0
  • Standardgateway . . . . . . . . .
    172.30.1.254

9
Befehle um die Netzwerkkonfiguration zu sehen
  • netstat -a
  • Aktive Verbindungen
  • Proto Lokale Adresse Remoteadresse
    Status
  • TCP Quade-T60epmap Quade-T600
    ABHÖREN
  • TCP Quade-T60microsoft-ds Quade-T600
    ABHÖREN
  • TCP Quade-T602869 Quade-T600
    ABHÖREN
  • TCP Quade-T605800 Quade-T600
    ABHÖREN
  • TCP Quade-T605900 Quade-T600
    ABHÖREN
  • TCP Quade-T606060 Quade-T600
    ABHÖREN
  • TCP Quade-T6010243 Quade-T600
    ABHÖREN
  • TCP Quade-T6031038 Quade-T600
    ABHÖREN
  • TCP Quade-T601036 Quade-T600
    ABHÖREN
  • TCP Quade-T601090 localhost27015
    HERGESTELLT
  • TCP Quade-T601168 localhost1169
    HERGESTELLT
  • TCP Quade-T601169 localhost1168
    HERGESTELLT

10
Befehle um die Netzwerkkonfiguration zu sehen
  • netstat -b
  • Aktive Verbindungen
  • Proto Lokale Adresse Remoteadresse
    Status PID
  • TCP Quade-T601090 localhost27015
    HERGESTELLT 6020 iTunesHelper.exe
  • TCP Quade-T603289 localhost3290
    HERGESTELLT 6108 Netscp.exe
  • TCP Quade-T603290 localhost3289
    HERGESTELLT 6108 Netscp.exe
  • TCP Quade-T604844 localhost4845
    HERGESTELLT 5016 firefox.exe
  • TCP Quade-T604845 localhost4844
    HERGESTELLT 5016 firefox.exe
  • TCP Quade-T604847 localhost4848
    HERGESTELLT 5016 firefox.exe
  • TCP Quade-T604848 localhost4847
    HERGESTELLT 5016 firefox.exe
  • TCP Quade-T6027015 localhost1090
    HERGESTELLT 712 AppleMobileDeviceService
    .exe
  • TCP Quade-T605152 localhost1088
    SCHLIESSEN_WARTEN 3004 jqs.exe

11
Befehle um die Netzwerkkonfiguration zu sehen
  • netstat -ano
  • Aktive Verbindungen
  • Proto Lokale Adresse Remoteadresse
    Status PID
  • TCP 0.0.0.080 0.0.0.00
    ABHÖREN 7128
  • TCP 0.0.0.0135 0.0.0.00
    ABHÖREN 552
  • TCP 0.0.0.0445 0.0.0.00
    ABHÖREN 4
  • TCP 0.0.0.02869 0.0.0.00
    ABHÖREN 1076
  • TCP 0.0.0.05800 0.0.0.00
    ABHÖREN 2808
  • TCP 0.0.0.05900 0.0.0.00
    ABHÖREN 2808
  • TCP 0.0.0.06060 0.0.0.00
    ABHÖREN 684
  • TCP 0.0.0.010243 0.0.0.00
    ABHÖREN 2632
  • TCP 0.0.0.031038 0.0.0.00
    ABHÖREN 2024
  • TCP 127.0.0.11036 0.0.0.00
    ABHÖREN 1912

12
Befehle um die Netzwerkkonfiguration zu sehen
  • arp -a
  • Address HWtype HWaddress
    Flags Mask iface
  • www.dsmrsvpaed.de ether
    00163e579023 C br0
  • www.oncopaednki.de ether
    00163e579023 C br0
  • linkdb.meb.uni-bonn.de ether
    00163e35c15e C br0
  • famhap.meb.uni-bonn.de ether
    00163e35c15e C br0
  • www-dom0.meb.uni-bonn.d ether
    001517abaefe C br0
  • nmap 131.220.23.0/24
  • Interesting ports on Jumbo-dom0.meb.uni-bonn.de
    (131.220.23.181)
  • Not shown 998 closed ports
  • PORT STATE SERVICE
  • 22/tcp open ssh
  • 111/tcp open rpcbind
  • MAC Address 003048200CD4 (Supermicro
    Computer)

13
IP-Netzwerkklassen
  • Eine IP-Adresse ist zweigeteilt und zwar in einen
    Netzwerkteil und einen Knotenteil. Der
    Netzwerkteil ist innerhalb eines Netzwerksegments
    überall gleich, während jeder Rechner oder jedes
    andere Gerät seine eigene Knotennummer bekommt.
  • 10.10.10.10 Maske 255.0.0.0

14
IP-Netzwerkklassen
  • Über die Netzwerknummer erfolgt auch die
    Einteilung in sogenannte Netzwerk-Klassen in A-,
    B- oder C-Klasse Netzwerke. Das Prinzip ist, dass
    große Netzwerke mit vielen Knoten möglichst eine
    Klasse A oder wenigstens eine Klasse B Nummer
    bekommen und kleine Netze eine Klasse C Nummer
  • http//www.instrumentation.de/5106003d.htm

15
IP-Netzwerkklassen
  • Klasse A (1.0.0.0 bis 127.255.255.255)
  • Das erste Bit der Adresse ist auf Null gesetzt.
    Die ersten acht Bit identifizieren das Netzwerk,
    die restlichen 24 Bit den Host. Insgesamt sind
    127 Class-A-Netze möglich.
  • Reserviert 127.x.x.x (loopback/localhost)
  • Privat 10.0.0.0 - 10.255.255.255
  • Maske 255.0.0.0 oder /8

16
IP-Netzwerkklassen
  • Das Klasse B (128.0.0.0 bis 191.255.255.255)
  • Bei Klasse-B-Netzen ist das erste Bit auf Null,
    das zweite Bit auf eins gesetzt. Die ersten 16
    Bit beschreiben das Netzwerk, die anderen 16 Bit
    sind die Hostadresse.
  • Netze 16.384 mit maximal 65.534 angeschlossenen
    Computern.
  • Privat 172.16.0.0 - 172.31.255.255
  • Maske 255.255.0.0 oder /16

17
IP-Netzwerkklassen
  • Klasse C (192.0.0.0 bis 223.255.255.255)
  • Diese Netzwerkart erlaubt nur 255 Hosts in einem
    Netz. Die ersten drei Bit einer Class-C-Adresse
    bilden dabei die Folge "110". Die ersten 24 Bit
    identifizieren das Netzwerk, nur acht Bit den
    Host.
  • 2.097.152 Netze mit jeweils 254 Rechnern
  • Privat 192.168.0.0 - 192.168.255.255
  • Mask 255.255.255.0 oder /24

18
IP-Netzwerkklassen
  • Klasse D 224.0.0.0 - 239.255.255.255 für
    spezielle Dienste z.B. Multicast

19
Ports
  • Jede IP-Adresse hat 65536 Ports
  • festgelegte privilegierte Ports 0 bis 1023.
  • festgelegte Ports von 1024 bis 49151
  • dynamische oder private von 49152 bis
    65535http//www.iana.org/assignments/port-numbers

20
Firewall
  • Die Firewall legt fest, ob eine Verbindung
    erlaubt ist.
  • Die Firewall kontrolliert eingehende,
    weitergeleitete und ausgehende Pakete.
  • Die Firewall kann berücksichtigen, ob Pakete zu
    einer bereits bestehenden Verbindung gehören.

21
Firewall
  • iptables -A INPUT -i eth0 -p ICMP -j ACCEPT
  • iptables -A OUTPUT -o eth0 -p ICMP -j DROP

22
Router
Ein router leitet Pakete aktiv von einem Netzwerk
in ein anderes. Dabei können die Pakete (z.B.
IP-Adresse) auch verändert werden.
23
Switch
Ein switch verbindet Netzwerksegmente oder
Rechner miteinander. Dabei können auch mehrere
Rechner in virtuellen Netzwerken (vlan)
zusammengefasst werden.
24
Historie
  • Einzelne Inseln
  • Jeder vertaut Jedem (frühes Internet)

25
Weitere Entwicklung
  • Filtern Firewalls
  • demilitarisierte Zonen

26
Sichere Architektur
  • Virtuelle Gemeinschaft (Extranets B2B VPNs)
  • Site-to-site VPN tunnel
  • Vernetzung mit Praxen

27
und weiter
  • Virtuell mobile Arbeitsweise (C2B VPNs)
  • Zunehmend schneller Internetzugang
  • Firewalls mit VPN-Funktionalität
  • Dedizierte VPN-Konzentratoren machen den Zugang
    für mobile Arbeitsplätze von der Firewall
    unabhängig

28
Begriffe
html Hypertext Markup Language http Hypertext
Transfer Protocol
Quade
29
HTML Bearbeitung
Quade
30
Logfiles Cookies LogFormat "h l u t \"r\"
s b T Cookien \ \"Refereri\"
\"User-Agenti\" \"UNIQUE_IDe\""
Quade
31
Statistiken zentral
Statistiken CancerNet
Quade
32
Recherchesysteme
Recall Anteil der gefundenen Daten an den
gesuchten Daten Precision Anteil der gefundenen
Daten der von Interesse ist
A AC
AAB
vorhandene Daten relevant irrelevant
A B C D
gefunden nicht gefunden
Ergebnis der Suche
33
Recherchesysteme
MEDLINE Schlagworte, Autoren (3000
journals) http//www.ncbi.nlm.nih.gov/PubMed/
CURRENT wöchentlich erstelltes
lnhaltsverzeichnis CONTENTS wichtiger Journals
SCIENCE wie häufig wurde eine Publikation
zitiertCITATION INDEX
Quade
34
Zwei Verfahren der Indexierung
Einfacher Index über alle Worte z.B. WAIS
Alle Worte werden in den Index aufgenommen Auch
Worte wie Ich, Du, Er, Sie, Es, Das, und, aber,
wie, ... Keine Bestimmung von Häufigkeit und
Wichtigkeit
Index mit Thesaurus z.B. Xindex mit
UMLS-Metathesaurus
Es werden nur relevante Begriffe in den Index
aufgenommen Was Relevant ist wird an Hand von
UMLS bestimmt Berechnung der Häufigkeiten von
Worten und Wortgruppen Berechnung der Dichte
dieser Worte und Wortgruppen
35
Funktion von Xindex mit UMLS-Metathesaurus
UMLS-Metathesaurus
Dokument
Primäre Wortliste (Konzepte)
Wortliste
Ranking Rank Wörter pro Begriff
Anzahl 1/Doclen 1/Anz. Häufigster Begriff
Index für das Dokument mit Preffered Terms
36
Vorteile von Xindex gegenüber dem Standard
Erkennen von Wortkombinationen z.B. Breast
Cancer Gleiches Suchergebnis bei
unterschielicher Schreibweise z.B. hpv und
HPV z.B. MTX und Methotrexat Sinnvolles
Suchergebnis bei trivialen Begriffen z.B. love
--gt HPV, Cervixcarzinom, Brustkrebs Es werden
Dokumente in verschiedenen Sprachen
gefunden z.B. Englisch, Deutsch und Spanisch
37
Vorteile von Xindex gegenüber WAIS
Beispiel Melanom
38
Vorteile von Xindex
Es werden seltene Entitäten gefunden Suche
nach Melanom liefert Informationen zum
Wilms Tumor Dieser steht in Verbindung zum
clearcellsarcoma einer seltenen Form des
Melanoms Erkennen von Synonymen z.B. Mumps,
Parotitis epidemica
39
Der UMLS-Metathesaurus
Integration vorhandener Thesaurie ICD 10,
MESH, Cancerlit, HL7-Zusatz Mehrsprachig z.B.
Englisch, Deutsch, Spanisch, Russisch, Französis
ch, Finnisch, Italienisch, ...
Konzeptorientierung Jedes Konzept bekommt
eine Nummer (CUI) Jedes Synonym jedes
Konzeptes bekommt eine eigene Nummer in
verschiedenen Sprachen sowohl normalisiert (SUI)
als auch nicht normalisiert (LUI)
Kennzeichnung des Preffered Terms
40
Nutzerprobleme
  • Wie finde ich als Laie eine Information?
  • Wie kann ich die Seriosität einer Information
    erkennen (weit mehr fragliche Informationen denn
    gute) ?
  • Wie finde ich beim Anbieter eine Information
    trotz bildorientierter Oberfläche?

41
Was man wissen sollte!
  • Suchmaschinen lesen über Spider Dokumente ein
    und erstellen einen Volltext-Index (nicht bei
    Datenbanken, Graphiken, Java).
  • Metatags werden nur bedingt ausgewertet.
    (Anbieter manipulieren auf Teufel komm raus)
  • Ranking ist nicht intelligent und bevorzugt kurze
    Dokumente.
  • Für Geld wird das Ranking manipuliert!

42
Universität BonnVermittlung zu CancerNet
HostLycos

a2z Katalog wurde am 28. März aus dem Angebot
genommen
302520151050
Januar März
Mai 1997
43
Meta-Tags
ltMETA NAME"keywords" CONTENT"Breast
cancer, oncology, Cancer, medicine, Medizin,
Krebs, CancerNet, PDQ, Tumor"gt ltMETA
HTTP-EQUIV"RESOURCE-TYPE" content"document"gt ltME
TA name"description" content"Breast cancer"gt
44
Qualitätssiegel
  • Geschütztes Logo einer anerkannten Organisation
    (NCI)
  • HON Code of Conduct
  • Link von einer anerkannten Organisation (WHO)
  • MedCERTAIN

45
Evaluation kommerzieller Anbieter
  • Kriterien für Focus Recherche
  • Nutzen für den User
  • Kostensenkung durch weniger Arztbesuche
  • Richtigkeit und Ausgewogenheit
  • Vollständigkeit
  • Online-Arzt vorhanden

46
  • Ergebnis der Recherche für Focus
  • Der User kann einen Arzt finden. Ein
    Hausarzt-Buch ist auf mehrere Tausend Pages
    aufgeteilt.
  • Der User verbringt viel Zeit für wenig
    Information im Netz. Seiten werden aus Datenbank
    generiert. Viele Wege führen zur gleichen Seite.
  • Bachblüten und Standardtherapie gleichwertig im
    Angebot.
  • Nur Infos vom eigenen Server. Suche extrem
    schwierig (Stunden) da Information versteckt.
  • Online-Arzt ist nicht hilfreich für eigene Fragen
    (Show).

47
Was will der Nutzer?
  • Informationen zu Krankheiten
  • Informationen zu eigenen Werten
  • Zugriff auf die eigene Patientenakte
  • Informationen zu Arzt, Krankenhaus oder
    Versicherung
  • Sprechstunden, Besuchszeiten, Parkplatz
  • Benchmarking im Qualitätsbereich Link
  • Versicherungsvergleich

48
Aufbau von Suchmaschinen
Spider / Crawler (robot.txt) Indexer Broker
(Schnittstelle zum Benutzer)
49
Spider / Crawler
Nur ein Teil des WWW-Bereichs wird von einem
Crawler erfaßt. Häufig werden Links nicht
weiterverfolgt bei dynamisch gestalteten
Webseiten, Frames, Java und Bildern.
50
robots.txt
User-agent Disallow /usage/ Disallow
/dimdi/ Disallow /standard/ Disallow
/standards/HL7/ Disallow /niedergel/ Disallow
/epileptologie/epi_info/physicians/
51
Benutzerschnittstelle
Basic Search ,- Groß/klein Schreibung Wildcards
Phrasen in Hochkommata Advanced
Search Boolsche Algebra AND, OR, XOR, NOT, NEAR
52
Beispiel AltaVista
2943 Dokumente 1418 Dokumente 90310
Dokumente 2955 Dokumente 62 Dokumente 0 Dokumente
gmds GMDS gmds konferenz gmds
konferenz gmds konferenz gmds konferenz
53
Ranking
Schlüsselwortdichte (Benachteiligung
ausführlicher Dokumente) Meta-Tags (oft
manipuliert) Link Popularity (science citation
index) Verkauf von Ranking-Prioritäten statt
Werbung Neuere Ansätze
54
Aktualität
Anzahl der Dokumente überschreitet die Kapazität
der Suchmaschinen Scannen der Dokumente in
mehrmonatlichen Abständen Zulassen mehrerer no
connection für bereits indexierte
Dokumente Keine Strafen für tote Links in
Dokumenten
55
Verzeichnisse
Qualität der Bewertung liegt allein bei dem
Redaktionsteam Nur wenige Dokumente können erfaßt
werden Großer finanzieller Anreiz zur Manipulation
56
Benutzerschnittstelle
Write a Comment
User Comments (0)
About PowerShow.com