Title: Medizinische Statistik und Informationsverarbeitung
1Medizinische Statistik und Informationsverarbeitun
g
Quade Institut für Medizinische
Statistik, Dokumentation und Datenverarbeitung
Quade
2Netzwerke
Netzwerke verbinden Computer untereinander. Verein
barungen für den Informationstransport und
-Austausch nennt man Protokolle. Netzwerke
werden nach dem OSI Referenzmodell in 7 Schichten
eingeteilt. Dabei nimmt die unterste Schicht
großen Einfluß auf die Leistungsdaten eines
Netzwerkes.
Quade
3(No Transcript)
4Quade
5Netzwerke
- In einem lokalen physikalischen Netzwerk
erkennen sich die Teilnehmer mittels der
MAC-Adresse (Media Access Control (Schicht 2 des
OSI Referenz Modells)) der Netzwerk Karte (arp a
unter Windows). - Die Abbildung in die uns bekannte IP-Adresse
geschieht mittels des Adress Resolution
Protokolls (ARP)
6IP-Netzwerkadressen
- Eine IP-Adresse besteht aus 4 Zahlen zwischen 0
und 255. Die Netzwerkmaske (z.B. 255.255.x.x)
bestimmt den Netzwerkteil und den Knotenteil. Die
höchste und die niedrigste Knotenadresse ist
jeweils für Broadcasts reserviert. Alle Rechner
im Netzwerk lauschen auf den Broadcast-Adressen.
7IP-Netzwerke
- Ip-Netz 131.220.23.0 Broadcast 0 255
- Maske 255.255.255.0 oder /24
- 131.220. 23 . 0
- IP-Binär 131.220. 0001 0111 . 0000 0000
- Maske 255.255. 1111 1111 . 0000 0000
- 255.255. 255 . 0
- Daher können sich Rechner mit den IP-Adressen
131.220.23.1 bis 131.220.23.254 in einem lokalen
Netzwerk sehen.
8Befehle um die Netzwerkkonfiguration zu sehen
- ipconfig
- Windows-IP-Konfiguration
- Ethernetadapter Drahtlose Netzwerkverbindung
- Medienstatus. . . . . . . . . . . Es
besteht keine Verbindung - Ethernetadapter LAN-Verbindung
- Verbindungsspezifisches DNS-Suffix
meb.uni-bonn.de - IP-Adresse. . . . . . . . . . . .
172.30.1.70 - Subnetzmaske. . . . . . . . . . .
255.255.255.0 - Standardgateway . . . . . . . . .
172.30.1.254 -
9Befehle um die Netzwerkkonfiguration zu sehen
- netstat -a
- Aktive Verbindungen
- Proto Lokale Adresse Remoteadresse
Status - TCP Quade-T60epmap Quade-T600
ABHÖREN - TCP Quade-T60microsoft-ds Quade-T600
ABHÖREN - TCP Quade-T602869 Quade-T600
ABHÖREN - TCP Quade-T605800 Quade-T600
ABHÖREN - TCP Quade-T605900 Quade-T600
ABHÖREN - TCP Quade-T606060 Quade-T600
ABHÖREN - TCP Quade-T6010243 Quade-T600
ABHÖREN - TCP Quade-T6031038 Quade-T600
ABHÖREN - TCP Quade-T601036 Quade-T600
ABHÖREN - TCP Quade-T601090 localhost27015
HERGESTELLT - TCP Quade-T601168 localhost1169
HERGESTELLT - TCP Quade-T601169 localhost1168
HERGESTELLT -
10Befehle um die Netzwerkkonfiguration zu sehen
- netstat -b
- Aktive Verbindungen
- Proto Lokale Adresse Remoteadresse
Status PID - TCP Quade-T601090 localhost27015
HERGESTELLT 6020 iTunesHelper.exe - TCP Quade-T603289 localhost3290
HERGESTELLT 6108 Netscp.exe - TCP Quade-T603290 localhost3289
HERGESTELLT 6108 Netscp.exe - TCP Quade-T604844 localhost4845
HERGESTELLT 5016 firefox.exe - TCP Quade-T604845 localhost4844
HERGESTELLT 5016 firefox.exe - TCP Quade-T604847 localhost4848
HERGESTELLT 5016 firefox.exe - TCP Quade-T604848 localhost4847
HERGESTELLT 5016 firefox.exe - TCP Quade-T6027015 localhost1090
HERGESTELLT 712 AppleMobileDeviceService
.exe - TCP Quade-T605152 localhost1088
SCHLIESSEN_WARTEN 3004 jqs.exe
11Befehle um die Netzwerkkonfiguration zu sehen
- netstat -ano
- Aktive Verbindungen
- Proto Lokale Adresse Remoteadresse
Status PID - TCP 0.0.0.080 0.0.0.00
ABHÖREN 7128 - TCP 0.0.0.0135 0.0.0.00
ABHÖREN 552 - TCP 0.0.0.0445 0.0.0.00
ABHÖREN 4 - TCP 0.0.0.02869 0.0.0.00
ABHÖREN 1076 - TCP 0.0.0.05800 0.0.0.00
ABHÖREN 2808 - TCP 0.0.0.05900 0.0.0.00
ABHÖREN 2808 - TCP 0.0.0.06060 0.0.0.00
ABHÖREN 684 - TCP 0.0.0.010243 0.0.0.00
ABHÖREN 2632 - TCP 0.0.0.031038 0.0.0.00
ABHÖREN 2024 - TCP 127.0.0.11036 0.0.0.00
ABHÖREN 1912 -
12Befehle um die Netzwerkkonfiguration zu sehen
- arp -a
- Address HWtype HWaddress
Flags Mask iface - www.dsmrsvpaed.de ether
00163e579023 C br0 - www.oncopaednki.de ether
00163e579023 C br0 - linkdb.meb.uni-bonn.de ether
00163e35c15e C br0 - famhap.meb.uni-bonn.de ether
00163e35c15e C br0 - www-dom0.meb.uni-bonn.d ether
001517abaefe C br0 - nmap 131.220.23.0/24
- Interesting ports on Jumbo-dom0.meb.uni-bonn.de
(131.220.23.181) - Not shown 998 closed ports
- PORT STATE SERVICE
- 22/tcp open ssh
- 111/tcp open rpcbind
- MAC Address 003048200CD4 (Supermicro
Computer)
13IP-Netzwerkklassen
- Eine IP-Adresse ist zweigeteilt und zwar in einen
Netzwerkteil und einen Knotenteil. Der
Netzwerkteil ist innerhalb eines Netzwerksegments
überall gleich, während jeder Rechner oder jedes
andere Gerät seine eigene Knotennummer bekommt. - 10.10.10.10 Maske 255.0.0.0
14IP-Netzwerkklassen
- Über die Netzwerknummer erfolgt auch die
Einteilung in sogenannte Netzwerk-Klassen in A-,
B- oder C-Klasse Netzwerke. Das Prinzip ist, dass
große Netzwerke mit vielen Knoten möglichst eine
Klasse A oder wenigstens eine Klasse B Nummer
bekommen und kleine Netze eine Klasse C Nummer - http//www.instrumentation.de/5106003d.htm
15IP-Netzwerkklassen
- Klasse A (1.0.0.0 bis 127.255.255.255)
- Das erste Bit der Adresse ist auf Null gesetzt.
Die ersten acht Bit identifizieren das Netzwerk,
die restlichen 24 Bit den Host. Insgesamt sind
127 Class-A-Netze möglich. - Reserviert 127.x.x.x (loopback/localhost)
- Privat 10.0.0.0 - 10.255.255.255
- Maske 255.0.0.0 oder /8
16IP-Netzwerkklassen
- Das Klasse B (128.0.0.0 bis 191.255.255.255)
- Bei Klasse-B-Netzen ist das erste Bit auf Null,
das zweite Bit auf eins gesetzt. Die ersten 16
Bit beschreiben das Netzwerk, die anderen 16 Bit
sind die Hostadresse. - Netze 16.384 mit maximal 65.534 angeschlossenen
Computern. - Privat 172.16.0.0 - 172.31.255.255
- Maske 255.255.0.0 oder /16
17IP-Netzwerkklassen
- Klasse C (192.0.0.0 bis 223.255.255.255)
- Diese Netzwerkart erlaubt nur 255 Hosts in einem
Netz. Die ersten drei Bit einer Class-C-Adresse
bilden dabei die Folge "110". Die ersten 24 Bit
identifizieren das Netzwerk, nur acht Bit den
Host. - 2.097.152 Netze mit jeweils 254 Rechnern
- Privat 192.168.0.0 - 192.168.255.255
- Mask 255.255.255.0 oder /24
18IP-Netzwerkklassen
- Klasse D 224.0.0.0 - 239.255.255.255 für
spezielle Dienste z.B. Multicast
19Ports
- Jede IP-Adresse hat 65536 Ports
- festgelegte privilegierte Ports 0 bis 1023.
- festgelegte Ports von 1024 bis 49151
- dynamische oder private von 49152 bis
65535http//www.iana.org/assignments/port-numbers
20Firewall
- Die Firewall legt fest, ob eine Verbindung
erlaubt ist. - Die Firewall kontrolliert eingehende,
weitergeleitete und ausgehende Pakete. - Die Firewall kann berücksichtigen, ob Pakete zu
einer bereits bestehenden Verbindung gehören.
21Firewall
- iptables -A INPUT -i eth0 -p ICMP -j ACCEPT
- iptables -A OUTPUT -o eth0 -p ICMP -j DROP
22Router
Ein router leitet Pakete aktiv von einem Netzwerk
in ein anderes. Dabei können die Pakete (z.B.
IP-Adresse) auch verändert werden.
23Switch
Ein switch verbindet Netzwerksegmente oder
Rechner miteinander. Dabei können auch mehrere
Rechner in virtuellen Netzwerken (vlan)
zusammengefasst werden.
24Historie
- Einzelne Inseln
- Jeder vertaut Jedem (frühes Internet)
25Weitere Entwicklung
- Filtern Firewalls
- demilitarisierte Zonen
26Sichere Architektur
- Virtuelle Gemeinschaft (Extranets B2B VPNs)
- Site-to-site VPN tunnel
- Vernetzung mit Praxen
27und weiter
- Virtuell mobile Arbeitsweise (C2B VPNs)
- Zunehmend schneller Internetzugang
- Firewalls mit VPN-Funktionalität
- Dedizierte VPN-Konzentratoren machen den Zugang
für mobile Arbeitsplätze von der Firewall
unabhängig
28Begriffe
html Hypertext Markup Language http Hypertext
Transfer Protocol
Quade
29HTML Bearbeitung
Quade
30Logfiles Cookies LogFormat "h l u t \"r\"
s b T Cookien \ \"Refereri\"
\"User-Agenti\" \"UNIQUE_IDe\""
Quade
31Statistiken zentral
Statistiken CancerNet
Quade
32Recherchesysteme
Recall Anteil der gefundenen Daten an den
gesuchten Daten Precision Anteil der gefundenen
Daten der von Interesse ist
A AC
AAB
vorhandene Daten relevant irrelevant
A B C D
gefunden nicht gefunden
Ergebnis der Suche
33Recherchesysteme
MEDLINE Schlagworte, Autoren (3000
journals) http//www.ncbi.nlm.nih.gov/PubMed/
CURRENT wöchentlich erstelltes
lnhaltsverzeichnis CONTENTS wichtiger Journals
SCIENCE wie häufig wurde eine Publikation
zitiertCITATION INDEX
Quade
34 Zwei Verfahren der Indexierung
Einfacher Index über alle Worte z.B. WAIS
Alle Worte werden in den Index aufgenommen Auch
Worte wie Ich, Du, Er, Sie, Es, Das, und, aber,
wie, ... Keine Bestimmung von Häufigkeit und
Wichtigkeit
Index mit Thesaurus z.B. Xindex mit
UMLS-Metathesaurus
Es werden nur relevante Begriffe in den Index
aufgenommen Was Relevant ist wird an Hand von
UMLS bestimmt Berechnung der Häufigkeiten von
Worten und Wortgruppen Berechnung der Dichte
dieser Worte und Wortgruppen
35 Funktion von Xindex mit UMLS-Metathesaurus
UMLS-Metathesaurus
Dokument
Primäre Wortliste (Konzepte)
Wortliste
Ranking Rank Wörter pro Begriff
Anzahl 1/Doclen 1/Anz. Häufigster Begriff
Index für das Dokument mit Preffered Terms
36 Vorteile von Xindex gegenüber dem Standard
Erkennen von Wortkombinationen z.B. Breast
Cancer Gleiches Suchergebnis bei
unterschielicher Schreibweise z.B. hpv und
HPV z.B. MTX und Methotrexat Sinnvolles
Suchergebnis bei trivialen Begriffen z.B. love
--gt HPV, Cervixcarzinom, Brustkrebs Es werden
Dokumente in verschiedenen Sprachen
gefunden z.B. Englisch, Deutsch und Spanisch
37 Vorteile von Xindex gegenüber WAIS
Beispiel Melanom
38 Vorteile von Xindex
Es werden seltene Entitäten gefunden Suche
nach Melanom liefert Informationen zum
Wilms Tumor Dieser steht in Verbindung zum
clearcellsarcoma einer seltenen Form des
Melanoms Erkennen von Synonymen z.B. Mumps,
Parotitis epidemica
39 Der UMLS-Metathesaurus
Integration vorhandener Thesaurie ICD 10,
MESH, Cancerlit, HL7-Zusatz Mehrsprachig z.B.
Englisch, Deutsch, Spanisch, Russisch, Französis
ch, Finnisch, Italienisch, ...
Konzeptorientierung Jedes Konzept bekommt
eine Nummer (CUI) Jedes Synonym jedes
Konzeptes bekommt eine eigene Nummer in
verschiedenen Sprachen sowohl normalisiert (SUI)
als auch nicht normalisiert (LUI)
Kennzeichnung des Preffered Terms
40Nutzerprobleme
- Wie finde ich als Laie eine Information?
- Wie kann ich die Seriosität einer Information
erkennen (weit mehr fragliche Informationen denn
gute) ? - Wie finde ich beim Anbieter eine Information
trotz bildorientierter Oberfläche?
41Was man wissen sollte!
- Suchmaschinen lesen über Spider Dokumente ein
und erstellen einen Volltext-Index (nicht bei
Datenbanken, Graphiken, Java). - Metatags werden nur bedingt ausgewertet.
(Anbieter manipulieren auf Teufel komm raus) - Ranking ist nicht intelligent und bevorzugt kurze
Dokumente. - Für Geld wird das Ranking manipuliert!
42Universität BonnVermittlung zu CancerNet
HostLycos
a2z Katalog wurde am 28. März aus dem Angebot
genommen
302520151050
Januar März
Mai 1997
43Meta-Tags
ltMETA NAME"keywords" CONTENT"Breast
cancer, oncology, Cancer, medicine, Medizin,
Krebs, CancerNet, PDQ, Tumor"gt ltMETA
HTTP-EQUIV"RESOURCE-TYPE" content"document"gt ltME
TA name"description" content"Breast cancer"gt
44Qualitätssiegel
- Geschütztes Logo einer anerkannten Organisation
(NCI) - HON Code of Conduct
- Link von einer anerkannten Organisation (WHO)
- MedCERTAIN
45Evaluation kommerzieller Anbieter
- Kriterien für Focus Recherche
- Nutzen für den User
- Kostensenkung durch weniger Arztbesuche
- Richtigkeit und Ausgewogenheit
- Vollständigkeit
- Online-Arzt vorhanden
46- Ergebnis der Recherche für Focus
- Der User kann einen Arzt finden. Ein
Hausarzt-Buch ist auf mehrere Tausend Pages
aufgeteilt. - Der User verbringt viel Zeit für wenig
Information im Netz. Seiten werden aus Datenbank
generiert. Viele Wege führen zur gleichen Seite. - Bachblüten und Standardtherapie gleichwertig im
Angebot. - Nur Infos vom eigenen Server. Suche extrem
schwierig (Stunden) da Information versteckt. - Online-Arzt ist nicht hilfreich für eigene Fragen
(Show).
47Was will der Nutzer?
- Informationen zu Krankheiten
- Informationen zu eigenen Werten
- Zugriff auf die eigene Patientenakte
- Informationen zu Arzt, Krankenhaus oder
Versicherung - Sprechstunden, Besuchszeiten, Parkplatz
- Benchmarking im Qualitätsbereich Link
- Versicherungsvergleich
48Aufbau von Suchmaschinen
Spider / Crawler (robot.txt) Indexer Broker
(Schnittstelle zum Benutzer)
49Spider / Crawler
Nur ein Teil des WWW-Bereichs wird von einem
Crawler erfaßt. Häufig werden Links nicht
weiterverfolgt bei dynamisch gestalteten
Webseiten, Frames, Java und Bildern.
50robots.txt
User-agent Disallow /usage/ Disallow
/dimdi/ Disallow /standard/ Disallow
/standards/HL7/ Disallow /niedergel/ Disallow
/epileptologie/epi_info/physicians/
51Benutzerschnittstelle
Basic Search ,- Groß/klein Schreibung Wildcards
Phrasen in Hochkommata Advanced
Search Boolsche Algebra AND, OR, XOR, NOT, NEAR
52Beispiel AltaVista
2943 Dokumente 1418 Dokumente 90310
Dokumente 2955 Dokumente 62 Dokumente 0 Dokumente
gmds GMDS gmds konferenz gmds
konferenz gmds konferenz gmds konferenz
53Ranking
Schlüsselwortdichte (Benachteiligung
ausführlicher Dokumente) Meta-Tags (oft
manipuliert) Link Popularity (science citation
index) Verkauf von Ranking-Prioritäten statt
Werbung Neuere Ansätze
54Aktualität
Anzahl der Dokumente überschreitet die Kapazität
der Suchmaschinen Scannen der Dokumente in
mehrmonatlichen Abständen Zulassen mehrerer no
connection für bereits indexierte
Dokumente Keine Strafen für tote Links in
Dokumenten
55Verzeichnisse
Qualität der Bewertung liegt allein bei dem
Redaktionsteam Nur wenige Dokumente können erfaßt
werden Großer finanzieller Anreiz zur Manipulation
56Benutzerschnittstelle