Title: Kein Folientitel
1Ewgenij ProschakYusuf Tanrikulu
Einführung in Microarray Genexpressionsdaten
Seminar Aktuelle Themen der Bioinformatik 13.05
.2004 Organizer Prof. Dr. D. Metzler Tutor Lin
Himmelmann
2Ablauf
- 13.05.2004 Einführung in Microarray
Genexpressionsdaten - 20.05.2004 Feiertag
- 27.05.2004 Varianzstabilisierung der
Genexpressionsdaten
3Inhalt
- Einleitung
- Durchführung eines Microarray-Experiments
- Auslesen der Daten
- Visualisierung
- Weiterverarbeitung
- Mustererkennung
4Einleitung
5Einleitung
6Einleitung
- Prof. Dr. Wolfgang Huber
- Gen-Transkriptionsanalyse mit DNA Microarrays
- Statistical Computing
- Computational Biology
7Durchführung eines Microarray-Experiments
- Zutaten
- cDNA
- Unterlage
- mRNA
- Ergebnis
8Durchführung eines Microarray-Experiments
9Auslesen der Daten
Laser- oder Betastrahlendetektor
10Auslesen der Daten Batcheffekte
- Verfälschungen des Experimentergebnisses
- Spotting
- PCR Amplifikation
- Probenaufbereitung
- RNA-Abbau
- Array-Beschichtung
11Visualisierung
- Wieso?
- Frühzeitige Erkennung von Experimentierfehlern
und Hintergrundrauschen
12Visualisierung-Falschfarbenrepräsentation
13Visualisierung Histogramm
14Visualisierung Scatterplot
15Wieterverarbeitung-Maße für die Genexpression
- Aussagen über absolute Genexpression nicht
möglich - Gründe
- RNA-Stabilität
- Hybridisierung
- PCA
16Weiterverarbeitung-Exkurs
- Heteroskedastizität
- Varianz nicht konstant
- Homoskedastizität
- Varianz konstant
Nächstes Mal
17Weiterverarbeitung
18Mustererkennung-Methoden
- Projektionsmethoden
- Hauptkomponentenanalyse
- SOMs
- Clusteralghorithmen
- Hierarchisches Clustering
19Mustererkennung-Hauptkomponentenanalyse
20Mustererkennung-Hauptkomponentenanalyse
- Projektion des Datensatzes auf die
Hauptkomponenten
21Mustererkennung-Hauptkomponentenanalyse
- Aufstellen der Covarianzmatrix
- Finden der Eigenvektoren
- Projektion des Datensatzes auf die Eigenvektoren
mit den größten Eigenwerten
22Mustererkennung-Hauptkomponentenanalyse
- Ergebnisse (Alter et al. 2000)
- Eigenvektor mit dem größten Eigenwert
Hintergrundrauschen ? kann herausgefiltert werden - Danach Projektion auf die beiden nachfolgenden
Eigenvektoren ? periodische Funktion von der Zeit
repräsentiert den Zellzyklus
23Mustererkennung-Self Organizing Maps
Z
Y
X
SOM
24Mustererkennung-Self Organizing Maps
- Algorithmus
- Zufälliges Aussuchen eines Musters
- Ermitteln des Gewinnerneurons
- Aktualisieren der Neuronengewichte
- Zurück zu 1 oder terminieren
25Mustererkennung-Self Organizing Maps
Lernzeit
Voronoi-Verteilung
26Mustererkennung-Clusteralgorithmen
- Basiert auf globaler Ähnlichkeitsmessung
- Ziel
- Aus den Genexpressionsdaten auf funktionelle
Verwandschaft oder Coregulation zu schließen. - Annahme
- Gene, die gemeinsame Eigenschaften aufweisen,
haben ähnliche Expressionsprofile.
27Mustererkennung-Hierarchisches Clustern
28Mustererkennung-Hierarchisches Clustern
29Ewgenij Proschak
Yusuf Tanrikulu
To be continued