Title: Bioinformatikos irankiai
1Bioinformatikos irankiai
- Bioinformatika
- Doc. R. Damaševicius
- KTU Programu inžinerijos katedra
2Bioinformatikos irankiai
- Bioinformatikos irankiai yra kompiuterines
programos, skirtos svarbios informacijos paieškai
ir analizei duomenu gausybeje. - Galutinis vartotojas (biologas, biochemikas,
genetikas) nera gerai igudes naudotis
kompiuterinemis technologijomis - Programiniai irankiai turi buti mokslininku
tyreju bendruomenes pasiekiami žiniatinkliu.
3Pagrindines genetiniu duomenu bazes
Tipas Aprašymas
Nukleotidu sekos Duomenys kaupiami trijose bendradarbiaujanciose duomenu bazese GenBank (JAV), EMBL (European Molecular Biology Laboratory Nucleotide Sequence Database) ir DDBJ (DNA Data Bank of Japan).
Aminorugšciu sekos Pagrindines duomenu bazes yra šios Swissprot (Swiss Protein Database), PIR (Protein Information Resource), Genpept (transliuojamu peptidu sekos iš GenBank db), TrEMBL (transliojamu peptidu sekos iš EMBL db)
Erdvines strukturos PDB (Protein Data Bank) saugomos biologiniu makromolekuliu, pagrindinai baltymu, erdvines strukturos. Pagrindiniai duomenys gauti rentgenostrukturines analizes budu arba naudojam BMR.
Baltymu motyvai Prosite yra duomenu baze, kaupianti informacija apie baltymu motyvus, budingus baltymu šeimoms, domenu strukturoms ar potransliacinems modifikacijoms
4Duomenu baziu klasifikacija
- Seku duomenu bazes
- Seku analizes duomenu bazes
- Mokslines literaturos duomenu bazes
- Baltymu strukturos duomenu bazes
- Genu išraiškos duomenu bazes
- Metaboliniu keliu duomenu bazes
- Universalios (integruotos) duomenu bazes
- Specializuotos duomenu bazes
5Nuorodu katalogas
- http//expasy.org/links.html
6DNR seku duomenu bazes
- Pagrindines duomenu bazes
- GenBank (US)
- (http//www.ncbi.nlm.nih.gov/Genbank/index.html)
- EMBL (Europe)
- (http//www.ebi.ac.uk/embl/)
- DDBJ (Japan)
- (http//www.ddbj.nig.ac.jp/)
- Primary databases
- DNA sequences are identical
7Irašu skaiciaus GenBank duomenu bazeje augimas
8Integruotos duomenu bazes
- NCBI - National Center for Biotechnology
Information (JAV) - NCBI protein resources
- Protein Clusters - collection of related protein
sequences (clusters) - Genbank - GenBank Nucleotide Sequence db
- dbEST - dbEST (Expressed Sequence Tags) db
- dbSTS - dbSTS (Sequence Tagged Sites) db
- NCBI Taxonomy
- PubMed Mokslines literaturos duomenu baze
- NCBI Bookshelf knygu archyvas
9www.ncbi.nlm.nih.gov
10NCBI Bookshelf
- Laisvai prieinamos knygos
- šiuo metu yra 55 pavadinimai
- Temos
- Molekuline biologija, biochemija, genetika,
mikrobiologija
11- PubMed yra
-
- Moksliniu publikaciju paieškos serveris
- gt14 milionu straipsniu
- 4000 žurnalu
- Nuorodos i kitus žurnalus
12(No Transcript)
13lipocalin AND disease (96 results)
1 AND 2
1
2
lipocalin OR disease (1.9 million results)
1 OR 2
1
2
lipocalin NOT disease (729 results)
1 NOT 2
1
2
14Entrez Metapaieškos serveris
- Galimybe atlikti paieška daugelyje duomenu baziu
iš karto (tiek genetiniu seku, baltymu, tiek
mokslines literaturos, šiuo metu 29) - Galimybe naudoti logines operacijas (OR, AND)
- Galimybe saugoti užklausas serveryje
- Galimybe gauti pranešimus el. paštu, jeigu
atsiradu nauju rezultatu pagal jusu ankstesnes
užklausas - http//www.ncbi.nlm.nih.gov/sites/gquery
15(No Transcript)
16Baltymu duomenu baziu
- SWISS-PROT
- Manually curated
- high-quality annotations, less data
- GenPept/TREMBL
- Translated coding sequences from GenBank/EMBL
- Few annotations, more up to date
- PIR
- Phylogenetic-based annotations
- All 3 now combining efforts to form UniProt
(http//www.uniprot.org)
17Seku ir strukturu duomenu bazes
- SWISS-3DIMAGE -
- Baltymu ir kitu biologiniu makromolekuliu 3D
strukturos vaizdai - http//www.expasy.ch/sw3d/
- PDB (Protein Databank)
- Rentgeno kristalografijos, magnetinio rezonanso
ir kompiuterinio modeliavimo budu gauti duomenys - http//www.rcsb.org/pdb/
- MMDB (Molecular Modeling database)
- Virš 28,000 baltymu ir polinukleotidu trimate
struktura (http//www.ncbi.nlm.nih.gov/entrez/quer
y.fcgi?dbStructure) - SCOP (Structural Classification of Proteins)
- Baltymu klasifikacija pagal ju strukturini
panašuma ir evoliucinius saryšius
18Genomu duomenu bazes
- Saugoma informacija apie konkretaus organizmo
arba organizmu grupes genoma - Colibase (E. coli and related species)
- http//colibase.bham.ac.uk/
- GDB (human)
- http//www.gdb.org/
- Flybase (Drosophila)
- http//flybase.bio.indiana.edu/
- WormBase (C. elegans)
- http//wormbase.org
- AtDB (Arabidopsis)
- http//www.arabidopsis.org
- SGD (S. cerevisiae)
- http//genome-www.stanford.edu/Saccharomyces/
19Genu išraiškos duomenu bazes
- RNR išraiškos
- Eksperimentiškai nustatytas lasteles mRNR turinys
esant tam tikroms salygoms - Array Express (EBI) ir Geo (NCBI)
- Proteomu
- Eksperimentiškai nustatytas lasteliu baltymu
turinys (visuma) esant tam tikroms salygoms - SWISS 2D PAGE at http//us.expasy.org/ch2d/
20Kitos specializuotos duomenu bazes
- Mokslines literaturos
- MEDLINE (http//ncbi.nlm.nih.gov/PubMed/)
- HighWire (Stanford University) (http//www.highwir
e.org) - Variaciju
- dbSNP (http//ncbi.nlm.nih.gov/SNP/)
- HGBase (http//hgbase/interactiva/de)
- Metaboliniu keliu
- KEGG (http//kegg.genome.ad.jp/kegg/)
- WIT (http//wit.mcs/anl.gov/WIT2)
- Organizmu nomenklaturos
- Taksonomiju (e.g. http//ncbi.nlm.nih.gov/Taxonom
y/ ) - Mendel (http//mbclserver.rutgers.edu/CPGN)