Title: 3.4 Genomu sekvenavimas
13.4 Genomu sekvenavimas
2DNR sekvenavimo metodai
Sengerio (sukurtas 1974 m., modifikuotas 1982 m.)
fermentinis metodas
V.Rancelis (2000)
3Maksamo-Gilberto cheminis metodas
DNR sekvenavimo metodai
V.Rancelis (2000)
4automatinis metodas tai automatizuotas F.
Sengerio išrastas metodas
DNR sekvenavimo metodai
Visi dabartiniu metu naudojami genomu sekvenavimo
budai remiasi Shotgun automatiniu DNR seku
generavimu
Chromatografo kreives
5Genomo sekvenavimo tikslas gauti pilnai
iššifruota DNR grandinele (A, C, G, T).
6Pagrindines genomo sekvenavimo strategijos
- Hierarchine arba klonu gretinimo (angl. Clone by
clone) - DNR skaidymas i daugybe pakankamai ilgu segmentu
ir dideles - kolekcija BAC klonu sudarymas.
- 2. DNR fragmentu sudeliojimas i fizinius
genolapius. - 3. Minimalaus fragmentu persidengimo varianto
suradimas. - 4. Kiekvieno varianto klono sekvenavimas su
Shotgun. - 5. Fragmentu apjungimas kaimynystes principu i
klonu gretinius (angl. contig). - 6. Visu fragmentu sujungimas i vientisa seka.
- Šis budas panaudotas mieliu, kirmeliu, žmogaus,
žiurkes genomu sekvenavimui.
- Hierarchines strategijos atmaina yra
žingsniavimas (angl. walking), kai nesudaromi
fiziniai genolapiai - DNR skaidymas i daugybe pakankamai ilgu segmentu
ir perteklines BAC klonu kolekcijos sudarymas. - Sekvenavimas kiekvieno klono, pirmiausia
parinkus keleta kertiniu klonu (angl. seed
clones). - Vientisos sekos konstravimas vis pridedant
sekvenuotus prie jau esamu. - Tokiu budu sekvenuotas ryžio genomas.
Viso genomo sekvenavimas iš karto (WGS),
išvengiant genolapiu sudarymo. Šis budas
taikytas sekvenuojant drozofilos, žmogaus, peles,
žiurkes, šuns genomus.
7Genomo dydis ir sekvenavimo strategijos
Genomo dydis (log Mb)
4
0
1
2
3
H.sapiens (3000 Mb)
D.melanogaster (170 Mb)
C.elegans (100Mb)
P.falciparum (30 Mb)
S.cerevisiae (14 Mb)
E.coli (4 Mb)
Viso genomo per karta (WGS)
Hierarchinis arba klonavimo
Visos chromosomos (WCS)
Viso genomo per karta Shotgun (WGS) derinant
su BAC mažo padengimo klonais (panaudotas
žiurkes genomo sekvenavimui)
www.sanbi.ac.za/mrc/tdr2004/Presentation/
genomics_lawson/sanbi_genome_files/
8Vektoriai strukturos, kuriose laikoma iterpta
klonuota svetima DNR. Tai atliekama dviem
tikslais saugoti ir dauginti klonuota DNR.
Vektoriu tipai
Vektorius Intarpo dydis (bp)
Plazmides 2,000-10,000
Kosmides 40,000
BAC (bakteriju dirbtine chromosoma) 70,000-300,000
YAC (mieliu dirbtine chromosoma) gt 300,000 (vis mažiau naudojama)
9DNR sekvenavimas vektoriai
DNR
DNR fragmentai
Žinoma vieta (restriktaziu pažinimo vieta)
Vektorius (žiedine plazmides DNR)
10(No Transcript)
11Genetiniai genolapiai sudaromi pasinaudojant
rekombinaciju dažniais ir santykiniais atstumais
(cM), o fiziniai pasinaudojant fiziniais
klonuotu DNR seku atstumais.
- Genetiniai žymenys naudojami kaip gaires sudarant
genolapius - morfologiniai kategoriniai žymenys, pvz. žmoniu
hemofilija, daltonizmas, žirneliu raukšletumas - Fiziniai žymenys - RFLP, CAPS, VNTR, STS.
12http//www.ornl.gov/sci/techresources/Human_Genome
/home.shtml
13Komplementaraus jungimosi budu gaunamas tikslus
molekuliniu žymenu išsidestymas chromosomoje
Detalus genolapio STS (angl. sequence-tagged-site)
pagrindu sudarymas remiasi klonuotu BAC
fragmentu kartografavimu, persidengimo principu
(angl. contig).
14Viso genomo sekvenavimas (WGS)
15www.ist.temple.edu/vucetic/ cis595spring2003/
16Sekvenavimo strategiju privalumai ir trukumai
- Hierarchinis sekvenavimas
- Privalumai
- Lengvesnis apjungimas sekvenuotu
- fragmentu i klonu gretinius
- - Reikalauja mažiau kompiuteriniu
- resursu
- Yra patikimesnis
- Trukumai
- Reikalingi fiziniai genolapiai ir klonu
- bibliotekos
- Daug perteklinio padengimo (angl. redundant
sequencing) - Techniškai sudetingas ir pakankamai brangus
- Viso genomo sekvenavimas per karta
- Privalumai
- Nereikia genolapiu
- Mažiau perteklinio padengimo
- - Reikalauja daugiau kompiuteriniu
- resursu
- Yra pigesnis
- Trukumai
- Sudetingas sekvenuotu fragmentu apjungimas i
klonu gretinius, t.y. eksperimentiškai
sudetingesnis - Reikalauja daugiau kompiuteriniu
- resursu
- - Nera patikimas
17Genomo anotacija ar išaiškinimas tai genus
atitinkanciu DNR seku identifikavimas, siekiant
atsakyti i klausimus kiek genu yra ir kuriose
genomo vietose, kokius baltymus jie koduoja,
kokie yra reguliaciniai mechanizmai ir saveikos
schemos.
18Strukturine anotacija susijusi genu vietos
suradimu, homologiniu su kitais genomais, cDNA
sekomis ir baltymu sekomis DNR grandines vietu
paieška, o taip pat transkripcija reguliuojanciu
elementu identifikavimu.
Funkcine anotacija susijusi su baltymu molekuline
funkcija, ju dalyvavimu apykaitos ir
reguliatorineje veikloje.
E.coli genomo vietos fragmentas
19Ab initio genu metodai paremti specifiniu vietu
sekose paieška, tokiu kaip start ir stop kodonai,
ir ribosomines kilpos. Jei nukleotidai sekoje
išsideste atsitiktinai (tai budinga introninems
geno dalims, tarpgeninei DNR), maždaug kas
dvidešimtas nukleotidu trejetas esti atsitiktinis
stop kodonas.
Palyginti ilgas DNR fragmentas, kuriame nera stop
kodonu, vadinamas atviru skaitymo remeliu (ORF).
GenScan, Genie, GeneID kompiuterines programos
yra naudojamos tokio pobudžio analizei.
20Kiti genu identifikavimo metodai grindžiami
homologija su jau žinomais genais (naudojama
GenomeScan kompiuterine programa). Tokie yra,
pvz. - zooblotingas, kai hibridizuojant naujai
nustatyto žmogaus geno DNR sekas su žinomais kitu
rušiu (beždžioniu, galviju, peliu, paukšciu)
genais, galima identifikuoti tu genu analogus
žmogaus genome (GeneWise, Procrustes ir kt.
kompiuterines programos) - CpG saleles, kuriu
buvimas nustatytose DNR sekose padeda rasti visa
gena. Šios saleles labiau budingos bendriniams
(angl. housekeeping) genams, pvz., tokiems, kurie
koduoja lasteles energetikai butinus baltymus ir
kt. (Rosseta, SGP1 kompiuterines programos) -
egzono iterpimas (angl. exon trapping) paremtas
žiniomis apie tam tikras nukleotidu sekas
eukariotu genuose žymincias introno pradžia ir
pabaiga. Jei gautos mDNR ilgis pasikeicia,
vadinasi svetimos DNR egzonas buvo atpažintas ir
prijungtas (CEM kompiuterine programa).
21Genai yra identifikuojami pasinaudojant
ekspresuotu seku žymekliais (EST). Ideja
grindžiama tuo, kad identiškos sekos atlieka
panašu vaidmeni ir kituose genomuose. Specialios
kompiuterines programos padeda identifikuoti
genus pagal nukleotidu seku išreikštuma (BLASTN,
FASTA, TBLASTN). Naujesnes kompiuterines
programos, tokios kaip SGP-2, TwinScan, SLAM,
DoubleScan yra sukonstruotos panašumo principu ir
naudojamos homologiniams genomu lyginimams.
- Iškylantys sunkumai
- - sunku tiksliai iškart nustatyti genu skaiciu
- visas genomas sekvenuotas su kai kuriomis
pasitaikanciomis klaidomis - mažus genus yra sunku identifikuoti
- kai kurie genai retai pasireiškia ir neturi
budingos kodonu strukturos, todel juos sunku
aptikti - genu funkcijos daugumoje yra nežinomos
22Genomu ypatybes apsprendžia ju sekvenavimo eigos
sklanduma
Gerai Vidutiniškai Blogai
Polimorfizmas Haploidai Savidulkiniai Kryžmadulkiniai
Padengimas žymenimis Tankus Retas Nera
Fragmentu dydis 3kb, 10kb, 50kb, 200kb 3kb, 50kb 3kb
Klonu pasiskirstymas Atsitiktinis Atsitiktinis kai kuriu dydžiu fragmentuose Neatsitiktinis daugumoje atveju
BAC galai Daug porose Nedaug porose Nera porose
EST Daug 300/Mb Mažai 100/Mb Nera
mRNA Daug Mažai Nera
Padengimas 10x 6x 2x
Sekvenavimo paklaidos Nera Nedaug Daug
Genomo dydis 30Mb - 100Mb 100Mb - 1Gb gt1Gb
23Naujai isitvirtinantys sekvenavimo metodai
Hibridinis sekvenavimas (SBH) Daugybinis
spektrometrinis sekvenavimas Tiesiogine atskiros
DNR molekules vizualizacija naudojant atomine
mikroskopija (AFM) Atskiros molekules
sekvenavimas Atskiro nukleotido metodas Geno
ekspresijos lasteleje nustatymo
metodas Sekvenavimas panaudojant nanopora
www.ist.temple.edu/vucetic/ cis595spring2003/
24Žmogaus genomas
1
2
3
X
6
7
16
mitochondrija
11
4
19
8
20
5
9
10
17
18
12
13
22
15
14
21
Y
.016
45
66
72
48
51
104
3.2109 bp
86
88
100
107
163
118
148
143
142
140
176
163
148
221
279
198
197
Myoglobinas
5.000
a globinas
251
b-globinas
(11 chromosoma)
6104 bp
20
Egzonas 2
Egzonas 1
Egzonas 3
3103 bp
5 UTR
3 UTR
103
ATTGCCATGTCGATAATTGGACTATTTGGA
30 bp
DNR
Baltymas
http//www.sanger.ac.uk/HGP/
aa
aa
aa
aa
aa
aa
aa
aa
aa
aa
25Žmogaus genomas
- Genai sudaro 25 viso genomo
- Egzonai užima tik 1
Vidutinis žmogaus genas 27kb ilgio ir
koduojancia seka sudarancia 1,340 bp Tik 5 genu
atitinka koduojancias sekas (genai skiriasi pagal
intronu skaiciu)
www.gmu.edu/departments/ biology/568-0304.ppt
26- Egzonai baltymus koduojantys ir
netransliuojamos sritys (UTR) - 1 to 178 egzonu gali tureti genas (vidurkis
8.8) - 8 bp to 17 kb gali sudaryti egzona (vidurkis
145 bp) - Intronai nekoduojancios DNR sekos
- vidutiniškai 1 kb 50 kb sudaro introna
- Genu dydis Didžiausias 2.4 Mb (Distrofinas).
Vidurkis 27 kb.
Eukariotu genomai turi santykinai mažai
koduojanciu sriciu Eukariotu genomus didžiaja
dalimi sudaro kartotines sekos Eukariotu genai
yra grupuojami blokuose tarp kartotiniu seku Del
minetu priežasciu yra reikalingi paprastesni
modeliniai genomai
27 http//www.genomesonline.org/ Publikuoti pilni
genomai 359 Prokariotu vykstantys genomu
dekodavimai 944 Eukariotu vykstantys genomu
dekodavimai 599 Viso 1902
2006 metu (pirmo ketvircio) duomenys
28Steane (2005)
29Augalu genomai skiriasi dydžiu, ploidiškumu ir
chromosomu skaiciumi
Arabidopsis 125.000 Kb
Bananas (Musa) 873.000 Kb
Lilium 50.000.000 Kb
http//www.redbio.org/portal/encuentros/enc_2001/c
onferencias/C-04/
30Savolainen O. 2006
31(No Transcript)
32Lasteliu tipu ir morfologinis kompleksiškumas
Genomu dydis nera proporcingas organizmu
kompleksiškumui
33Kai kurie duomenys apie jau sekvenuotus genomus
Organizmas Dydis, bazines poros Apytikslis genu skaicius Chromosomu skaicius
Homo sapiens (žmogus) 3,164 mln. bp 30,000 46
Rattus norvegicus (žiurke) 2,750 mln. bp 30,000 42
Mus musculus (pele) 2500 mln. bp 30,000 40
Oryza sativa L. (ryžis) 450 mln. bp 40,000 12
Drosophila melanogaster (vaisine musele) 180 mln. bp 13,600 8
Arabidopsis thaliana (baltažiedis vairenis) 125 mln. bp 25,500 5
Caenorhabditis Elegans (apvalioji kirmele) 97 mln. bp 19,100 6
Saccharomyces cerevisiae (mieles) 12 mln. bp 6300 16
Escherichia coli (bakterija) 4.7 mln. bp 3200 1
34Požymis Pinus spp Eucalyptus spp Arabidopsis
Dydis, pg (haploidines lasteles) 24 0,6 0,15
Chromosomu skaicius 12 11 5
Kartotine DNR () 75 75 10
Nesikartojanti DNR () 25 25 90
Koduojanti DNR () 0,3 13,3 50
pg1012g
Eriksson and Ekberg (2001)
35Kokios galimos priežastys genomu dydžio skirtumu
tarp baltažiedžio vairenio (Arabidopsis) ir
daugumos spygliuociu medžiu rušiu? - Daugiau
resursu reikalaujancios DNR sinteze, matyt, nera
didelis kliuvinys - Svarbu pažymeti, kad didelis
genomas koreliuoja su dideliu lasteles
branduoliu, o branduolio dydis savo ruožtu su
letesne mitozes ir mejozes dalijimosi eiga -
Pamineta ypatybe nera svarbi medžiu rušiu
išlikimui. Medžiai ir žoles augancios šiaurinese
platumose pasižymi labai nedideliu DNR turiniu.
Tiketina, kad ta lemia trumpas vegetacijos
sezonas, nes augalams reikia praeiti keleta
vystymosi stadiju - Arabidopsio gyvenimo ciklas
labai trumpas 2-3 savaites nuo seklos iki seklos.
Tik mažas augalo genomas gali leisti toki spartu
lasteliu dalijimasi - Pozityvi didelio genomo
selekcija vyksta daugelyje spygliuociu medžiu
rušiu. Paprastai šios rušys vietoj vandens indu
turi tracheides. Yra nustatytas priežastinis
teigiamas ryšys tarp tracheides produkuojanciu
kambio lasteliu ir branduolio DNR dydžio. 18
Š.Amerikos pušu rušiu tyrimai parode, kad rušys
prisitaike gyventi nepalankiomis salygomis
(pusdykumese) turi didesni genoma nei augancios
optimaliose salygose.
Eriksson and Ekberg (2001)
36Literaturos sarašas
Brown G.R., Gill G.P., Kuntz R.J., Langley C.H.
and Neale D.B. 2004. Nucleotide diversity and
linkage disequilibrium in loblolly pine. PNAS 101
(42) 1525515260. Brown GR., Kadel EE. III,
Bassoni DL., Kiehne KL., Temesgen B., Buijtenen
JP. van, Sewell MM., Marshall KA., Neale DB., van
Buijtenen JPAD 2001. Anchored reference loci in
loblolly pine (Pinus taeda L.) for integrating
pine genomics. Genetics, 159 (2)
799-809. Eriksson G. and Ekberg I. 2001. An
introduction to forest genetics. SLU Repro,
Uppsala. Pp. 166. Neale DB. and Savolainen O.
2004. Association genetics of complex traits in
conifers. Trends in Plant Science 9
325-330. Pavy N., Paule Ch., Parsons L., Crow
J.A., Morency M-J., Cooke J., Johnson J.E.,
Noumen E., Guillet-Claude C., Butterfield Y.,
Barber S., Yang G., Liu J., Stott J., Kirkpatrick
R., Siddiqui A., Holt R., Marra M., Seguin A.,
Retzel E., Bousquet J. and MacKay J. 2005.
Generation, annotation, analysis and database
integration of 16,500 white spruce EST clusters.
BMC Genomics 6 (144) 1-19. Rancelis V. 2000.
Genetika. Lietuvos Mokslu Akademijos leidykla,
Vilnius. Pp. 662. Steane D. 2005. Complete
Nucleotide Sequence of the Chloroplast Genome
from the Tasmanian Blue Gum, Eucalyptus globulus
(Myrtaceae). DNA Research 12 215-220.