Docente: - PowerPoint PPT Presentation

1 / 29
About This Presentation
Title:

Docente:

Description:

Title: Presentazione di PowerPoint Author: stefania Last modified by: Stefania Created Date: 2/2/2004 3:58:58 PM Document presentation format: Presentazione su schermo – PowerPoint PPT presentation

Number of Views:57
Avg rating:3.0/5.0
Slides: 30
Provided by: stefa192
Category:
Tags: docente

less

Transcript and Presenter's Notes

Title: Docente:


1
Corso di Laurea in Biotecnologie
Sanitarie Universita' di PadovaCorso di
Bioinformatica16 ore
  • Docente
  • Dr. Stefania Bortoluzzi
  • Dipartimento di Biologia
  • Universita' di Padova
  • viale G. Colombo 3, 35131, Padova
  • Tel. 0039 049 8276214
  • Email stefibo_at_bio.unipd.it

2
IV LEZIONE Uso di Genome Browser per
l'annotazione di sequenze genomiche.
Allineamento di sequenze trascritte con sequenze
genomiche BLAT.
3
  • PROGETTO GENOMA UMANO
  • Milestones
  • 1990 Inizio (U.S. Department of Energy and the
    National Institutes of Health)
  • Giugno 2000 Completamento della sequenza
    working draft dellintero genoma umano
  • Febbraio 2001 Pubblicazione prime analisi sul
    genoma completo
  • Aprile 2003 Completamento della sequenza

4
  • Una sequenza viene detta finita quando presenta
    un livello di errore inferiore a 1/10000 basi e
    non ha gaps.
  • Il Progetto Genoma Umano era complesso dal punto
    di vista tecnico ma anche dal punto di vista
    computazionale.
  • Loutput di una singola reazione di sequenza
    (read) 500-800 bp ? Tutti i singoli frammenti
    dovevano essere assemblati in una singola stringa
    lineare.
  • NCBI fornisce ora lassembly di riferimento per i
    3 principali portali genomici
  • MapView
  • Ensembl
  • Genome Browser

5
  • La sequenza primaria del genoma non è
    sufficiente
  • Annotazione del genoma
  • E necessario riportare sullassembly le
    informazioni e i dati sperimentali già ottenuti.
  • Riconciliare e integrare lassembly con le mappe
    fisiche, genetiche e citogenetiche
  • Gli STS sono mappati sulla sequenza usando e-PCR
  • La corrispondenza con la mappa citogenetica
    utilizzando FISH sistematica di BAC.
  • Lannotazione dei geni è attuata con metodi
    leggermente diversi dai 3 genome browser
  • LNCBI allinea mRNA di RefSeq, mRNA di GenBank
    utilizzando MegaBlast.
  • Ensembl allinea tutte le proteine umane note di
    SP/Trembl utilizzando un suo algoritmo
  • UCSC allinea mRNA di Refseq e GenBank e dalle
    ultime release SP/Trembl con BLAT

6
  • Annotazione dei geni
  • ab initio, in base a sensori, funzioni che
    tentano di dedurre la presenza di una
    caratteristica genica in base a motivi o
    proprietà statistiche del DNA.
  • Sensori per TSS (GC)
  • Sensori per siti splicing (AG-GT)
  • Sensori che misurano la composizione in basi di
    esoni putativi
  • Loutput dei vari sensori è combinato per
    generare un modello genico
  • metodi basati sulla similarità lallineamento di
    una regione genomica con un cDNA o un EST sono
    una buona evidenza.
  • Lo splicing alternativo complica
    linterpretazione degli allineamenti tra DNA
    genomico, cDNA e ESTs
  • I dati di similarità sono incompleti trascritti
    poco espressi o espressi transientemente sono
    assenti
  • I programmi di ultima generazione come
    Grail/Exp, Genie EST, GenomeScan combinano
    predizioni ab inizio con dati di similarità
    ottenendo risultati migliori

7
(No Transcript)
8
(No Transcript)
9
(No Transcript)
10
(No Transcript)
11
(No Transcript)
12
(No Transcript)
13
(No Transcript)
14
  • 3 milioni di basi in formato testo nessuna
    utilita
  • Servono
  • Annotazione dellinformazione sulla sequenza
  • Possibilita di recuperare velocemente la
    sequenza di regioni specifiche del genoma in base
    a criteri di
  • Contenuto di informazione
  • Caratteristiche di sequenza
  • Genomi
  • disponibili
  • Human
  • Homo sapiens assembly
  • 99 delle regioni contenenti geni
  • accuratezza 99.99
  • 2.84 Gb finite highly contiguous
  • Species
  • A. gambiae
  • A. mellifera
  • C. briggsae
  • C. elegans
  • C. intestinalis
  • Chicken
  • Chimp
  • Cow
  • D. ananassae
  • D. erecta

UCSC Genome Browser Sistema per la
navigazione della sequenza e dellannotazione
di genomi, che permette la visualizzazione
dellinformazione a diverso ingrandimento ed il
recupero di porzioni di sequenza con associate le
informazioni di annotazione, come Geni noti e
geni predetti ESTs, mRNAs Isole CpG assembly gaps
e coverage, bande cromosomiche Omologia con altri
genomi
D. yakuba Dog Fugu Human Mouse Opossum Rat Rhesus
S. purpuratus SARS Tetraodon X.
tropicalis Yeast Zebrafish
15
  • UCSC Genome Browser
  • Molte possibilita per la ricerca di una regione
    specifica
  • chr7 un cromosoma intero
  • 20p13 una regione (banda p13 del cr. 20)
  • chr31-1000000 il primo milione di basi del cr.
    3 dal ptel
  • D16S3046 regione intorno al marcatore (100,000
    basi per lato)
  • RH18061RH80175 regione tra i due marcatori
  • AA205474 regione genomica che si allinea con
    la sequenza con questo GB accession number
  • PRNP regione del genoma che comprende il gene
    PRNP
  • NM_017414
  • NP_059110
  • 11274 (LLID)
  • Oppure di liste di regioni
  • pseudogene mRNA Lists transcribed pseudogenes,
    but not cDNAs
  • homeobox caudal Lists mRNAs for caudal homeobox
    genes
  • zinc finger Lists many zinc finger mRNAs
  • huntington Lists candidate genes associated
    with Huntington's disease

16
(No Transcript)
17
(No Transcript)
18
(No Transcript)
19
Overview of the wholeGenome Browser page(mature
release)

Genome viewer section
Groups of data
20
Sample Genome Viewer image, BRCA1 region
21
Annotation Track options, defined
  • Hide removes a track from view

22
Clicking an annotation line, new page of
detailed information
You will get detail for that single item you
click Example click on the BRCA1 Black Known
Genes line
23
Click annotation track BRCA1 Known gene
detail page
informative description
Not all genes have This much detail. Different
annotation tracks carry different detail data.
other resource links
links to sequences
microarray data
mRNA secondary structure
protein domains/structure
homologs in other species
Gene Ontology descriptions
mRNA descriptions
pathways
24
Getting the sequencesGet DNA, with Extended
Options or Details pages
  • Use the DNA link at the top
  • Plain or Extended options
  • Change colors, fonts, etc.

25
Accessing the BLAT tool
BLAT BLAST-like Alignment Tool
  • Rapid searches by INDEXING the entire genome
  • Works best with high similarity matches

26
BLAT tool overview www.openhelix.com/sampleseqs.
html
27
BLAT results, with links
  • Results with demo sequences, settings default
    sort Query, Score
  • Score is a count of matcheshigher number, better
    match
  • Click browser to go to Genome Browser image
    location (next slide)
  • Click details to see the alignment to genomic
    sequence (2nd slide)

28
BLAT results, alignment details browser
  • From browser click in BLAT results
  • A new line with your Sequence from BLAT Search
    appears!

29
BLAT results,alignment details
Write a Comment
User Comments (0)
About PowerShow.com