Title: Curs de Doctorat: Bioinformtica
1Curs de Doctorat Bioinformàtica
Index (aproximat i susceptible de molts canvis)
- Comparació de seqüències (relativament
curteslt10.000 bp)
- Comparació de seqüències (llargues 10.000bp
fins milions)
- Engalçament de seqüències (Assembly)
- Cerca i predicció de senyals
2Genoma
- Els cromosomes són els volums duna enciclopèdia
anomanada Genoma.
Les lletres, les paraules i les frases com són?
3Cromosomes les lletres
Llavors un cromosoma serà ... A T A G G C T A C
G C A A A C C G G T C T A ...
4Cromosomes les lletres
... G A C T ...
... C T G A ..
Llavors G A C T A G T C
Si busquem GACT dins la seqüència CACGACTATACGATA
TCGACTCATACGAGTCGTACGTA
Les paraules i les frases com són?
5Cromosomes les frases i les paraules
6Cromosomes activació duna instrucció
Transcripció
Maduració
Traducció
7Cromosomes activació duna instrucció
Plegament
quines fases té?
8Plegament de la proteïna
9Cromosomes activació duna instrucció
Transcripció
Maduració
Traducció
Síntesi
10Dogma central de la biologia molecular
11Síntesi de les proteïnes
Dins la cel.lula mol/cel tipus mRNA
1500 600 tRNA 200000 gt3000 Proteïnes
106 2000
12Activació duna instrucció (a linversa)
Transcripció
Maduració
Traducció
Plegament
13Traducció
LRRLPGAATXXYRTFAAGTRRRXXXWA
Llavors la informació
està codificada com
LRRLPGAATXXYRTFAAGTRRRXXXWA
que és la traducció de
ACUCCAUUCUUUAACAGGGCCAUAUCGGCUAUAGGCCGAGUUAGGUACGA
UUAGCACGGAUACUAGCAUAUGCAUCGUAUAGCAUCGAUUAGAA
14Maduració
LRRLPGAATXXYRTFAAGTRRRXXXWA
Traducció
UCUCCAUUCUUUAACAGGAUAUCGGCUAAGGCCGAGUUAGGUACGAUUAG
CACGGAUAUAGCAUAUGCAUCGUAUAGCAUCGAUUAGAAU
Maduració
Transcripció
15Maduració
16Transcripció
17Cromosoma
Torrades amb mantega i melmelada
Els gens ocupen el 8 del genoma
18Part dun cromosoma
TACGTATACTGCATCGATGCTATACGACGATCGTAGCTACGTACGATCGT
ACGACGTACGTTACGTACGATCGTACGGTACACCGCGCACGATCACACGA
TGCGACGATGCGACGATCGTACGACTGCTACGATGCGACGATGCGACGAT
CGTACGACTGCTAGCTACGCATGCCTGCATCGATGCTATACGACGATCGT
AGCTACGTACGATCGTACGACGTACGTTACGTTGCATCGATGCTATACGA
CGATCGTAGCTACGTACGATCGCGATGCGACGATGCGACGATCGTACGAC
TGCTAGCTACGCATGCCTGCATCGATGCTATACGACGATCGTAGCTACGT
ACGATCGTACGACGTACGTTACGTTGCATCGATGCTATACGACGATCGTA
GCTACGTACGATCGTACGACGTACGTTACGTACGATCGTACGGTACACCG
CGCACGATCACACGATGCGACGATGCGACGATCGTACGACTGCTAGCTAC
GCATGCCTACGTACGTATCCTACGTACGATCGTGCAGCATCGATGCTACG
TACGACGATCGATATTAATGCAATCATGCAGCTGCATGCTAGCGATGCTA
CGACGATCGTACGGTACACCGCGCACGATCACACGATGCGACGATGCGAC
GATCGTACGATGCTGCATCGATGCTATACGACGATCGTAGCTACGTACGA
TCGTACGACGTACGTTACGTACGATCGTACGGTACACCGCGCACGATCAC
ACGATGCGACGATGCGACGATCGTACGACTGCTAGCTACGCATGCCTACG
TACGTATCCTACGTACGATCGTGCAGCATCGATGCTACGTACGACGATCG
ATATTAATGCAATCATGCCGATGCGACGATGCGACGATCGTACGACTGCT
AGCTACGCATGCCTGCATCGATGCTATACGACGATCGTAGCTACGTACGA
TCGTACGACGTACGTTACGTTGCATCGATGCTATACGACGATCGTAGCTA
CGTACGATCGTACGACGTACGTTACGTACGATCGTACGGTACACCGCGCA
CGATCACACGATGCGACGATGCGACGATCGTACGACTGCTAGCTACGCAT
GCCTACGTACGTATCCTACGTACGATCGTGCAGCATCGATGCTACGTACG
ACGATCGATATTAATGCAATCATGCAGCTGCATGCTAGCGATGCTACGAC
GATCGTACGGTACACCGCGCACGATCACACGATGCGACGATGCGACGATC
GTACGATGCTGCATCGATGCTATACGACGATCGTAGCTACGTACGATCGT
ACGACGTACGTTACGTACGATCGTACGGTACACCGCGCACGATCACACGA
TGCGACGATGCGACGATCGTACGACTGCTAGCTACGCATGCCTACGTACG
TATCCTACGTACGATCGTGCAGCATCGATGCTACGTACGACGATCGATAT
TAATGCAATCATGCAGCTGCATGCTAGCGATGCTACGATCGATGCTATAC
GACGATCGTAGCTAGCTGCATGCTAGCGATGCTACGATCGATGCTATACG
ACGATCGTAGCTTACGACGTACGTTACGTACGATCGTACGGTACACCGCG
CACGATCACACGATGCGACGATGCGACGATCGTACGACTGCTAGCTACGC
ATGCCTACGTACGTATCCTACGTACGATCGTCGATGCGACGATGCGACGA
TCGTACGACTGCTAGCTACGCATGCCTGCATCGATGCTATACGACGATCG
TAGCTACGTACGATCGTACGACGTACGTTACGTTGCATCGATGCTATACG
ACGATCGTAGCTACGTACGATCGTACGACGTACGTTACGTACGATCGTAC
GGTACACCGCGCACGATCACACGATGCGACGATGCGACGATCGTACGACT
GCTAGCTACGCATGCCTACGTACGTATCCTACGTACGATCGTGCAGCATC
GATGCTACGTACGACGATCGATATTAATGCAATCATGCAGCTGCATGCTA
GCGATGCTACGACGATCGTACGGTACACCGCGCACGATCACACGATGCGA
CGATGCGACGATCGTACGATGCTGCATCGATGCTATACGACGATCGTAGC
TACGTACGATCGTACGACGTACGTTACGTACGATCGTACGGTACACCGCG
CACGATCACACGATGCGACGATGCGACGATCGTACGACTGCTAGCTACGC
ATGCCTACGTACGTATCCTACGTACGATCGTGCAGCATCGATGCTACGTA
CGACGATCGATATTAATGCAATCATGCAGCTGCATGCTAGCGATGCTACG
ATCGATGCTATACGACGATCGTAGCTGCAGCATCGATGCTACGTACGACG
ATCGATATTAATGCAATCATGCAGCTGCATGCTAGCGATGCTACGACGAT
CGTACGGTACACCGCGCACGATCACACGATGCGACGATGCGACGATCGTA
CGATGCTGCATCGATGCTATACGACGATCGTAGCTACGTACGATCGTACG
ACGTACGTTACGTACGATCGTACGGTACACCGCGCACGATCACACGATGC
GACGATGCGACGATCGTACGACTGCTAGCTACGCATGCCTACGTACGTAT
CCTACGTACGATCGTGCAGCATCGATGCTACGTACGACGATCGATATTAA
TGCAATCATGCAGCTGCATGCTAGCGATGCTACGATCGATGCTATACGAC
GATCGTAGCTGCTACGCATGCCTACGTACGTATCCTACGTACGATCGTGC
AGCATCGATGCTACGTACGACGATCGATATTAATGCAATCATGCAGCTGC
ATGCTAGCGATGCTACGGTACGATCGTCGATCGTcagctcgatacgttac
gatctacgattacgatcatctatactatactatacgatatatctagatat
cgatcta.ACTCCATTCTTTAAACCGTACTACACACACTACTGATCGACG
ATTACGACGACGAAAGGGCCATATCGGCTAACTACATCATAGACAACATC
ACGGATCGTCTAAGGCCGAGTTAGGTACGATTAACGTACGACTACCTATC
GTATATACATCACGGATATAACCTATCTACTACGATTAACACGATCTATC
GTACGGCATATGCATCGTATAGCATCGATTAGAATACGTATACGTACGAT
CGTGCATCGATGCTATACGACGATCGTAGCTACGTACGATCGTACGACGT
ACGTTACGTACGATCGTACGGTACACCGCGCACGATCACACGATGCGACG
ATGCGACGATCGTACGACTGCTAGCTACGCATGCCTACGTACGTATCCTA
CGTACGATCGTGCAGCATCGATGCTACGTTGCATCGATGCTATACGACGA
TCGTAGCTACGTACGATCGTACGACGTACGTTACGTACGATCGTACGGTA
CACCGCGCACGATCACACGATGCGACGATGCGTGCATCGATGCTATACGA
CGATCGTAGCTACGTACGATCGTACGACGTACGTTACGTACGATCGTACG
GTACACCGCGCACGATCACACGATGCGACGATGCGACGATCGTACGACTG
CTAGCTACGCATGCCTGCATCGATGCTATACGACGATCGTAGCTACGTAC
GATCGTACGACGTACGTTACGTTGCATCGATGCTATACGACGATCGTAGC
TACGTACGATCGTACGACGTACGTTACGTACGATCGTACGGTACACCGCG
CACGATCACACGATGCGACGATGCGACGATCGTACGACTGCTAGCTACGC
ATGCCTACGTACGTATCCTACGTACGATCGTGCAGCATCGATGCTACGTA
CGACGATCGATATTAATGCAATCATGCAGCTGCATGCTAGCGATGCTACG
ACGATCGTACGGTACACCGCGCACGATCACACGATGCGACGATGCGACGA
TCGTACGATGCTGCATCGATGCTATACGACGATCGTAGCTACGTACGATC
GTACGACGTACGTTACGTACGATCGTACGGTACACCGCGCACGATCACAC
GATGCGACGATGCGACGATCGTACGACTGCTAGCTACGCATGCCTACGTA
CGTATCCTACGTACGATCGTGCAGCATCGATGCTACGTACGACGATCGAT
ATTAATGCAATCATGCAGCTGCATGCTAGCGATGCTACGATCGCGATGCG
ACGATGCGACGATCGTACGACTGCTAGCTACGCATGCCTGCATCGATGCT
ATACGACGATCGTAGCTACGTACGATCGTACGACGTACGTTACGTTGCAT
CGATGCTATACGACGATCGTAGCTACGTACGATCGTACGACGTACGTTAC
GTACGATCGTACGGTACACCGCGCACGATCACACGATGCGACGATGCGAC
GATCGTACGACTGCTAGCTACGCATGCCTACGTACGTATCCTACGTACGA
TCGTGCAGCATCGATGCTACGTACGACGATCGATATTAATGCAATCATGC
AGCTGCATGCTAGCGATGCTACGACGATCGTACGGTACACCGCGCACGAT
CACACGATGCGACGATGCGACGATCGTACGATGCTGCATCGATGCTATAC
GACGATCGTAGCTACGTACGATCGTACGACGTACGTTACGTACGATCGTA
CGGTACACCGCGCACGATCACACGATGCGACGATGCGACGATCGTACGAC
TGCTAGCTACGCATGCCTACGTACGTATCCTACGTACGATCGTGCAGCAT
CGATGCTACGTACGACGATCGATATTAATGCAATCATGCAGCTGCATGCT
AGCGATGCTACGATCGATGCTATACGACGATCGTAGCTATGCTATACGAC
GATCGTAGCTACGTACGATCGTACGACGTACGTTACGTACGATCGTGCAT
CGATGCTATACGACGATCGTAGCTACGTACGATCGTACGACGTACGTTAC
GTACGATCGTACGGTACACCGCGCACGATCACACGATGCGACGATGCGAC
GATCGTACGACTGCTAGCTACGCATGCCTACTGCATCGATGCTATACGAC
GATCGTAGCTACGTACGATCGTACGACGTACGTTACGTACGATCGTACGG
TACACCGCGCACGATCACACGATGCGACGATGCGACGATCGTACGACTGC
TAGCTACGCATGCCTACGTACGTATCCTACGTACGATCGTGCAGCATCGA
TGCTACGTACGACGATCGATATTAATGCAATCATGCAGCTGCATGCTAGC
GATGCTACGGTACGTATCCTACGTACGATCGTGCAGCATCGATGCTACGT
ACGACGATCGATATTAATGCAATCATGCAGCTGCATGCTAGCGATGCTAC
GTACGGTACACCGCGCACGATCACACGATGCGACGATGCGACGATCGTAC
GACTGCTAGCTACGCATGCCTACGTACGTATCCTACGTACGATCGTGCAG
CATCGATGCTACGTACGACGATCGATATTAATGCAATCATGCAGCTGCAT
GCTAGCGATGCTACGCTGCTAGCTACGCATGCCTACGTACGTATCCTACG
TACGATCGTGCAGCATCGATGCTACGTACGATGCATGCTAGCGATGCTAC
GACGATCGTACGGTACACCGCGCACGATCACACGATGCGACGATGCGACG
ATCGTACGATGCTGCATCGATGCTATACGACGATCGTAGCTACGTACGAT
CGTACGACGTACGTTACGTACGATCGTACGGTACACCGCGCACGATCACA
CGATGCGACGATGCGACGATCGTACGACTGCTAGCTACGCATGCCTACGT
ACGTATCCTACGTACGATCGTGCAGCATCGATGCTACGTACGACGATCGA
TATTAATGCAATCATGCAGCTGCATGCTAGCGATGCTACGATCGATGCTA
TACGACGATCGTAGCTACGTACGATCGTACGACGTACGTTACGTACGATC
GTGCATCGATGCTATACGACGATCGTAGCTACGTACGATCGTACGACGTA
CGTTACGTACGATCGTACGGTACACCGCGCACGATCACACGATGCGACGA
TGCGACGATCGTACGACTGCTAGCTACGCATGCCTACTGCATCGATGCTA
TACGACGATCGTAGCTACGTACGATCGTACGACGTACGTTACGTACGATC
GTACGGTACACCGCGCACGATCACACGATGCGACGATGCGACGATCGTAC
GACTGCTAGCTACGCATGCCTACGTACGTATCCTACGTACGATCGTGCAG
CATCGATGCTACGTACGACGATCGATATTAATGCAATCATGCAGCTGCAT
GCTAGCGATGCTGTCACGTAGCATGCTGACGTACGATCGATTCGATCGAT
CGTACGATCGTAGCTAGCTAGTCGTAGCGACGTAGGATTCACGTAGCGAT
GCGTAGCGTAGCATGCTGACGATGCATCGATCGATGCATCATGCTAGCGT
AGCTAGCTAGCATGACTGATCGATTAACGGTACGTATCCTACGTACGATC
GTGCAGCATCGATGCTACGTACGACGATCGATATTAATGCAATCATGCAG
CTGCATGCTAGCGATGCTACGTACGGTACACCGCGCACGATCACACGATG
CGACGATGCGACGATCGTACGACTGCTAGCTACGCATGCCTACGTACGTA
TCCTACGTACGATCGTGCAGCATCGATGCTACGTACGACGATCGATATTA
ATGCAATCATGCAGCTGCATGCTAGCGATGCTACGCTGCTAGCTACGCAT
GCCTACGTACGTATCCTACGTACGATCGTGCAGCGATCGATATTAATGCA
ATCATGCAGCTGCATGCTAGCGATGCTACGTACGTACGTATCCTACGTAC
GATCGTGCAGCATCGATGCTACGTACGACGATCGATATTAATGCAATCAT
GCAGCTGCATGCTAGCGATGCTACGACGATCGTACGACTGCTAGCTACGC
ATGCCTACGTACGTATCCTACGTACGATCGTGCAGCATCGATGCTACGTA
CGACGATCGATATTAATGCAATCATGCAGCTGCATGCTAGCGATGCTACG
ACGACGATCGATATTAATGCAATCATGCAGCTGCATGCTAGCGATGCTAC
GTACGATCGTATGCTAGCTAGCATGCATGCATGCATGCAT
19On es troba?
TACGTATACTGCATCGATGCTATACGACGATCGTAGCTACGTACGATCGT
ACGACGTACGTTACGTACGATCGTACGGTACACCGCGCACGATCACACGA
TGCGACGATGCGACGATCGTACGACTGCTACGATGCGACGATGCGACGAT
CGTACGACTGCTAGCTACGCATGCCTGCATCGATGCTATACGACGATCGT
AGCTACGTACGATCGTACGACGTACGTTACGTTGCATCGATGCTATACGA
CGATCGTAGCTACGTACGATCGCGATGCGACGATGCGACGATCGTACGAC
TGCTAGCTACGCATGCCTGCATCGATGCTATACGACGATCGTAGCTACGT
ACGATCGTACGACGTACGTTACGTTGCATCGATGCTATACGACGATCGTA
GCTACGTACGATCGTACGACGTACGTTACGTACGATCGTACGGTACACCG
CGCACGATCACACGATGCGACGATGCGACGATCGTACGACTGCTAGCTAC
GCATGCCTACGTACGTATCCTACGTACGATCGTGCAGCATCGATGCTACG
TACGACGATCGATATTAATGCAATCATGCAGCTGCATGCTAGCGATGCTA
CGACGATCGTACGGTACACCGCGCACGATCACACGATGCGACGATGCGAC
GATCGTACGATGCTGCATCGATGCTATACGACGATCGTAGCTACGTACGA
TCGTACGACGTACGTTACGTACGATCGTACGGTACACCGCGCACGATCAC
ACGATGCGACGATGCGACGATCGTACGACTGCTAGCTACGCATGCCTACG
TACGTATCCTACGTACGATCGTGCAGCATCGATGCTACGTACGACGATCG
ATATTAATGCAATCATGCCGATGCGACGATGCGACGATCGTACGACTGCT
AGCTACGCATGCCTGCATCGATGCTATACGACGATCGTAGCTACGTACGA
TCGTACGACGTACGTTACGTTGCATCGATGCTATACGACGATCGTAGCTA
CGTACGATCGTACGACGTACGTTACGTACGATCGTACGGTACACCGCGCA
CGATCACACGATGCGACGATGCGACGATCGTACGACTGCTAGCTACGCAT
GCCTACGTACGTATCCTACGTACGATCGTGCAGCATCGATGCTACGTACG
ACGATCGATATTAATGCAATCATGCAGCTGCATGCTAGCGATGCTACGAC
GATCGTACGGTACACCGCGCACGATCACACGATGCGACGATGCGACGATC
GTACGATGCTGCATCGATGCTATACGACGATCGTAGCTACGTACGATCGT
ACGACGTACGTTACGTACGATCGTACGGTACACCGCGCACGATCACACGA
TGCGACGATGCGACGATCGTACGACTGCTAGCTACGCATGCCTACGTACG
TATCCTACGTACGATCGTGCAGCATCGATGCTACGTACGACGATCGATAT
TAATGCAATCATGCAGCTGCATGCTAGCGATGCTACGATCGATGCTATAC
GACGATCGTAGCTAGCTGCATGCTAGCGATGCTACGATCGATGCTATACG
ACGATCGTAGCTTACGACGTACGTTACGTACGATCGTACGGTACACCGCG
CACGATCACACGATGCGACGATGCGACGATCGTACGACTGCTAGCTACGC
ATGCCTACGTACGTATCCTACGTACGATCGTCGATGCGACGATGCGACGA
TCGTACGACTGCTAGCTACGCATGCCTGCATCGATGCTATACGACGATCG
TAGCTACGTACGATCGTACGACGTACGTTACGTTGCATCGATGCTATACG
ACGATCGTAGCTACGTACGATCGTACGACGTACGTTACGTACGATCGTAC
GGTACACCGCGCACGATCACACGATGCGACGATGCGACGATCGTACGACT
GCTAGCTACGCATGCCTACGTACGTATCCTACGTACGATCGTGCAGCATC
GATGCTACGTACGACGATCGATATTAATGCAATCATGCAGCTGCATGCTA
GCGATGCTACGACGATCGTACGGTACACCGCGCACGATCACACGATGCGA
CGATGCGACGATCGTACGATGCTGCATCGATGCTATACGACGATCGTAGC
TACGTACGATCGTACGACGTACGTTACGTACGATCGTACGGTACACCGCG
CACGATCACACGATGCGACGATGCGACGATCGTACGACTGCTAGCTACGC
ATGCCTACGTACGTATCCTACGTACGATCGTGCAGCATCGATGCTACGTA
CGACGATCGATATTAATGCAATCATGCAGCTGCATGCTAGCGATGCTACG
ATCGATGCTATACGACGATCGTAGCTGCAGCATCGATGCTACGTACGACG
ATCGATATTAATGCAATCATGCAGCTGCATGCTAGCGATGCTACGACGAT
CGTACGGTACACCGCGCACGATCACACGATGCGACGATGCGACGATCGTA
CGATGCTGCATCGATGCTATACGACGATCGTAGCTACGTACGATCGTACG
ACGTACGTTACGTACGATCGTACGGTACACCGCGCACGATCACACGATGC
GACGATGCGACGATCGTACGACTGCTAGCTACGCATGCCTACGTACGTAT
CCTACGTACGATCGTGCAGCATCGATGCTACGTACGACGATCGATATTAA
TGCAATCATGCAGCTGCATGCTAGCGATGCTACGATCGATGCTATACGAC
GATCGTAGCTGCTACGCATGCCTACGTACGTATCCTACGTACGATCGTGC
AGCATCGATGCTACGTACGACGATCGATATTAATGCAATCATGCAGCTGC
ATGCTAGCGATGCTACGGTACGATCGTCGATCGTCAGCTCGATACGTTAC
GATCTACGATTACGATCATCTATACTATACTATACGATATATCTAGATAT
CGATCTA.ACTCCATTCTTTAAACCGTACTACACACACTACTGATCGACG
ATTACGACGACGAAAGGGCCATATCGGCTAACTACATCATAGACAACATC
ACGGATCGTCTAAGGCCGAGTTAGGTACGATTAACGTACGACTACCTATC
GTATATACATCACGGATATAACCTATCTACTACGATTAACACGATCTATC
GTACGGCATATGCATCGTATAGCATCGATTAGAATACGTATACGTACGAT
CGTGCATCGATGCTATACGACGATCGTAGCTACGTACGATCGTACGACGT
ACGTTACGTACGATCGTACGGTACACCGCGCACGATCACACGATGCGACG
ATGCGACGATCGTACGACTGCTAGCTACGCATGCCTACGTACGTATCCTA
CGTACGATCGTGCAGCATCGATGCTACGTTGCATCGATGCTATACGACGA
TCGTAGCTACGTACGATCGTACGACGTACGTTACGTACGATCGTACGGTA
CACCGCGCACGATCACACGATGCGACGATGCGTGCATCGATGCTATACGA
CGATCGTAGCTACGTACGATCGTACGACGTACGTTACGTACGATCGTACG
GTACACCGCGCACGATCACACGATGCGACGATGCGACGATCGTACGACTG
CTAGCTACGCATGCCTGCATCGATGCTATACGACGATCGTAGCTACGTAC
GATCGTACGACGTACGTTACGTTGCATCGATGCTATACGACGATCGTAGC
TACGTACGATCGTACGACGTACGTTACGTACGATCGTACGGTACACCGCG
CACGATCACACGATGCGACGATGCGACGATCGTACGACTGCTAGCTACGC
ATGCCTACGTACGTATCCTACGTACGATCGTGCAGCATCGATGCTACGTA
CGACGATCGATATTAATGCAATCATGCAGCTGCATGCTAGCGATGCTACG
ACGATCGTACGGTACACCGCGCACGATCACACGATGCGACGATGCGACGA
TCGTACGATGCTGCATCGATGCTATACGACGATCGTAGCTACGTACGATC
GTACGACGTACGTTACGTACGATCGTACGGTACACCGCGCACGATCACAC
GATGCGACGATGCGACGATCGTACGACTGCTAGCTACGCATGCCTACGTA
CGTATCCTACGTACGATCGTGCAGCATCGATGCTACGTACGACGATCGAT
ATTAATGCAATCATGCAGCTGCATGCTAGCGATGCTACGATCGCGATGCG
ACGATGCGACGATCGTACGACTGCTAGCTACGCATGCCTGCATCGATGCT
ATACGACGATCGTAGCTACGTACGATCGTACGACGTACGTTACGTTGCAT
CGATGCTATACGACGATCGTAGCTACGTACGATCGTACGACGTACGTTAC
GTACGATCGTACGGTACACCGCGCACGATCACACGATGCGACGATGCGAC
GATCGTACGACTGCTAGCTACGCATGCCTACGTACGTATCCTACGTACGA
TCGTGCAGCATCGATGCTACGTACGACGATCGATATTAATGCAATCATGC
AGCTGCATGCTAGCGATGCTACGACGATCGTACGGTACACCGCGCACGAT
CACACGATGCGACGATGCGACGATCGTACGATGCTGCATCGATGCTATAC
GACGATCGTAGCTACGTACGATCGTACGACGTACGTTACGTACGATCGTA
CGGTACACCGCGCACGATCACACGATGCGACGATGCGACGATCGTACGAC
TGCTAGCTACGCATGCCTACGTACGTATCCTACGTACGATCGTGCAGCAT
CGATGCTACGTACGACGATCGATATTAATGCAATCATGCAGCTGCATGCT
AGCGATGCTACGATCGATGCTATACGACGATCGTAGCTATGCTATACGAC
GATCGTAGCTACGTACGATCGTACGACGTACGTTACGTACGATCGTGCAT
CGATGCTATACGACGATCGTAGCTACGTACGATCGTACGACGTACGTTAC
GTACGATCGTACGGTACACCGCGCACGATCACACGATGCGACGATGCGAC
GATCGTACGACTGCTAGCTACGCATGCCTACTGCATCGATGCTATACGAC
GATCGTAGCTACGTACGATCGTACGACGTACGTTACGTACGATCGTACGG
TACACCGCGCACGATCACACGATGCGACGATGCGACGATCGTACGACTGC
TAGCTACGCATGCCTACGTACGTATCCTACGTACGATCGTGCAGCATCGA
TGCTACGTACGACGATCGATATTAATGCAATCATGCAGCTGCATGCTAGC
GATGCTACGGTACGTATCCTACGTACGATCGTGCAGCATCGATGCTACGT
ACGACGATCGATATTAATGCAATCATGCAGCTGCATGCTAGCGATGCTAC
GTACGGTACACCGCGCACGATCACACGATGCGACGATGCGACGATCGTAC
GACTGCTAGCTACGCATGCCTACGTACGTATCCTACGTACGATCGTGCAG
CATCGATGCTACGTACGACGATCGATATTAATGCAATCATGCAGCTGCAT
GCTAGCGATGCTACGCTGCTAGCTACGCATGCCTACGTACGTATCCTACG
TACGATCGTGCAGCATCGATGCTACGTACGATGCATGCTAGCGATGCTAC
GACGATCGTACGGTACACCGCGCACGATCACACGATGCGACGATGCGACG
ATCGTACGATGCTGCATCGATGCTATACGACGATCGTAGCTACGTACGAT
CGTACGACGTACGTTACGTACGATCGTACGGTACACCGCGCACGATCACA
CGATGCGACGATGCGACGATCGTACGACTGCTAGCTACGCATGCCTACGT
ACGTATCCTACGTACGATCGTGCAGCATCGATGCTACGTACGACGATCGA
TATTAATGCAATCATGCAGCTGCATGCTAGCGATGCTACGATCGATGCTA
TACGACGATCGTAGCTACGTACGATCGTACGACGTACGTTACGTACGATC
GTGCATCGATGCTATACGACGATCGTAGCTACGTACGATCGTACGACGTA
CGTTACGTACGATCGTACGGTACACCGCGCACGATCACACGATGCGACGA
TGCGACGATCGTACGACTGCTAGCTACGCATGCCTACTGCATCGATGCTA
TACGACGATCGTAGCTACGTACGATCGTACGACGTACGTTACGTACGATC
GTACGGTACACCGCGCACGATCACACGATGCGACGATGCGACGATCGTAC
GACTGCTAGCTACGCATGCCTACGTACGTATCCTACGTACGATCGTGCAG
CATCGATGCTACGTACGACGATCGATATTAATGCAATCATGCAGCTGCAT
GCTAGCGATGCTGTCACGTAGCATGCTGACGTACGATCGATTCGATCGAT
CGTACGATCGTAGCTAGCTAGTCGTAGCGACGTAGGATTCACGTAGCGAT
GCGTAGCGTAGCATGCTGACGATGCATCGATCGATGCATCATGCTAGCGT
AGCTAGCTAGCATGACTGATCGATTAACGGTACGTATCCTACGTACGATC
GTGCAGCATCGATGCTACGTACGACGATCGATATTAATGCAATCATGCAG
CTGCATGCTAGCGATGCTACGTACGGTACACCGCGCACGATCACACGATG
CGACGATGCGACGATCGTACGACTGCTAGCTACGCATGCCTACGTACGTA
TCCTACGTACGATCGTGCAGCATCGATGCTACGTACGACGATCGATATTA
ATGCAATCATGCAGCTGCATGCTAGCGATGCTACGCTGCTAGCTACGCAT
GCCTACGTACGTATCCTACGTACGATCGTGCAGCGATCGATATTAATGCA
ATCATGCAGCTGCATGCTAGCGATGCTACGTACGTACGTATCCTACGTAC
GATCGTGCAGCATCGATGCTACGTACGACGATCGATATTAATGCAATCAT
GCAGCTGCATGCTAGCGATGCTACGACGATCGTACGACTGCTAGCTACGC
ATGCCTACGTACGTATCCTACGTACGATCGTGCAGCATCGATGCTACGTA
CGACGATCGATATTAATGCAATCATGCAGCTGCATGCTAGCGATGCTACG
ACGACGATCGATATTAATGCAATCATGCAGCTGCATGCTAGCGATGCTAC
GTACGATCGTATGCTAGCTAGCATGCATGCATGCATGCAT
20Genoma i recerca
Què pretén la bioinformàtica?
1. Poder agafar un cromosoma,
- Cromosoma 1 246Mb
- .
- Cromosoma 22 47Mb
- Cromosoma X 149Mb
- Cromosoma Y 58Mb
21Predicció de promotors i gens
TACGTATACTGCATCGATGCTATACGACGATCGTAGCTACGTACGATCGT
ACGACGTACGTTACGTACGATCGTACGGTACACCGCGCACGATCACACGA
TGCGACGATGCGACGATCGTACGACTGCTACGATGCGACGATGCGACGAT
CGTACGACTGCTAGCTACGCATGCCTGCATCGATGCTATACGACGATCGT
AGCTACGTACGATCGTACGACGTACGTTACGTTGCATCGATGCTATACGA
CGATCGTAGCTACGTACGATCGCGATGCGACGATGCGACGATCGTACGAC
TGCTAGCTACGCATGCCTGCATCGATGCTATACGACGATCGTAGCTACGT
ACGATCGTACGACGTACGTTACGTTGCATCGATGCTATACGACGATCGTA
GCTACGTACGATCGTACGACGTACGTTACGTACGATCGTACGGTACACCG
CGCACGATCACACGATGCGACGATGCGACGATCGTACGACTGCTAGCTAC
GCATGCCTACGTACGTATCCTACGTACGATCGTGCAGCATCGATGCTACG
TACGACGATCGATATTAATGCAATCATGCAGCTGCATGCTAGCGATGCTA
CGACGATCGTACGGTACACCGCGCACGATCACACGATGCGACGATGCGAC
GATCGTACGATGCTGCATCGATGCTATACGACGATCGTAGCTACGTACGA
TCGTACGACGTACGTTACGTACGATCGTACGGTACACCGCGCACGATCAC
ACGATGCGACGATGCGACGATCGTACGACTGCTAGCTACGCATGCCTACG
TACGTATCCTACGTACGATCGTGCAGCATCGATGCTACGTACGACGATCG
ATATTAATGCAATCATGCCGATGCGACGATGCGACGATCGTACGACTGCT
AGCTACGCATGCCTGCATCGATGCTATACGACGATCGTAGCTACGTACGA
TCGTACGACGTACGTTACGTTGCATCGATGCTATACGACGATCGTAGCTA
CGTACGATCGTACGACGTACGTTACGTACGATCGTACGGTACACCGCGCA
CGATCACACGATGCGACGATGCGACGATCGTACGACTGCTAGCTACGCAT
GCCTACGTACGTATCCTACGTACGATCGTGCAGCATCGATGCTACGTACG
ACGATCGATATTAATGCAATCATGCAGCTGCATGCTAGCGATGCTACGAC
GATCGTACGGTACACCGCGCACGATCACACGATGCGACGATGCGACGATC
GTACGATGCTGCATCGATGCTATACGACGATCGTAGCTACGTACGATCGT
ACGACGTACGTTACGTACGATCGTACGGTACACCGCGCACGATCACACGA
TGCGACGATGCGACGATCGTACGACTGCTAGCTACGCATGCCTACGTACG
TATCCTACGTACGATCGTGCAGCATCGATGCTACGTACGACGATCGATAT
TAATGCAATCATGCAGCTGCATGCTAGCGATGCTACGATCGATGCTATAC
GACGATCGTAGCTAGCTGCATGCTAGCGATGCTACGATCGATGCTATACG
ACGATCGTAGCTTACGACGTACGTTACGTACGATCGTACGGTACACCGCG
CACGATCACACGATGCGACGATGCGACGATCGTACGACTGCTAGCTACGC
ATGCCTACGTACGTATCCTACGTACGATCGTCGATGCGACGATGCGACGA
TCGTACGACTGCTAGCTACGCATGCCTGCATCGATGCTATACGACGATCG
TAGCTACGTACGATCGTACGACGTACGTTACGTTGCATCGATGCTATACG
ACGATCGTAGCTACGTACGATCGTACGACGTACGTTACGTACGATCGTAC
GGTACACCGCGCACGATCACACGATGCGACGATGCGACGATCGTACGACT
GCTAGCTACGCATGCCTACGTACGTATCCTACGTACGATCGTGCAGCATC
GATGCTACGTACGACGATCGATATTAATGCAATCATGCAGCTGCATGCTA
GCGATGCTACGACGATCGTACGGTACACCGCGCACGATCACACGATGCGA
CGATGCGACGATCGTACGATGCTGCATCGATGCTATACGACGATCGTAGC
TACGTACGATCGTACGACGTACGTTACGTACGATCGTACGGTACACCGCG
CACGATCACACGATGCGACGATGCGACGATCGTACGACTGCTAGCTACGC
ATGCCTACGTACGTATCCTACGTACGATCGTGCAGCATCGATGCTACGTA
CGACGATCGATATTAATGCAATCATGCAGCTGCATGCTAGCGATGCTACG
ATCGATGCTATACGACGATCGTAGCTGCAGCATCGATGCTACGTACGACG
ATCGATATTAATGCAATCATGCAGCTGCATGCTAGCGATGCTACGACGAT
CGTACGGTACACCGCGCACGATCACACGATGCGACGATGCGACGATCGTA
CGATGCTGCATCGATGCTATACGACGATCGTAGCTACGTACGATCGTACG
ACGTACGTTACGTACGATCGTACGGTACACCGCGCACGATCACACGATGC
GACGATGCGACGATCGTACGACTGCTAGCTACGCATGCCTACGTACGTAT
CCTACGTACGATCGTGCAGCATCGATGCTACGTACGACGATCGATATTAA
TGCAATCATGCAGCTGCATGCTAGCGATGCTACGATCGATGCTATACGAC
GATCGTAGCTGCTACGCATGCCTACGTACGTATCCTACGTACGATCGTGC
AGCATCGATGCTACGTACGACGATCGATATTAATGCAATCATGCAGCTGC
ATGCTAGCGATGCTACGGTACGATCGTCGATCGTCAGCTCGATACGTTAC
GATCTACGATTACGATCATCTATACTATACTATACGATATATCTAGATAT
CGATCTA.ACTCCATTCTTTAAACCGTACTACACACACTACTGATCGACG
ATTACGACGACGAAAGGGCCATATCGGCTAACTACATCATAGACAACATC
ACGGATCGTCTAAGGCCGAGTTAGGTACGATTAACGTACGACTACCTATC
GTATATACATCACGGATATAACCTATCTACTACGATTAACACGATCTATC
GTACGGCATATGCATCGTATAGCATCGATTAGAATACGTATACGTACGAT
CGTGCATCGATGCTATACGACGATCGTAGCTACGTACGATCGTACGACGT
ACGTTACGTACGATCGTACGGTACACCGCGCACGATCACACGATGCGACG
ATGCGACGATCGTACGACTGCTAGCTACGCATGCCTACGTACGTATCCTA
CGTACGATCGTGCAGCATCGATGCTACGTTGCATCGATGCTATACGACGA
TCGTAGCTACGTACGATCGTACGACGTACGTTACGTACGATCGTACGGTA
CACCGCGCACGATCACACGATGCGACGATGCGTGCATCGATGCTATACGA
CGATCGTAGCTACGTACGATCGTACGACGTACGTTACGTACGATCGTACG
GTACACCGCGCACGATCACACGATGCGACGATGCGACGATCGTACGACTG
CTAGCTACGCATGCCTGCATCGATGCTATACGACGATCGTAGCTACGTAC
GATCGTACGACGTACGTTACGTTGCATCGATGCTATACGACGATCGTAGC
TACGTACGATCGTACGACGTACGTTACGTACGATCGTACGGTACACCGCG
CACGATCACACGATGCGACGATGCGACGATCGTACGACTGCTAGCTACGC
ATGCCTACGTACGTATCCTACGTACGATCGTGCAGCATCGATGCTACGTA
CGACGATCGATATTAATGCAATCATGCAGCTGCATGCTAGCGATGCTACG
ACGATCGTACGGTACACCGCGCACGATCACACGATGCGACGATGCGACGA
TCGTACGATGCTGCATCGATGCTATACGACGATCGTAGCTACGTACGATC
GTACGACGTACGTTACGTACGATCGTACGGTACACCGCGCACGATCACAC
GATGCGACGATGCGACGATCGTACGACTGCTAGCTACGCATGCCTACGTA
CGTATCCTACGTACGATCGTGCAGCATCGATGCTACGTACGACGATCGAT
ATTAATGCAATCATGCAGCTGCATGCTAGCGATGCTACGATCGCGATGCG
ACGATGCGACGATCGTACGACTGCTAGCTACGCATGCCTGCATCGATGCT
ATACGACGATCGTAGCTACGTACGATCGTACGACGTACGTTACGTTGCAT
CGATGCTATACGACGATCGTAGCTACGTACGATCGTACGACGTACGTTAC
GTACGATCGTACGGTACACCGCGCACGATCACACGATGCGACGATGCGAC
GATCGTACGACTGCTAGCTACGCATGCCTACGTACGTATCCTACGTACGA
TCGTGCAGCATCGATGCTACGTACGACGATCGATATTAATGCAATCATGC
AGCTGCATGCTAGCGATGCTACGACGATCGTACGGTACACCGCGCACGAT
CACACGATGCGACGATGCGACGATCGTACGATGCTGCATCGATGCTATAC
GACGATCGTAGCTACGTACGATCGTACGACGTACGTTACGTACGATCGTA
CGGTACACCGCGCACGATCACACGATGCGACGATGCGACGATCGTACGAC
TGCTAGCTACGCATGCCTACGTACGTATCCTACGTACGATCGTGCAGCAT
CGATGCTACGTACGACGATCGATATTAATGCAATCATGCAGCTGCATGCT
AGCGATGCTACGATCGATGCTATACGACGATCGTAGCTATGCTATACGAC
GATCGTAGCTACGTACGATCGTACGACGTACGTTACGTACGATCGTGCAT
CGATGCTATACGACGATCGTAGCTACGTACGATCGTACGACGTACGTTAC
GTACGATCGTACGGTACACCGCGCACGATCACACGATGCGACGATGCGAC
GATCGTACGACTGCTAGCTACGCATGCCTACTGCATCGATGCTATACGAC
GATCGTAGCTACGTACGATCGTACGACGTACGTTACGTACGATCGTACGG
TACACCGCGCACGATCACACGATGCGACGATGCGACGATCGTACGACTGC
TAGCTACGCATGCCTACGTACGTATCCTACGTACGATCGTGCAGCATCGA
TGCTACGTACGACGATCGATATTAATGCAATCATGCAGCTGCATGCTAGC
GATGCTACGGTACGTATCCTACGTACGATCGTGCAGCATCGATGCTACGT
ACGACGATCGATATTAATGCAATCATGCAGCTGCATGCTAGCGATGCTAC
GTACGGTACACCGCGCACGATCACACGATGCGACGATGCGACGATCGTAC
GACTGCTAGCTACGCATGCCTACGTACGTATCCTACGTACGATCGTGCAG
CATCGATGCTACGTACGACGATCGATATTAATGCAATCATGCAGCTGCAT
GCTAGCGATGCTACGCTGCTAGCTACGCATGCCTACGTACGTATCCTACG
TACGATCGTGCAGCATCGATGCTACGTACGATGCATGCTAGCGATGCTAC
GACGATCGTACGGTACACCGCGCACGATCACACGATGCGACGATGCGACG
ATCGTACGATGCTGCATCGATGCTATACGACGATCGTAGCTACGTACGAT
CGTACGACGTACGTTACGTACGATCGTACGGTACACCGCGCACGATCACA
CGATGCGACGATGCGACGATCGTACGACTGCTAGCTACGCATGCCTACGT
ACGTATCCTACGTACGATCGTGCAGCATCGATGCTACGTACGACGATCGA
TATTAATGCAATCATGCAGCTGCATGCTAGCGATGCTACGATCGATGCTA
TACGACGATCGTAGCTACGTACGATCGTACGACGTACGTTACGTACGATC
GTGCATCGATGCTATACGACGATCGTAGCTACGTACGATCGTACGACGTA
CGTTACGTACGATCGTACGGTACACCGCGCACGATCACACGATGCGACGA
TGCGACGATCGTACGACTGCTAGCTACGCATGCCTACTGCATCGATGCTA
TACGACGATCGTAGCTACGTACGATCGTACGACGTACGTTACGTACGATC
GTACGGTACACCGCGCACGATCACACGATGCGACGATGCGACGATCGTAC
GACTGCTAGCTACGCATGCCTACGTACGTATCCTACGTACGATCGTGCAG
CATCGATGCTACGTACGACGATCGATATTAATGCAATCATGCAGCTGCAT
GCTAGCGATGCTGTCACGTAGCATGCTGACGTACGATCGATTCGATCGAT
CGTACGATCGTAGCTAGCTAGTCGTAGCGACGTAGGATTCACGTAGCGAT
GCGTAGCGTAGCATGCTGACGATGCATCGATCGATGCATCATGCTAGCGT
AGCTAGCTAGCATGACTGATCGATTAACGGTACGTATCCTACGTACGATC
GTGCAGCATCGATGCTACGTACGACGATCGATATTAATGCAATCATGCAG
CTGCATGCTAGCGATGCTACGTACGGTACACCGCGCACGATCACACGATG
CGACGATGCGACGATCGTACGACTGCTAGCTACGCATGCCTACGTACGTA
TCCTACGTACGATCGTGCAGCATCGATGCTACGTACGACGATCGATATTA
ATGCAATCATGCAGCTGCATGCTAGCGATGCTACGCTGCTAGCTACGCAT
GCCTACGTACGTATCCTACGTACGATCGTGCAGCGATCGATATTAATGCA
ATCATGCAGCTGCATGCTAGCGATGCTACGTACGTACGTATCCTACGTAC
GATCGTGCAGCATCGATGCTACGTACGACGATCGATATTAATGCAATCAT
GCAGCTGCATGCTAGCGATGCTACGACGATCGTACGACTGCTAGCTACGC
ATGCCTACGTACGTATCCTACGTACGATCGTGCAGCATCGATGCTACGTA
CGACGATCGATATTAATGCAATCATGCAGCTGCATGCTAGCGATGCTACG
ACGACGATCGATATTAATGCAATCATGCAGCTGCATGCTAGCGATGCTAC
GTACGATCGTATGCTAGCTAGCATGCATGCATGCATGCAT
2. Predir els promotors i els gens (les frases),
22Bioinformàtica
6. Predir estructura, funció, dominis,...
ACUCCAUUUAACAGGGCCAUAUCGGCUAAGGCCGAGUUAGGUACGAUUAG
CACGGAUAUAGCAUAUGCAUCGUAUAGCAUCGAUUAGAAU
...cagctcgatacgttacgatctacgattacgatcatctatac
tatactatacgatatatctagatatcgatcta.ACTCCATTCTTTAAACC
GTACTACACACACTACTGATCGACGATTACGACGACGAAAGGGCCATATC
GGCTAACTACATCATAGACAACATCACGGATCGTCTAAGGCCGAGTTAGG
TACGATTAACGTACGACTACCTATCGTATATACATCACGGATATAACCTA
TCTACTACGATTAACACGATCTATCGTACGGCATATGCATCGTATAGCAT
CGATTAGAAT..
...cagctcgatacgttacgatctacgattacgatcatctatac
tatactatacgatatatctagatatcgatcta.ACTCCATTCTTTAAACC
GTACTACACACACTACTGATCGACGATTACGACGACGAAAGGGCCATATC
GGCTAACTACATCATAGACAACATCACGGATCGTCTAAGGCCGAGTTAGG
TACGATTAACGTACGACTACCTATCGTATATACATCACGGATATAACCTA
TCTACTACGATTAACACGATCTATCGTACGGCATATGCATCGTATAGCAT
CGATTAGAAT..
23Enllaços
Genbank www.ncbi.nlm.nih.gov/
- Tutorial,..
- Blast,
- Visualitzadors,..
Alemania www.embl.de
Anglaterra www.ebi.ac.uk/
24ALGGEN web site
25Align tools
26List of works
27Preview of two genomes
Pyrococcus abyssis 1.790.334 Pyrococcus
horikoshu 1.763.341 bps
28(No Transcript)
29(No Transcript)
30(No Transcript)
31(No Transcript)
32(No Transcript)
33(No Transcript)
34ALGGEN grup
- Doctorat a lIMIM (codirigit)
- Doctorat a lICO (codirigit)
- 3 PFC enginyeria PROMO,MREPATT,proteines