FASTA - PowerPoint PPT Presentation

1 / 20
About This Presentation
Title:

FASTA

Description:

FASTF/TFASTF y FASTS/TFASTS: compara peque os fragmentos de p pticos / base de ... secuencias de prote na (FASTF/FASTS) o base de datos de secuencias de ADN ... – PowerPoint PPT presentation

Number of Views:187
Avg rating:3.0/5.0
Slides: 21
Provided by: Jazz
Category:
Tags: fasta | fasts

less

Transcript and Presenter's Notes

Title: FASTA


1
FASTA
Introducción a la Bioinformática
2
Semejansas y diferencias entre FASTA y BLAST
  • Ambos programas no usan el mismo sistema de
    puntaje para alinear las secuencias de las bases
    de datos emparejadas con la secuencia query.

3
  • ktup. Tanto FASTA como BLAST usan una estrategia
    de búsqueda inicial basada en palabras cortas.
  • ktup en FASTA es el parámetro que indica el
    tamaño de la palabra utilizada en esta búsqueda
    inicial. FASTA utiliza por default ktup2,
    mientras que BLAST utiliza ktup3.

4
Matrices y scores
5
(No Transcript)
6
  • Homólogos distantes. Existe una opción en FASTA
    (-F) que les permite ignorar (i.e. que no
    aparezcan en el output) secuencias altamente
    similares al query. Esto es útil, por ejemplo,
    para focalizar una búsqueda en las secuencias más
    divergentes. No existe una opción similar en
    BLAST.

7
  • Filtrado de secuencias de baja complejidad. Por
    default, BLAST filtra secuencias de baja
    complejidad o repeticiones. FASTA no!.Esto puede
    afectar la capacidad de discriminar falsos
    positivos, aunque FASTA provee otro tipo de
    opciones para manejar este tipo de casos.

8
  • Muchas secuencias son altamente repetitivas. Si
    la secuencia query contiene regiones de baja
    complejidad o repeticiones, es posible que una
    búsqueda encuentre muchas secuencias no
    relacionadas, con altos scores (por ej hits
    contra colas de poly-A o regiones ricas en
    Prolina) o repeticiones como Alu.
  • BLAST permite filtrar el primer tipo de casos,
    mediante la opción -F.
  • FASTA en cambio no provee esta alternativa. Es el
    usuario el que tiene que filtrar el query antes
    de realizar una búsqueda.

9
  • Secuencias cortas. Si buscamos un primer o un
    péptido, al utilizar BLAST debemos tener en
    cuenta que BLAST no es muy útil al respecto. Esto
    es porque BLAST tiene un límite inferior sobre la
    longitud que puede tener una palabra (ktup). En
    el caso de nucleótidos, el límite inferior es 7
    (el default es 11).
  • En este sentido FASTA es mejor, porque siempre
    pueden usar ktup1. Por otra parte, en el caso
    específico de péptidos, FASTA provee algunos
    algoritmos particulares de búsqueda (fastf3,
    fasts3 y tfasf3, tfasts3).

10
Versiones de FASTA
  • FASTA compara secuencia de una proteína o DNA
    Query / biblioteca de secuencias de proteínas o
    DNA.
  • TFASTA compara secuencia de una proteína Query /
    biblioteca de secuencias de ADN
  • FASTF/TFASTF y FASTS/TFASTS compara pequeños
    fragmentos de pépticos / base de datos de
    secuencias de proteína (FASTF/FASTS) o base de
    datos de secuencias de ADN (TFASTF/TFASTS).

11
  • FASTX y FASTY Traduce una secuencia de ADN en
    sus 3 regiones de marco de lectura forward y
    compara estos 3 marcos con una base de datos de
    proteínas.
  • TFASTX y TFASTY compara una secuencia de
    proteínas con una base de datos de ADN
    traduciendo cada secuencia de ADN en sus 6
    posibles marcos de lectura.

12
  • GRACIAS

13
(No Transcript)
14
  • Ejemplo
  • Realizaremos un FASTA de la secuencia de M. bovis
  • MBOVIS(MrWr)
  • MRALIIVDVQNDFCEGGSLAVTGGAALARAISDYLAEAADYHHVVATKD
    FHIDPGDDFSGTPDYSSSWPPHCVSGTPGADFHPSLDTSAIEAVFYKGAY
    TGAYSGFEGVDENGTPLLNWLRQRGVDEVDVVGIATDHCVRQTAEDAVRN
    GLATRVLVDLTAGVSADTTVAALEEMRTASVELVCSPDGTA

15
(No Transcript)
16
(No Transcript)
17
(No Transcript)
18
(No Transcript)
19
(No Transcript)
20
(No Transcript)
Write a Comment
User Comments (0)
About PowerShow.com