FASTA

De Wikipedia, la enciclopedia libre
Saltar a: navegación, búsqueda

FASTA es un programa para alineamiento de secuencias de ADN y de proteínas.

Fue descripto por primera vez (como FASTP) por David J. Lipman y William R. Pearson en 1985 en el artículo "Rapid and sensitive protein similarity searches".[1] El programa original fue diseñado para buscar similitudes de secuencias proteicas. FASTA, descrito en 1988,[2] agregó la posibilidad de hacer búsquedas de ADN contra ADN, ADN contra proteínas traducidas y un programa más sofisticado de aleatorización para evaluar la significancia estadística de los resultados. El nombre FASTA viene de "FAST-ALL" porque busca con cualquier alfabeto, es una extensión de "FAST-P" (proteínas) y "FAST-N" (nucleótido).

El paquete actual de FASTA incluye programas para búsquedas del tipo proteína/proteína, ADN/ADN, proteína/ADN traducido (con cambios del marco de lectura), y búsqueda ordenada y desordenadas de péptidos. Las versiones recientes incluyen un algoritmo para manejar errores de desplazamiento del marco de lectura, las cuales las búsquedas que traducen los seis marcos suelen tener problemas) cuando compara datos de secuencia de proteínas con los nucleotidos.

Además de los métodos de búsqueda heurísticos rápidos, el paquete FASTA provee SSEARCH, una implementación del algoritmo Smith-Waterman. Uno de los principales objetivos del paquete es el cálculo estadístico de las similitudes para que los biólogos puedan juzgar si un alineamiento ha ocurrido por azar o si se puede usar para inferir homología. El paquete FASTA está disponible en fasta.bioch.virginia.edu.

La interfaz web para enviar secuencias para ejecutar una búsqueda en la base de datos del European Bioinformatics Institute (EBI)'s también está disponible en fasta33

El formato de archivo FASTA que se usa como entrada a este programa es actualmente usado por otras herramientas de búsqueda (como BLAST) y programas de alineamiento (Clustal, T-Coffee, ...)

Véase también[editar]

Referencias[editar]

  1. «Rapid and sensitive protein similarity searches». Science 227 (4693):  pp. 1435–41. 1985. doi:10.1126/science.2983426. PMID 2983426. 
  2. «Improved tools for biological sequence comparison». Proceedings of the National Academy of Sciences of the United States of America 85 (8):  pp. 2444–8. 1988. doi:10.1073/pnas.85.8.2444. PMID 3162770. 

Enlaces externos[editar]