Homología de secuencias

De Wikipedia, la enciclopedia libre
Saltar a: navegación, búsqueda
Un alineamiento de secuencias de dos proteínas, obtenido a través de ClustalW.

En Genética y Biología molecular, la homología de secuencias se refiere a la situación en la que las secuencias de dos o más proteínas o ácidos nucleicos son similares entre sí debido a que presentan un mismo origen evolutivo. Usualmente se puede concluir que dos secuencias son homólogas sobre la base de la alta similitud que las mismas presentan. No obstante, la similitud de secuencias es un resultado que proviene directamente de la observación, mientras que la homología es una interpretación de que una alta similitud entre dos secuencias se debe a que las mismas poseen un origen común. De hecho, una alta similitud de secuencias puede deberse simplemente al azar (en las secuencias cortas por ejemplo).

Existen varios algoritmos para agrupar secuencias en familias, las cuales son juegos de secuencias mutuamente homólogas (véase, alineamiento de secuencias y Anexo:Software para alineamiento de secuencias). Algunas de las bases de datos biológicas que colectan secuencias homólogas en genomas animales son, por ejemplo, HOVERGEN,[1] HOMOLENS,[2] HOGENOM.[3]

En la rama genómica de la bioinformática, se usa el concepto de homología de secuencias para predecir la función de un gen: si la secuencia de gen A, cuya función es conocida, es homóloga a la secuencia de gen B, cuya función es desconocida, puede inferirse que B podría compartir la función de A.[4] En la rama estructural de la bioinformática, la homología se usa para determinar qué partes de una proteína son importantes en la formación de la estructura y en la interacción con otras proteínas. En la técnica denominada modelado por homología, esta información se usa para predecir la estructura de una proteína una vez conocida la estructura de una proteína homóloga.[5]

Tipos de secuencias homólogas[editar]

Las secuencias homólogas pueden ser ortólogas o parálogas.[6]

Genes o secuencias ortólogas[editar]

Las secuencias o genes ortólogos son aquellas secuencias homólogas que se han separado por un evento de especiación. Es decir, cuando una especie diverge en dos especies separadas, las copias divergentes de un mismo gen en las especies resultantes se dice que son ortólogas. En otras palabras, las secuencias ortólogas son las secuencias que se encuentran en diferentes especies y que son altamente similares debido a que se han originado en un ancestro común.[7]

La evidencia más concluyente de que dos genes similares son ortólogos es el resultado del análisis filogenético sobre el linaje de ese gen. Los genes que se encuentran dentro del mismo clado son ortólogos ya que descienden del mismo ancestro. Los genes ortólogos usualmente, pero no siempre, tienen la misma función. Las secuencias ortólogas proveen información útil en taxonomía y en estudios filogenéticos. El patrón de divergencia genética puede utilizarse para inferir las relaciones existentes entre especies. Dos especies que se hallan estrechamente relacionadas tendrán secuencias de ortólogos altamente similares. Por el contrario, dos especies filogenéticamente alejadas presentarán una gran divergencia en la secuencia de los genes o secuencias ortólogas bajo estudio.

Algunas otras bases de datos biológicas proveen herramientas para identificar y colectar secuencias ortólogas. Por ejemplo, en eucariotas OrthoMCL,[8] en mamíferos OrthoMaM,[9] en plantas OrthologID[10] y GreenPhylDB[11]

Genes o secuencias parálogas[editar]

Las secuencias homólogas se dicen parálogas si las mismas se hallan separadas por un evento de duplicación. En otras palabras, si un gen de un organismo se duplica para ocupar dos posiciones diferentes en el mismo genoma, entonces las dos copias son parálogas.

Las secuencias o genes parálogos típicamente tienen la misma o similar función, no obstante, muchas veces este no es el caso debido a que no existe la misma fuerza selectiva original sobre la copia duplicada del gen, ésta puede adquirir nuevas funciones por mutación y selección.

Referencias[editar]

  1. HOVERGEN: Homologous Vertebrate Genes Database
    Duret L, Mouchiroud D, Gouy M (June 1994). «HOVERGEN: a database of homologous vertebrate genes». Nucleic Acids Res. 22 (12):  pp. 2360–5. doi:10.1093/nar/22.12.2360. PMID 8036164. PMC 523695. http://nar.oxfordjournals.org/cgi/pmidlookup?view=long&pmid=8036164. 
  2. HOMOLENS: Homologous Sequences in Ensembl Animal Genomes
    Penel S, Arigon AM, Dufayard JF, et al. (2009). «Databases of homologous gene families for comparative genomics». BMC Bioinformatics 10 (Suppl 6):  pp. S3. doi:10.1186/1471-2105-10-S6-S3. PMID 19534752. PMC 2697650. http://www.biomedcentral.com/1471-2105/10%20Suppl%206/S3. 
  3. HOGENOM : Database of Complete Genome Homologous Genes Families
  4. Pellegrini, M., et al. (1999). «Assigning protein functions by comparative genome analysis: Protein phylogenetic profiles». Proceedings of the National Academy of Sciences (EE.UU.) 96 (8). 4285-4288. http://www.pnas.org/content/96/8/4285.full.pdf+html. 
  5. Martí-Renom, M. A., et al. (2000). «Comparative Protein Structure Modeling of Genes and Genomes». Annual Review of Biophysics and Biomolecular Structure 29. Págs. 291-325. http://www.cs.tau.ac.il/~wolfson/bioinfosem05/papers/homology_mod/Sali_annurev.biophys00.pdf. 
  6. Koonin EV (2005). «Orthologs, paralogs, and evolutionary genomics». Annu. Rev. Genet. 39:  pp. 309–38. doi:10.1146/annurev.genet.39.073003.114725. PMID 16285863. http://arjournals.annualreviews.org/doi/abs/10.1146/annurev.genet.39.073003.114725?url_ver=Z39.88-2003&rfr_id=ori:rid:crossref.org&rfr_dat=cr_pub%3dncbi.nlm.nih.gov. 
  7. Fitch, W.M. 1970. Distinguishing Homologous from Analogous Proteins. Systematic Zoology Syst Biol 19: 99-113.
  8. OrthoMCL: Identification of Ortholog Groups for Eukaryotic Genomes
    Chen F, Mackey AJ, Stoeckert CJ, Roos DS (January 2006). «OrthoMCL-DB: querying a comprehensive multi-species collection of ortholog groups». Nucleic Acids Res. 34 (Database issue):  pp. D363–8. doi:10.1093/nar/gkj123. PMID 16381887. PMC 1347485. http://nar.oxfordjournals.org/cgi/pmidlookup?view=long&pmid=16381887. 
  9. OrthoMaM
    Ranwez V, Delsuc F, Ranwez S, Belkhir K, Tilak MK, Douzery EJ (2007). «OrthoMaM: a database of orthologous genomic markers for placental mammal phylogenetics». BMC Evol. Biol. 7:  pp. 241. doi:10.1186/1471-2148-7-241. PMID 18053139. PMC 2249597. http://www.biomedcentral.com/1471-2148/7/241. 
  10. OrthologID
    Chiu JC, Lee EK, Egan MG, Sarkar IN, Coruzzi GM, DeSalle R (March 2006). «OrthologID: automation of genome-scale ortholog identification within a parsimony framework». Bioinformatics 22 (6):  pp. 699–707. doi:10.1093/bioinformatics/btk040. PMID 16410324. http://bioinformatics.oxfordjournals.org/cgi/pmidlookup?view=long&pmid=16410324. 
  11. GreenPhylDB
    Conte MG, Gaillard S, Lanau N, Rouard M, Périn C (January 2008). «GreenPhylDB: a database for plant comparative genomics». Nucleic Acids Res. 36 (Database issue):  pp. D991–8. doi:10.1093/nar/gkm934. PMID 17986457. PMC 2238940. http://nar.oxfordjournals.org/cgi/pmidlookup?view=long&pmid=17986457.