Ir al contenido

Inferencia de transferencia genética horizontal

De Wikipedia, la enciclopedia libre

La inferencia de transferencia genética horizontal o lateral es una forma de estudiar la historia evolutiva de los genes mediante la filogenética computacional. La transferencia genética horizontal (TGH o TGL) consiste en la transmisión de partes de ADN genómico entre organismos a través de un proceso desacoplado de la herencia vertical por reproducción. Este fenómeno complica las investigaciones del parentesco evolutivo de linajes y especies, por lo que es importante determinar su presencia y las especies implicadas. Para detectar la transferencia genética horizontal se utilizan dos tipos de métodos:

1) Los métodos paramétricos se basan en el análisis de la secuencia del genoma de la especie huésped para identificar desviaciones del promedio genómico. Estos métodos eran muy importantes cuando existían pocos genomas secuenciados de especies relacionadas, pero fallan en la detección de eventos de transferencia genética horizontal muy lejanos en el tiempo.

2) Los métodos filogenéticos explotan la disponibilidad de secuencias genómicas para efectuar una comparación entre genomas relacionados. Suelen caracterizar mejor los eventos de transferencia genómica —notablemente al determinar la especie donadora y el tiempo de transferencia— Sin embargo, también están sujetos a fallos.

En la práctica, la combinación de diferentes métodos mejora la inferencia, aunque también conlleva el riesgo de falsos positivos.[1]

Transferencia genética horizontal

[editar]

Frederick Griffith demostró la transferencia genética horizontal en 1928 al observar en un experimento que cepas virulentas de Streptococcus pneumoniae eran capaces de transmitir la virulencia a cepas no virulentas mediante un mecanismo conocido como transformación.[2]​ Observaciones similares en las décadas de los cuarenta[3]​ y cincuenta[4]​ del siglo XX evidenciaron la existencia de mecanismos adicionales de transferencia horizontal: la conjugación y la transducción.[5]

Aunque los eventos de TGH pueden no resultar en cambios fenotípicos, se puede inferir si han tenido lugar mediante el análisis de la secuencia genómica. Estos análisis se pueden dividir en dos grupos según el enfoque adoptado: métodos paramétricos y filogenéticos. Los métodos paramétricos se centran en la búsqueda de secuencias de ADN que difieran significativamente del promedio genómico en parámetros como el contenido de las bases CG o el uso preferencial de codones. Los métodos filogenéticos examinan la historia evolutiva de los genes en diferentes especies e identifican filogenias incompatibles.[6]

Métodos paramétricos

[editar]

Los métodos paramétricos utilizan marcadores genéticos, característicos de especies relacionadas o clados, para inferir la transferencia genómica horizontal. La diferencia entre un fragmento del genoma y el marcador es un indicio de una posible transferencia horizontal. Por ejemplo, el porcentage de guanina y citosina (GC) es característico del genoma del organismo y los segmentos genómicos con un porcentaje muy diferente del promedio pueden provenir de un evento de TGH desde otra especie. Los marcadores genéticos usualmente utilizados para detectar TGH incluyen la composición de nucleótidos,[7]​ las frecuencias de oligonucleótidos[8]​ o características estructurales del genoma.[9]

Para que estos métodos funcionen, los marcadores genéticos deben ser claramente reconocibles. Sin embargo, el genoma de una especie no es siempre uniforme: por ejemplo, el contenido GC es menor en el tercer nucleótido de los codones cerca del terminador de replicación,[10]​ y mayor en genes altamente expresados.[11]​ Esta variabilidad intragenómica debe tomarse en cuenta para evitar marcar segmentos nativos como productos de transferencia genética horizontal.[12]

Es igualmente importante que los segmentos transferidos horizontalmente exhiban los marcadores genéticos de la especie donante. Sin embargo, las secuencias transferidas experimentan los mismos procesos mutacionales que el resto del genoma de la especie receptora, lo que borra lentamente los indicios de transferencias ocurridas mucho tiempo atrás hasta que es imposible detectarlas mediante métodos paramétricos.[13]​ Por ejemplo, Bdellovibrio bacteriovorus, una δ-proteobacteria depredadora, tiene un contenido GC homogéneo, por lo que cabría concluirse que su genoma es resistente a la transferencia genómica horizontal.[14]​ Sin embargo, un análisis posterior basado en métodos filogenéticos identificó varias TGH antiguas.[15]​ Asimismo, si el segmento insertado se ha asimilado previamente al genoma del receptor, como es el caso de las inserciones de profagos,[16]​ los métodos paramétricos pueden fallar. Además, la composición de la especie donante debe ser significativamente diferente de la de la especie receptora, una condición que puede perderse en el caso de que la distancia genética entre las especies sea pequeña o mediana, lo cual es muy prevalente. Por último, los genes adquiridos recientemente tienden a ser más ricos en AT que el promedio del receptor,[7]​ lo que indica que las diferencias en contenido GC pueden provenir procesos mutacionales desconocidos después de la adquisición y no del genoma del donante.

Composición de nucleótidos

[editar]
Contenido medio CG en regiones codificantes de varias especies de bacterias en comparación con el tamaño del genoma.

El contenido GC bacterial varía mucho, entre el 13,5 % de Ca. Zinderia insecticola,[17]​ y et 75 % de Anaeromyxobacter dehalogenans.[18]​ Incluso dentro de un mismo grupo el porcentaje puede ser bastante diferente, como en el caso de las α-Proteobacterias, donde el promedio varía entre el 30 % y el 65 % aproximadamente.[19]​ Estas diferencias sirven para inferir sucesos de transferencia genómica.[7]

Espectro de oligonucleótidos

[editar]

El espectro de oligonucleótidos (o frecuencias de k-mero) mide la frecuencia de todas las posibles secuencias de nucleótidos de una longitud dada en el genoma. Esta cantidad varía menos en un genoma que entre genomas y puede, por lo tanto, utilizarse como un marcador genético para inferir fenómenos de transferencia horizontal.[20]

La utilidad del espectro de oligonucleótidos viene dada por el número de oligonucleótidos posibles: 4n, donde n es el tamaño del oligonucleótido; por ejemplo, hay 45=1024 posible pentanucleótidos. Algunos métodos capturan las frecuencias en patrones de tamaño variable.[21]

El uso preferencial de codones, una medida relacionada con la frecuencia de codones, fue uno de los primeros métodos utilizados para detectar sistemáticamente la transferencia genómica horizontal.[8]​ Este enfoque requiere un genoma receptor con una tendencia hacia ciertos codones sinónimos —diferentes codones que codifican el mismo aminoácido— claramente diferente de la tendencia en el genoma de la especie donante. El oligonucleótido más simple utilizado como marcador genético es el dinucleótido; por ejemplo, el tercer nucleótido en un codón y el primer nucleótido en el siguiente codón representan el dinucleótido menos restringido por la preferencia de aminoácidos y de codones.[22]

Es importante optimizar el tamaño del rango del genoma donde se computa la frecuencia de oligonucleótidos: un rango amplio amortigua la variabilidad del genoma de la especie receptora, pero dificulta la detección de TGH de regiones pequeñas.[23]​ Un rango de 5 kb con una separación de 0.5 kb se considera un buen compromiso para obtener las frecuencias de tetranucleótidos.[24]​ las cadenas de Markov son un método conveniente para modelar marcadores genéticos de oligonucleótidos. La transición de la matriz de probabilidad se deriva para genes endógenos contra genes adquiridos,[25]​ de donde se calculan las probabilidades a posteriori bayesianas para un segmento particular de ADN.[26]

Características estructurales

[editar]

Las características estructurales del ADN —como la energía de interacción entre pares de bases vecinos,[27]​ el ángulo de giro entre dos pares de bases no coplanares[28]​ o la deformación del ADN inducida por las proteínas que interactúan con la cromatina,[29]​— pueden representarse como una secuencia numérica. El análisis de autocorrelación de tales secuencias muestra periodicidades características en genomas completos.[30]​ Este tipo de análisis se usó para comparar el espectro de periodicidad de regiones del genoma de la bacteria termofílica Thermotoga maritima,[31]​ con el de regiones homólogas en la archaea Pyrococcus horikoshii.[9]​ Los resultados de este estudio sirvieron de apoyo a la hipótesis de una transferencia genómica masiva entre los reinos bacteria y archaea.[9]

Contexto genómico

[editar]

Las islas genómicas, regiones adquiridas por transferencia horizontal de típicamente 10–200 kb de tamaño permiten identificar genes no nativos por su posición en un genoma.[32]​ Por ejemplo, un gen de origen ambiguo que forma parte de un operón no nativo es a su vez muy probablemente adquirido. La repetición de secuencias en ambos extremos de una región o la presencia de integrasas o transposasas pueden indicar una región no nativa.[33]

Un programa de aprendizaje automático que combina análisis de frecuencia de oligonucleótidos con el contexto genómico ha dado buenos resultados en la identificación de islas genómicas.[34]​ El contexto también se ha utilizado como un indicador secundario, después de descartar genes de origen conocido basándose en otros métodos paramétricos.[35]

Métodos filogenéticos

[editar]

La secuenciación de numerosos genomas ha facilitado el uso de los análisis filogenéticos en la detección de tranferencias horizontales. Los métodos filogenéticos detectan inconsistencias en la historia de la evolución de los genes de dos formas: explícitamente, reconstruyendo el árbol genético y reconciliándolo con el árbol de una especie de referencia, o implícitamente, examinando aspectos que se correlacionan con la historia evolutiva de los genes estudiados, ej. patrones de presencia o ausencia entre especies o distancias evolutivas inesperadamente cortas o distantes.

Métodos filogenéticos explícitos

[editar]

El objetivo de los métodos filogenéticos explícitos es comparar los árboles de genes de una especie con los de especies relacionadas. Las diferencias estadísticamente significativas pueden deberse a una transferencia genómica entre especies. Este es el caso si dos genes de diferentes especies muy distantes comparten un nodo de conexión ancestral reciente en el árbol genético. Este enfoque puede producir resultados más específicos que los métodos paramétricos porque es capaz de identificar tanto las especies implicadas como el momento y la dirección de la transferencia genética.

Los métodos filogenéticos comprenden desde métodos simples que identifican meras diferencias entre árboles de genes y de especies hasta modelos mecanísticos que infieren posibles secuencias de eventos de transferencia. Los métodos de espectro genómico adoptan una estrategia intermedia consistente en deconstruir un árbol genético en partes más pequeñas hasta que cada una corresponda al árbol de especies.

El éxito de los métodos filogenéticos explícitos depende de la exactitud del árbol genético y de especie utilizado, pero estos pueden ser difíciles de construir.[36]​ Incluso cuando los árboles utilizados son fiables, las filogenias en conflicto pueden ser el resultado de procesos evolutivos como duplicaciones y paridad en vez de tranferencia horizontal. Similarmente, en la presencia de una clasificación incompleta de linaje, los métodos filogenéticos explícitos pueden inferir erróneamente una transferencia genómica horizontal.[37]​ Esta es la razón por la cual algunos métodos explícitos basados en modelos prueban muchos escenarios evolutivos y evalúan sus predicciones mediante criterios de parsimonia o probabilísticos.

Pruebas de topologías

[editar]

Las pruebas estadísticas de topología son útiles para detectar conjuntos de genes poco ajustados al árbol de referencia. Entre estos métodos se cuentan las pruebas de Kishino–Hasegawa (KH),[38]​ Shimodaira–Hasegawa (SH),[39]​ y Aproximadamente Imparcial (AU por su siglas en inglés Approximately Unbiased).[40]​ Consisten en calcular la probabilidad del alineamiento de la secuencia del gen cuando la topología del genoma de referencia se toma como la hipótesis nula.

El rechazo de la topología de referencia es una indicación de que la historia evolutiva para la familia del gen es inconsistente con el árbol de referencia. La transferencia genómica se infiere cuando las inconsistencias no pueden explicarse por otros efectos, como la pérdida o duplicación de genes. Las pruebas de topología no infieren cómo surgen las diferencias con los árboles de referencia; para esto se precisan otros algoritmos.

Técnicas de espectro genómico

[editar]

Para poder localizar los eventos de transferencia genómica horizontal, las técnicas de espectro genómico descomponen un árbol genético en subestructuras, como biparticiones o cuartetos, e identifican las que son consistentes o inconsistentes con el árbol de la especie.

Biparticiones

Se denomina bipartición a cada uno de los subárboles desconectados —con nodos separados— generados a partir de un árbol de referencia. Si una bipartición está presente tanto en el árbol genético como en el de la especie estudiada, es compatible; si se detectan conflictos, estos pueden indicar transferencia genética o ser simplemente el resultado de la incertidumbre de la inferencia del árbol genético. Para reducir la incertidumbre, los análisis de bipartición se concentran típicamente en biparticiones muy probables estadísticamente.[41][42]

Descomposición de cuartetos

Los cuartetos son árboles que consisten en cuatro hojas. En árboles bifurcados (completamente resueltos), cada rama interna induce un cuarteto cuyas hojas son subárboles del árbol original o hojas del árbol original. Si la topología de un cuarteto extraído del árbol de especies de referencia no es compatible con el árbol genético puede haberse dado una tranferencia genómica.[43]​ los métodos cartográficos de cuartetos son mucho más eficientes computacionalmente y se usan mucho para hallar eventos de transferencia genómica en bases de datos de cientos de genomas completos.[44][45]

Poda e injerto de subárboles

[editar]

El término «poda e injerto de subárboles» (subtree pruning and regrafting o SPR) engloba métodos mecanísticos para modelar eventos de transferencia genética horizontal. Consisten en eliminar una rama en el árbol de referencia (poda) e injertarla en otro extremo.[46]​ Cuando existen inconsistencias entre el árbol genético original y el árbol de referencia es posible obtener una topología consistente mediante una o más operaciones SPR aplicadas al árbol de referencia; esto permide identificar nodos que han experimentado transferencia genética, así como inferir los genomas de las especies donante y receptora.[42][47]​ Para evitar falsos positivos debido a la incertidumbre de la topología del árbol genético, se pueden ignorar a priori los extremos poco probables,[48]​ o calcular un criterio de optimalidad tras los cómputos.[49][50]

El reto que posan estos métodos radica en encontrar el camino óptimo de edición, es decir, el que requiera el menor número de pasos,[51][52]​. Existen varias estrategias para resolver el problema. Por ejemplo, el algoritmo HorizStory reduce el problema primero eliminando los nodos consistentes;[53]​ las podas e injertos repetitivos reconcilian el árbol de referencia con el árbol genético y las ediciones óptimas son interpretadas como el resultado de transferencia genómica horizontal.

Métodos de reconciliación basados en modelos

[editar]

La reconciliación de un árbol genético con el árbol de las especies consiste en trazar un mapa de los cambios evolutivos en el árbol genético de tal forma que concuerde con al árbol de especies. Existen diferentes modelos de reconciliación según el tipo de acontecimiento escogido para explicar las incongruencias entre las topologías de los árboles. Los primeros modelos se basaban exclusivamente en transferencias horizontales (T).[46][49]​ Los más recientes incluyen también eventos de duplicación (D), pérdida (L), clasificación incompleta de linajes (ILS) o recombinación homóloga (HR). La inclusión de múltiples tipos de eventos conlleva la dificultad de un mayor número de posibles reconciliaciones: por ejemplo, una topología conflictiva puede explicarse mediante una única transferencia genómica horizontal o mediante múltiples eventos de duplicación y pérdidas y ambas alternativas son posibles dependiendo de la frecuencia de cambios en el árbol de especies.

Los métodos de reconciliación se sirven de criterios de parsimonia o probabilísticos para inferir el evento más probable fijando a priori la probabilidad de eventos D, T y L a partir de los datos disponibles.[54]​ Las reconciliaciones DTL posibles y su probabilidades relativas pueden ser explorados eficientemente mediante algortimos de programación dinámica.[54][55][56]​ Algunos programas permiten refinar la topología del árbol genético en regiones donde es incierta para obtener un escenario evolutivo más probable un evento evolutivo, al igual que el alineamiento inicial de la secuencia genómica.[55][57][58]​ Los modelos más refinados toman en cuenta la mayor frecuencia de transferencia horizontal entre linajes estrechamente relacionados,[59]​ y reflejan la pérdida de la eficiencia de recombinación homóloga con la distancia filogenética;[60]​ también tienen en cuenta la presencia de clasificación incompleta de linajes,[61]​ o que la especie donante en la mayoría de casos de transferencia genómica horizontal pertenece a un linaje extinto o no muestreado.[62]​ El desarrollo de Los modelos DTL se encamina hacia una descripción integral del proceso de evolución del genoma.[63][64]

Métodos filogenéticos implícitos

[editar]

En contraste con los métodos filogenéticos ,que comparan la concordancia entre los árboles genético y de especies, los métodos filogenéticos implícitos comparan las distancias evolutivas o la similitud de las secuencias. Aquí, una distancia inesperadamente corta o grande respecto a la secuencia de referencia puede indicar transferencia genómica horizontal. Como la construcción de un árbol no es necesaria, los métodos implícitos tienden a ser más simples y rápidos que los métodos explícitos. Los métodos implícitos pueden fallar por la presencia de disparidades entre la filogenia correcta y las distancias evolutivas consideradas. Por ejemplo, las secuencia más similares según la puntuación BLAST no son siempre las más cercana evolutivamente.[65]

Concordancia de secuencias con especies distantes

[editar]

Una manera simple de identificar sucesos de transferencia genómica consiste en buscar relaciones entre secuencias relacionadas en especies distantes. Por ejemplo, un análisis de las secuencias de proteínas de la bacteria Thermotoga maritima reveló correspondencias con archaeas en vez de con otras bacterias, lo que sugiere una transferencia horizontal extensiva con el primer linaje;[31]​ esta predicción fue después corroborada por un análisis de las estructura del ADN.[9]​ La principal limitación de este método es que solo puede detectar transferencias genómicas relativamente recientes. Si la transferencia ocurrió en el ancestro común de dos o más especies incluidas en la base de datos, se hallará una la correspondencia alta dentro del clado y la transferencia no será detectada. La capacidad de encontrar correspondencias con secuencias foráneas es altamente dependiente de la cobertura taxonómica de las bases de datos y los parámetros experimentales para la búsqueda deben ser definidos de manera ad hoc.[66]

Discrepancia ente distancias de genes y especies

[editar]

La hipótesis del reloj molecular plantea que los genes homólogos en diferenctes especies evolucionan a una velocidad aproximadamente constante.[67]​ Según este postulado, el árbol de genes homólogos relacionados por especiación (genes ortólogos) presenta una correspondencia alta con al árbol de especies, y la distancia evolutiva entre genes ortólogos es aproximadamente proporcional al las distancias evolutivas entre las respectivas especies. Los genes xenólogos (pares de genes relacionados por transferencia genómica) introducen discrepancias entre las distancias evolutivas de los genes y de las especies.[68]

Un método simple para detectar estas discrepancias consiste en comparar la distribución del grado de similitud entre secuencias genéticas y sus contrapartes ortólogas en otras especies; valores atípicos en esta distribución pueden deberse a sucesos de transferencia horizontal de genes.[69][70]​ Los métodos DLIGHT (Inferencia basada en Probabilidad de la Distancia de Genes Horizontalmente Transferidos o 'Distance Likelihood-based Inference of Genes Horizontally Transferred') consideran simultáneamente el efecto de la transferencia genómica en todas las secuencias entre grupos de ortólogos putativos:[6]​ si la prueba de razón de verosimilitud aplicada a la hipótesis de presencia de transferencia horizontal contra la hipótesis de su ausencia arroja un resultado significativo, se puede inferir un caso de transferencia genómica. Además, este método proporciona una estimación del tiempo desde la última transferencia genética y una identificación de las potenciales especies donadoras y receptoras.

Perfiles filogenéticos

[editar]

El perfil filogenético de un grupo de especies de basa en la presencia o ausencia de genes ortólogos en los genomas.[71]​ La trasferencia genómica horizontal da lugar a distribuciones inusuales de los genes dentro del group. Por ejemplo, los genomas de las tres cepas facultativamente simbióticas de Frankia son de diferentes tamaños: 5.43 Mpb, 7.50 Mpb y 9.04 Mpb, según sus rangos de especies huéspedes.[72]​ Muchas porciones de genes específicos a cada cepa no existen en la base de datos de referencia, lo que sugiere que proceden de otras bacterias no relacionadas. Similarmente, las tres cepas diversamente fenotípicas de Escherichia coli (uropatogénica, enterohemorrágica y benigna) comparten cerca del 40 % de su genoma, mientras que el otro 60 % de los genes son únicos para cada cepa y posiblemente adquiridos por transferencia horizontal.[73]​ Otros indicios que apuntan a una transferencia genómica son el uso de codones diferentes con respecto a los genes comunes y la falta de la conservación del orden genético típica de genes procedentes de procesos evolutivos verticales.[73]

La presencia o ausencia de genes homólogos sirve para reconstruir el escenario evolutivo más probable en el árbol de especies. Al igual que en los métodos de reconciliación, estas computaciones se pueden basar en el principio de parsimonia[74]​ o en estimaciones de la probabilidad de ganancias o pérdidas de genes.[75][76]​ Los modelos más complejos incorporan otros procesos, como la truncación de genes,[77]​ y cálculos de la variación de ganancias y pérdidas en diferentes linajes[78]​ y familias de genes.[76][79]

Agrupaciones de sitios polimórficos

[editar]

Normalmente se considera que la transferencia horizontal ocurre para genes enteros. Sin embargo, se dan también casos de transferencia de fragmentos de un gen. Por ejemplo, se ha demostrado que un tipo de transferencia llamada conversión genética, mediada por recombinación homóloga entre especies relacionadas estrechamente, resulta en intercambios de fragmentos de marcos abiertos de lectura.[80][81]​ El análisis de un grupo de cuatro cepas de Escherichia coli y dos de Shigella flexneri reveló que las secuencias comunes a las seis cepas contenían sitios polimórficos, consecuencia de recombinación homóloga.[82]​ Agrupaciones excesivas de sitios polimórficos pueden indicar que el ADN se ha recombinado con el de otras especies.[83]​ Este método de detección solo puede aplicarse a sitios en común para todas las secuencias analizadas, en grupos de organismos estrechamente relacionados.

Evaluación

[editar]

La existencia de diversos métodos para inferir transferencia genómica horizontal plantea la cuestión de cómo validar inferencias individuales y cómo comparar los resultados obtenidos con diferentes métodos.

Puesto que la verdadera historia evolutiva no puede ser establecida con seguridad, es difícil obtener un conjunto de datos de referencia. Además, los diferentes métodos suelen discrepar en la identificación de genes adquiridos por transferencia horizontal[84][85]​ y no está claro si hay alguna forma de combinar los resultados — por intersección, unión, etc.— que minimice la proporción de falsos positivos y falsos negativos.[1]

Es difícil pronunciarse sobre el desempeño comparativo de los métodos paramétricos y filogenéticos, porque usan diferentes fuentes de información. Mientras que los métodos paramétricos están limitados al análisis de genomas únicos o en parejas, los métodos filogenéticos permiten explotar la información contenida en múltiples genomas. En muchos casos, los segmentos de genomas señalados como provenientes de una transferencia horizontal por su composición anómala se pueden reconocer también por medio de análisis filogenéticos o simplemente por su ausencia en los genomas de organismos relacionados. Los métodos filogenéticos dependen de modelos explícitos de la evolución de secuencias genéticas para definir los parámetros de inferencia, pruebas de hipótesis y selección de modelos. Esto se refleja en la literatura científica, que tiende a favorecer los métodos filogenéticos como prueba estándar de transferencia genómica horizontal.[86][87][88][89]​ La preferencia por los métodos filogenéticos aumenta también gracias al incremento en el poder computacional, acompañado de mejoras de algoritmos que los hacen más manejables,[90][62]​ y a la cada vez mayor cantidad de genomas secuenciados.

Existen varios métodos para validar las inferencias de transferencia genómica horizontal mediante análisis filogenéticos, consistentes en su mayoría en simulaciones. Las simulaciones permiten calcular el número de falsos positivos y negativos, puesto que la respuesta correcta es conociada de antemano, pero la validez de las simulaciones no se puede establecer totalmente en la práctica, puesto que se desconoce la frecuencia exacta de transferencia genómica horizontal en la naturaleza. No obstante, las simulaciones proporcionan una evoluación comparativa de diferentes métodos y ayudan a los investigadores a elegir las herramientas adecuadas.[50]

Herramientas estándar para simular la evolución de secuencias, como INDELible[91]​ o PhyloSim[92]​ pueden adaptarse para simular transferencia genómica horizontal mediante algoritmos de poda e injerto del árbol de la especie.[48]​ Es importante que las simulaciones sean lo suficientemente realistas para representar los datos reales y los modelos complejos son preferibles; por ejemplo, existe un modelo para simular árboles genéticos con procesos de substitución heterogénea además de la transferencia horizontal, y que toma en cuenta que la transferencia puede provenir de linajes extintos.[93]​ Otro ejemplo es el simulador de la evolución genómica ALF,[94]​ que genera directamente familias de genes sujetas a la transferencia horizontal basadas en un amplio rango de fuerzas evolutivas, pero en el contexto de un genoma completo. Al analizar las secuencias simuladas por diferentes métodos de interés es posible comparar su funcionamiento. Las secuencias con ausencia de transferencia horizontal sirven para comparar la frecuencia de falsos positivos.

La simulación de transferencia genómica puede llevarse a cabo directamente mediante la manipulación de secuencias biológicas. Los genomas de quimeras artificiales pueden obtenerse insertando genes foráneos conocidos en posiciones aleatorias del genoma del receptor.[95][96][97][98]​ Las secuencias de la especie donante pueden incorporar o no cambios para simular procesos evolutivos.[6]​ Es importante tener en cuenta que las simulaciones están basada en suposiciones simplificadas que pueden sesgarlas hacia ciertos métodos.[99]

Véase también

[editar]

Referencias

[editar]
  1. a b Poptsova, M. S.; Gogarten, J. P. (2007). «The power of phylogenetic approaches to detect horizontally transferred genes». BMC Evolutionary Biology 7: 45. PMC 1847511. PMID 17376230. doi:10.1186/1471-2148-7-45. 
  2. Griffith, F (1928). «The Significance of Pneumococcal Types». The Journal of hygiene 27 (2): 113-59. PMC 2167760. PMID 20474956. doi:10.1017/s0022172400031879. 
  3. Tatum, E. L.; Lederberg, J (1947). «Gene Recombination in the Bacterium Escherichia coli». Journal of Bacteriology 53 (6): 673-84. PMC 518375. PMID 16561324. 
  4. Zinder, N. D.; Lederberg, J. (1952). «Genetic Exchange in Salmonella». Journal of Bacteriology 64 (5): 679-699. PMC 169409. PMID 12999698. 
  5. Jones, D; Sneath, P. H. (1970). «Genetic transfer and bacterial taxonomy». Bacteriological reviews 34 (1): 40-81. PMC 378348. PMID 4909647. 
  6. a b c Dessimoz, C.; Margadant, D.; Gonnet, G. H. (2008). «DLIGHT – Lateral Gene Transfer Detection Using Pairwise Evolutionary Distances in a Statistical Framework». Research in Computational Molecular Biology. Lecture Notes in Computer Science 4955. p. 315. ISBN 978-3-540-78838-6. doi:10.1007/978-3-540-78839-3_27. 
  7. a b c Daubin, V; Lerat, E; Perrière, G (2003). «The source of laterally transferred genes in bacterial genomes». Genome Biology 4 (9): R57. PMC 193657. PMID 12952536. doi:10.1186/gb-2003-4-9-r57. 
  8. a b Lawrence, J. G.; Ochman, H (1998). «Molecular archaeology of the Escherichia coli genome». Proceedings of the National Academy of Sciences of the United States of America 95 (16): 9413-7. PMC 21352. PMID 9689094. doi:10.1073/pnas.95.16.9413. 
  9. a b c d Worning, P; Jensen, L. J.; Nelson, K. E.; Brunak, S; Ussery, D. W. (2000). «Structural analysis of DNA sequence: Evidence for lateral gene transfer in Thermotoga maritima». Nucleic Acids Research 28 (3): 706-9. PMC 102551. PMID 10637321. doi:10.1093/nar/28.3.706. 
  10. Deschavanne, P; Filipski, J (1995). «Correlation of GC content with replication timing and repair mechanisms in weakly expressed E.coli genes». Nucleic Acids Research 23 (8): 1350-3. PMC 306860. PMID 7753625. doi:10.1093/nar/23.8.1350. 
  11. Wuitschick, J. D.; Karrer, K. M. (1999). «Analysis of genomic G + C content, codon usage, initiator codon context and translation termination sites in Tetrahymena thermophila». The Journal of eukaryotic microbiology 46 (3): 239-47. PMID 10377985. doi:10.1111/j.1550-7408.1999.tb05120.x. 
  12. Guindon, S; Perrière, G (2001). «Intragenomic base content variation is a potential source of biases when searching for horizontally transferred genes». Molecular Biology and Evolution 18 (9): 1838-40. PMID 11504864. doi:10.1093/oxfordjournals.molbev.a003972. 
  13. Lawrence, J. G.; Ochman, H (1997). «Amelioration of bacterial genomes: Rates of change and exchange». Journal of Molecular Evolution 44 (4): 383-97. PMID 9089078. doi:10.1007/pl00006158. 
  14. Rendulic, S.; Jagtap, P.; Rosinus, A.; Eppinger, M.; Baar, C.; Lanz, C.; Keller, H.; Lambert, C.; Evans, K. J.; Goesmann, A.; Meyer, F.; Sockett, R. E.; Schuster, S. C. (2004). «A Predator Unmasked: Life Cycle of Bdellovibrio bacteriovorus from a Genomic Perspective». Science 303 (5658): 689-692. PMID 14752164. doi:10.1126/science.1093027. 
  15. Gophna, U; Charlebois, R. L.; Doolittle, W. F. (2006). «Ancient lateral gene transfer in the evolution of Bdellovibrio bacteriovorus». Trends in Microbiology 14 (2): 64-9. PMID 16413191. doi:10.1016/j.tim.2005.12.008. 
  16. Vernikos, G. S.; Thomson, N. R.; Parkhill, J (2007). «Genetic flux over time in the Salmonella lineage». Genome Biology 8 (6): R100. PMC 2394748. PMID 17547764. doi:10.1186/gb-2007-8-6-r100. 
  17. McCutcheon, J. P.; Moran, N. A. (2010). «Functional convergence in reduced genomes of bacterial symbionts spanning 200 My of evolution». Genome Biology and Evolution 2: 708-18. PMC 2953269. PMID 20829280. doi:10.1093/gbe/evq055. 
  18. Liu, Z; Venkatesh, S. S.; Maley, C. C. (2008). «Sequence space coverage, entropy of genomes and the potential to detect non-human DNA in human samples». BMC Genomics 9: 509. PMC 2628393. PMID 18973670. doi:10.1186/1471-2164-9-509. 
  19. Bentley, S. D.; Parkhill, J (2004). «Comparative genomic structure of prokaryotes». Annual Review of Genetics 38: 771-92. PMID 15568993. doi:10.1146/annurev.genet.38.072902.094318. 
  20. Karlin, S; Burge, C (1995). «Dinucleotide relative abundance extremes: A genomic signature». Trends in genetics : TIG 11 (7): 283-90. PMID 7482779. 
  21. Vernikos, G. S.; Parkhill, J (2006). «Interpolated variable order motifs for identification of horizontally acquired DNA: Revisiting the Salmonella pathogenicity islands». Bioinformatics 22 (18): 2196-203. PMID 16837528. doi:10.1093/bioinformatics/btl369. 
  22. Hooper, S. D.; Berg, O. G. (2002). «Detection of genes with atypical nucleotide sequence in microbial genomes». Journal of Molecular Evolution 54 (3): 365-75. PMID 11847562. doi:10.1007/s00239-001-0051-8. 
  23. Deschavanne, P. J.; Giron, A; Vilain, J; Fagot, G; Fertil, B (1999). «Genomic signature: Characterization and classification of species assessed by chaos game representation of sequences». Molecular Biology and Evolution 16 (10): 1391-9. PMID 10563018. doi:10.1093/oxfordjournals.molbev.a026048. 
  24. Dufraigne, C; Fertil, B; Lespinats, S; Giron, A; Deschavanne, P (2005). «Detection and characterization of horizontal transfers in prokaryotes using genomic signature». Nucleic Acids Research 33 (1): e6. PMC 546175. PMID 15653627. doi:10.1093/nar/gni004. 
  25. Cortez, D; Forterre, P; Gribaldo, S (2009). «A hidden reservoir of integrative elements is the major source of recently acquired foreign genes and ORFans in archaeal and bacterial genomes». Genome Biology 10 (6): R65. PMC 2718499. PMID 19531232. doi:10.1186/gb-2009-10-6-r65. 
  26. Nakamura, Y; Itoh, T; Matsuda, H; Gojobori, T (2004). «Biased biological functions of horizontally transferred genes in prokaryotic genomes». Nature Genetics 36 (7): 760-6. PMID 15208628. doi:10.1038/ng1381. 
  27. Ornstein, R. L.; Rein, R (1978). «An optimized potential function for the calculation of nucleic acid interaction energies I. Base stacking». Biopolymers 17 (10): 2341-60. PMID 24624489. doi:10.1002/bip.1978.360171005. 
  28. El Hassan, M. A.; Calladine, C. R. (1996). «Propeller-twisting of base-pairs and the conformational mobility of dinucleotide steps in DNA». Journal of Molecular Biology 259 (1): 95-103. PMID 8648652. doi:10.1006/jmbi.1996.0304. 
  29. Olson, W. K.; Gorin, A. A.; Lu, X. J.; Hock, L. M.; Zhurkin, V. B. (1998). «DNA sequence-dependent deformability deduced from protein-DNA crystal complexes». Proceedings of the National Academy of Sciences of the United States of America 95 (19): 11163-8. PMC 21613. PMID 9736707. doi:10.1073/pnas.95.19.11163. 
  30. Herzel, H; Weiss, O; Trifonov, E. N. (1999). «10-11 bp periodicities in complete genomes reflect protein structure and DNA folding». Bioinformatics (Oxford, England) 15 (3): 187-93. PMID 10222405. doi:10.1093/bioinformatics/15.3.187. 
  31. a b Fraser, C. M.; Clayton, K. E.; Gill, R. A.; Gwinn, S. R.; Dodson, M. L.; Haft, R. J.; Hickey, D. H.; Peterson, E. K.; Nelson, J. D.; Ketchum, W. C.; McDonald, K. A.; Utterback, L.; Malek, T. R.; Linher, J. A.; Garrett, K. D.; Stewart, M. M.; Cotton, A. M.; Pratt, M. D.; Phillips, M. S.; Richardson, C. A.; Heidelberg, D.; Sutton, J.; Fleischmann, G. G.; Eisen, R. D.; White, J. A.; Salzberg, O.; Smith, S. L.; Venter, H. O.; Fraser, J. C. (1999). «Evidence for lateral gene transfer between Archaea and bacteria from genome sequence of Thermotoga maritima». Nature 399 (6734): 323-329. Bibcode:1999Natur.399..323N. PMID 10360571. doi:10.1038/20601. 
  32. Langille, M. G. I.; Hsiao, W. W. L.; Brinkman, F. S. L. (2010). «Detecting genomic islands using bioinformatics approaches». Nature Reviews Microbiology 8 (5): 373-382. PMID 20395967. doi:10.1038/nrmicro2350. 
  33. Hacker, J; Blum-Oehler, G; Mühldorfer, I; Tschäpe, H (1997). «Pathogenicity islands of virulent bacteria: Structure, function and impact on microbial evolution». Molecular Microbiology 23 (6): 1089-97. PMID 9106201. doi:10.1046/j.1365-2958.1997.3101672.x. 
  34. Vernikos, G. S.; Parkhill, J (2008). «Resolving the structural features of genomic islands: A machine learning approach». Genome Research 18 (2): 331-42. PMC 2203631. PMID 18071028. doi:10.1101/gr.7004508. 
  35. Azad, R. K.; Lawrence, J. G. (2011). «Towards more robust methods of alien gene detection». Nucleic Acids Research 39 (9): e56. PMC 3089488. PMID 21297116. doi:10.1093/nar/gkr059. 
  36. Altenhoff, A. M.; Dessimoz, C (2012). Inferring Orthology and Paralogy. «Evolutionary Genomics». Methods in molecular biology (Clifton, N.J.). Methods in Molecular Biology 855. pp. 259-79. ISBN 978-1-61779-581-7. PMID 22407712. doi:10.1007/978-1-61779-582-4_9. 
  37. Than, C; Ruths, D; Innan, H; Nakhleh, L (2007). «Confounding factors in HGT detection: Statistical error, coalescent effects, and multiple solutions». Journal of Computational Biology 14 (4): 517-35. PMID 17572027. doi:10.1089/cmb.2007.A010. 
  38. Goldman, N; Anderson, J. P.; Rodrigo, A. G. (2000). «Likelihood-based tests of topologies in phylogenetics». Systematic Biology 49 (4): 652-70. PMID 12116432. doi:10.1080/106351500750049752. 
  39. Shimodaira, H; Hasegawa, M (1999). «Multiple Comparisons of Log-Likelihoods with Applications to Phylogenetic Inference». Molecular Biology and Evolution 16 (8): 1114-1116. doi:10.1093/oxfordjournals.molbev.a026201. 
  40. Shimodaira, H (2002). «An approximately unbiased test of phylogenetic tree selection». Systematic Biology 51 (3): 492-508. PMID 12079646. doi:10.1080/10635150290069913. 
  41. Zhaxybayeva, O; Hamel, L; Raymond, J; Gogarten, J. P. (2004). «Visualization of the phylogenetic content of five genomes using dekapentagonal maps». Genome Biology 5 (3): R20. PMC 395770. PMID 15003123. doi:10.1186/gb-2004-5-3-r20. 
  42. a b Beiko, R. G.; Harlow, T. J.; Ragan, M. A. (2005). «Highways of gene sharing in prokaryotes». Proceedings of the National Academy of Sciences 102 (40): 14332-7. PMC 1242295. PMID 16176988. doi:10.1073/pnas.0504068102. 
  43. Zhaxybayeva, O; Gogarten, J. P.; Charlebois, R. L.; Doolittle, W. F.; Papke, R. T. (2006). «Phylogenetic analyses of cyanobacterial genomes: Quantification of horizontal gene transfer events». Genome Research 16 (9): 1099-108. PMC 1557764. PMID 16899658. doi:10.1101/gr.5322306. 
  44. Bansal, M. S.; Banay, G; Gogarten, J. P.; Shamir, R (2011). «Detecting highways of horizontal gene transfer». Journal of Computational Biology 18 (9): 1087-114. PMID 21899418. doi:10.1089/cmb.2011.0066. 
  45. Bansal, M. S.; Banay, G; Harlow, T. J.; Gogarten, J. P.; Shamir, R (2013). «Systematic inference of highways of horizontal gene transfer in prokaryotes». Bioinformatics 29 (5): 571-9. PMID 23335015. doi:10.1093/bioinformatics/btt021. 
  46. a b Hallett MT, Lagergren J. RECOMB 2001. Montreal: ACM; 2001. Efficient Algorithms for Lateral Gene Transfer Problems; pp. 149–156.
  47. Baroni, M; Grünewald, S; Moulton, V; Semple, C (2005). «Bounding the number of hybridisation events for a consistent evolutionary history». Journal of Mathematical Biology 51 (2): 171-82. PMID 15868201. doi:10.1007/s00285-005-0315-9. 
  48. a b Beiko, R. G.; Hamilton, N (2006). «Phylogenetic identification of lateral genetic transfer events». BMC Evolutionary Biology 6: 15. PMC 1431587. PMID 16472400. doi:10.1186/1471-2148-6-15. 
  49. a b Nakhleh L, Ruths DA, Wang L: RIATA-HGT: A Fast and Accurate Heuristic for Reconstructing Horizontal Gene Transfer. COCOON, August 16–29, 2005; Kunming 2005.
  50. a b Abby, S. S.; Tannier, E; Gouy, M; Daubin, V (2010). «Detecting lateral gene transfers by statistical reconciliation of phylogenetic forests». BMC Bioinformatics 11: 324. PMC 2905365. PMID 20550700. doi:10.1186/1471-2105-11-324. 
  51. Hein, J.; Jiang, T.; Wang, L.; Zhang, K. (1996). «On the complexity of comparing evolutionary trees». Discrete Applied Mathematics 71: 153-169. doi:10.1016/S0166-218X(96)00062-5. 
  52. Allen, B. L.; Steel, M. (2001). «Subtree Transfer Operations and Their Induced Metrics on Evolutionary Trees». Annals of Combinatorics 5: 1-15. doi:10.1007/s00026-001-8006-8. 
  53. MacLeod, D; Charlebois, R. L.; Doolittle, F; Bapteste, E (2005). «Deduction of probable events of lateral gene transfer through comparison of phylogenetic trees by recursive consolidation and rearrangement». BMC Evolutionary Biology 5: 27. PMC 1087482. PMID 15819979. doi:10.1186/1471-2148-5-27. 
  54. a b Doyon, J. P.; Hamel, S; Chauve, C (2012). «An efficient method for exploring the space of gene tree/species tree reconciliations in a probabilistic framework». IEEE/ACM Transactions on Computational Biology and Bioinformatics 9 (1): 26-39. PMID 21464510. doi:10.1109/TCBB.2011.64. 
  55. a b David, L. A.; Alm, E. J. (2011). «Rapid evolutionary innovation during an Archaean genetic expansion». Nature 469 (7328): 93-6. PMID 21170026. doi:10.1038/nature09649. 
  56. Szöllosi, G. J.; Boussau, B; Abby, S. S.; Tannier, E; Daubin, V (2012). «Phylogenetic modeling of lateral gene transfer reconstructs the pattern and relative timing of speciations». Proceedings of the National Academy of Sciences 109 (43): 17513-8. PMC 3491530. PMID 23043116. doi:10.1073/pnas.1202997109. 
  57. Nguyen, T. H.; Ranwez, V; Pointet, S; Chifolleau, A. M.; Doyon, J. P.; Berry, V (2013). «Reconciliation and local gene tree rearrangement can be of mutual profit». Algorithms for Molecular Biology 8 (1): 12. PMC 3871789. PMID 23566548. doi:10.1186/1748-7188-8-12. 
  58. Szöllosi, G. J.; Tannier, E; Lartillot, N; Daubin, V (2013). «Lateral gene transfer from the dead». Systematic Biology 62 (3): 386-97. PMC 3622898. PMID 23355531. doi:10.1093/sysbio/syt003. 
  59. Bansal, M. S.; Alm, E. J.; Kellis, M (2012). «Efficient algorithms for the reconciliation problem with gene duplication, horizontal transfer and loss». Bioinformatics 28 (12): i283-91. PMC 3371857. PMID 22689773. doi:10.1093/bioinformatics/bts225. 
  60. Majewski, J; Zawadzki, P; Pickerill, P; Cohan, F. M.; Dowson, C. G. (2000). «Barriers to genetic exchange between bacterial species: Streptococcus pneumoniae transformation». Journal of Bacteriology 182 (4): 1016-23. PMC 94378. PMID 10648528. doi:10.1128/jb.182.4.1016-1023.2000. 
  61. Sjöstrand, J; Tofigh, A; Daubin, V; Arvestad, L; Sennblad, B; Lagergren, J (2014). «A Bayesian method for analyzing lateral gene transfer». Systematic Biology 63 (3): 409-20. PMID 24562812. doi:10.1093/sysbio/syu007. 
  62. a b Szöllõsi, G. J.; Rosikiewicz, W; Boussau, B; Tannier, E; Daubin, V (2013). «Efficient exploration of the space of reconciled gene trees». Systematic Biology 62 (6): 901-12. PMC 3797637. PMID 23925510. doi:10.1093/sysbio/syt054. 
  63. Haggerty, L. S.; Jachiet, P. A.; Hanage, W. P.; Fitzpatrick, D. A.; Lopez, P; O'Connell, M. J.; Pisani, D; Wilkinson, M; Bapteste, E; McInerney, J. O. (2014). «A pluralistic account of homology: Adapting the models to the data». Molecular Biology and Evolution 31 (3): 501-16. PMC 3935183. PMID 24273322. doi:10.1093/molbev/mst228. 
  64. Szöllősi, G. J.; Tannier, E; Daubin, V; Boussau, B (2015). «The inference of gene trees with species trees». Systematic Biology 64 (1): e42-62. PMC 4265139. PMID 25070970. doi:10.1093/sysbio/syu048. 
  65. Koski, L. B.; Golding, G. B. (2001). «The closest BLAST hit is often not the nearest neighbor». Journal of Molecular Evolution 52 (6): 540-2. PMID 11443357. doi:10.1007/s002390010184. 
  66. Wisniewski-Dyé, F.; Borziak, K.; Khalsa-Moyers, G.; Alexandre, G.; Sukharnikov, L. O.; Wuichet, K.; Hurst, G. B.; McDonald, W. H.; Robertson, J. S.; Barbe, V.; Calteau, A.; Rouy, Z.; Mangenot, S.; Prigent-Combaret, C.; Normand, P.; Boyer, M.; Siguier, P.; Dessaux, Y.; Elmerich, C.; Condemine, G.; Krishnen, G.; Kennedy, I.; Paterson, A. H.; González, V.; Mavingui, P.; Zhulin, I. B. (2011). «Azospirillum Genomes Reveal Transition of Bacteria from Aquatic to Terrestrial Environments». En Richardson, Paul M, ed. PLoS Genetics 7 (12): e1002430. PMC 3245306. PMID 22216014. doi:10.1371/journal.pgen.1002430. 
  67. Zuckerkandl, E. and Pauling, L.B. 1965. Evolutionary divergence and convergence in proteins. In Bryson, V.and Vogel, H.J. (editors). Evolving Genes and Proteins. Academic Press, New York. pp. 97–166.
  68. Novichkov, P. S.; Omelchenko, M. V.; Gelfand, M. S.; Mironov, A. A.; Wolf, Y. I.; Koonin, E. V. (2004). «Genome-wide molecular clock and horizontal gene transfer in bacterial evolution». Journal of Bacteriology 186 (19): 6575-85. PMC 516599. PMID 15375139. doi:10.1128/JB.186.19.6575-6585.2004. 
  69. Lawrence, J. G.; Hartl, D. L. (1992). «Inference of horizontal genetic transfer from molecular data: An approach using the bootstrap». Genetics 131 (3): 753-60. PMC 1205046. PMID 1628816. 
  70. Clarke, G. D.; Beiko, R. G.; Ragan, M. A.; Charlebois, R. L. (2002). «Inferring genome trees by using a filter to eliminate phylogenetically discordant sequences and a distance matrix based on mean normalized BLASTP scores». Journal of Bacteriology 184 (8): 2072-80. PMC 134965. PMID 11914337. doi:10.1128/jb.184.8.2072-2080.2002. 
  71. Pellegrini, M; Marcotte, E. M.; Thompson, M. J.; Eisenberg, D; Yeates, T. O. (1999). «Assigning protein functions by comparative genome analysis: Protein phylogenetic profiles». Proceedings of the National Academy of Sciences of the United States of America 96 (8): 4285-8. PMC 16324. PMID 10200254. doi:10.1073/pnas.96.8.4285. 
  72. Normand, P.; Lapierre, P.; Tisa, L. S.; Gogarten, J. P.; Alloisio, N.; Bagnarol, E.; Bassi, C. A.; Berry, A. M.; Bickhart, D. M.; Choisne, N.; Couloux, A.; Cournoyer, B.; Cruveiller, S.; Daubin, V.; Demange, N.; Francino, M. P.; Goltsman, E.; Huang, Y.; Kopp, O. R.; Labarre, L.; Lapidus, A.; Lavire, C.; Marechal, J.; Martinez, M.; Mastronunzio, J. E.; Mullin, B. C.; Niemann, J.; Pujic, P.; Rawnsley, T.; Rouy, Z. (2006). «Genome characteristics of facultatively symbiotic Frankia sp. Strains reflect host range and host plant biogeography». Genome Research 17 (1): 7-15. PMC 1716269. PMID 17151343. doi:10.1101/gr.5798407. 
  73. a b Welch, R. A.; Burland, V; Plunkett g, 3rd; Redford, P; Roesch, P; Rasko, D; Buckles, E. L.; Liou, S. R.; Boutin, A; Hackett, J; Stroud, D; Mayhew, G. F.; Rose, D. J.; Zhou, S; Schwartz, D. C.; Perna, N. T.; Mobley, H. L.; Donnenberg, M. S.; Blattner, F. R. (2002). «Extensive mosaic structure revealed by the complete genome sequence of uropathogenic Escherichia coli». Proceedings of the National Academy of Sciences 99 (26): 17020-4. PMC 139262. PMID 12471157. doi:10.1073/pnas.252529799. 
  74. Csűrös, M. S. (2008). «Ancestral Reconstruction by Asymmetric Wagner Parsimony over Continuous Characters and Squared Parsimony over Distributions». Comparative Genomics. Lecture Notes in Computer Science 5267. p. 72. ISBN 978-3-540-87988-6. doi:10.1007/978-3-540-87989-3_6. 
  75. Pagel, M. (1999). «Inferring the historical patterns of biological evolution». Nature 401 (6756): 877-84. PMID 10553904. doi:10.1038/44766. 
  76. a b Csurös, M; Miklós, I (2009). «Streamlining and large ancestral genomes in Archaea inferred with a phylogenetic birth-and-death model». Molecular Biology and Evolution 26 (9): 2087-95. PMC 2726834. PMID 19570746. doi:10.1093/molbev/msp123. 
  77. Hao, W; Golding, G. B. (2010). «Inferring bacterial genome flux while considering truncated genes». Genetics 186 (1): 411-26. PMC 2940306. PMID 20551435. doi:10.1534/genetics.110.118448. 
  78. Hao, W; Golding, G. B. (2006). «The fate of laterally transferred genes: Life in the fast lane to adaptation or death». Genome Research 16 (5): 636-43. PMC 1457040. PMID 16651664. doi:10.1101/gr.4746406. 
  79. Hao, W; Golding, G. B. (2008). «Uncovering rate variation of lateral gene transfer during bacterial genome evolution». BMC Genomics 9: 235. PMC 2426709. PMID 18492275. doi:10.1186/1471-2164-9-235. 
  80. Ochman, H; Lawrence, J. G.; Groisman, E. A. (2000). «Lateral gene transfer and the nature of bacterial innovation». Nature 405 (6784): 299-304. PMID 10830951. doi:10.1038/35012500. 
  81. Papke, R. T.; Koenig, J. E.; Rodríguez-Valera, F; Doolittle, W. F. (2004). «Frequent recombination in a saltern population of Halorubrum». Science 306 (5703): 1928-9. PMID 15591201. doi:10.1126/science.1103289. 
  82. Mau, B; Glasner, J. D.; Darling, A. E.; Perna, N. T. (2006). «Genome-wide detection and analysis of homologous recombination among sequenced strains of Escherichia coli». Genome Biology 7 (5): R44. PMC 1779527. PMID 16737554. doi:10.1186/gb-2006-7-5-r44. 
  83. Didelot, X; Falush, D (2007). «Inference of bacterial microevolution using multilocus sequence data». Genetics 175 (3): 1251-66. PMC 1840087. PMID 17151252. doi:10.1534/genetics.106.063305. 
  84. Lawrence, J. G.; Ochman, H (2002). «Reconciling the many faces of lateral gene transfer». Trends in microbiology 10 (1): 1-4. PMID 11755071. doi:10.1016/s0966-842x(01)02282-x. 
  85. Ragan, M. A. (2001). «On surrogate methods for detecting lateral gene transfer». FEMS microbiology letters 201 (2): 187-91. PMID 11470360. doi:10.1111/j.1574-6968.2001.tb10755.x. 
  86. Ragan, M. A.; Harlow, T. J.; Beiko, R. G. (2006). «Do different surrogate methods detect lateral genetic transfer events of different relative ages?». Trends in Microbiology 14 (1): 4-8. PMID 16356716. doi:10.1016/j.tim.2005.11.004. 
  87. Kechris, K. J.; Lin, J. C.; Bickel, P. J.; Glazer, A. N. (2006). «Quantitative exploration of the occurrence of lateral gene transfer by using nitrogen fixation genes as a case study». Proceedings of the National Academy of Sciences 103 (25): 9584-9. PMC 1480450. PMID 16769896. doi:10.1073/pnas.0603534103. 
  88. Nancy A. Moran; Tyler Jarvik (2010). «Lateral Transfer of Genes from Fungi Underlies Carotenoid Production in Aphids». Science 328 (5978): 624-627. Bibcode:2010Sci...328..624M. PMID 20431015. doi:10.1126/science.1187113. 
  89. Danchin, E. G.; Rosso, M. N.; Vieira, P; De Almeida-Engler, J; Coutinho, P. M.; Henrissat, B; Abad, P (2010). «Multiple lateral gene transfers and duplications have promoted plant parasitism ability in nematodes». Proceedings of the National Academy of Sciences 107 (41): 17651-6. PMC 2955110. PMID 20876108. doi:10.1073/pnas.1008486107. 
  90. Whidden, C; Zeh, N; Beiko, R. G. (2014). «Supertrees Based on the Subtree Prune-and-Regraft Distance». Systematic Biology 63 (4): 566-81. PMC 4055872. PMID 24695589. doi:10.1093/sysbio/syu023. 
  91. Fletcher, W; Yang, Z (2009). «INDELible: A flexible simulator of biological sequence evolution». Molecular Biology and Evolution 26 (8): 1879-88. PMC 2712615. PMID 19423664. doi:10.1093/molbev/msp098. 
  92. Sipos, B; Massingham, T; Jordan, G. E.; Goldman, N (2011). «Phylo Sim - Monte Carlo simulation of sequence evolution in the R statistical computing environment». BMC Bioinformatics 12: 104. PMC 3102636. PMID 21504561. doi:10.1186/1471-2105-12-104. 
  93. Galtier, N (2007). «A model of horizontal gene transfer and the bacterial phylogeny problem». Systematic Biology 56 (4): 633-42. PMID 17661231. doi:10.1080/10635150701546231. 
  94. Dalquen, D. A.; Anisimova, M; Gonnet, G. H.; Dessimoz, C (2012). «ALF--a simulation framework for genome evolution». Molecular Biology and Evolution 29 (4): 1115-23. PMC 3341827. PMID 22160766. doi:10.1093/molbev/msr268. 
  95. Becq, J; Churlaud, C; Deschavanne, P (2010). «A benchmark of parametric methods for horizontal transfers detection». PLoS ONE 5 (4): e9989. PMC 2848678. PMID 20376325. doi:10.1371/journal.pone.0009989. 
  96. Cortez, D. Q.; Lazcano, A; Becerra, A (2005). «Comparative analysis of methodologies for the detection of horizontally transferred genes: A reassessment of first-order Markov models». In silico biology 5 (5-6): 581-92. PMID 16610135. 
  97. Tsirigos, A; Rigoutsos, I (2005). «A new computational method for the detection of horizontal gene transfer events». Nucleic Acids Research 33 (3): 922-33. PMC 549390. PMID 15716310. doi:10.1093/nar/gki187. 
  98. Azad, R. K.; Lawrence, J. G. (2005). «Use of artificial genomes in assessing methods for atypical gene detection». PLoS Computational Biology 1 (6): e56. PMC 1282332. PMID 16292353. doi:10.1371/journal.pcbi.0010056. 
  99. Iantorno, S; Gori, K; Goldman, N; Gil, M; Dessimoz, C (2014). Who Watches the Watchmen? An Appraisal of Benchmarks for Multiple Sequence Alignment. «Multiple Sequence Alignment Methods». Methods in molecular biology (Clifton, N.J.). Methods in Molecular Biology 1079. pp. 59-73. ISBN 978-1-62703-645-0. PMID 24170395. doi:10.1007/978-1-62703-646-7_4.