Atracción de ramas largas

De Wikipedia, la enciclopedia libre
Ir a la navegación Ir a la búsqueda
Un ejemplo de atracción de rama larga. En este "árbol verdadero", se puede esperar que las ramas que conducen a A y C tengan un mayor número de transformaciones de estado de caracteres que las ramas internas que conducen a B y D.

La atracción de ramas largas (LBA) es un error metodológico que se produce en los análisis de filogenia molecular cuando grupos que han evolucionado rápidamente son colocados erróneamente en la base de los árboles filogenéticos. El error es muy común cuando la evolución de un gen no ha seguido un modelo de reloj molecular y tiende a registrarse cuando se mide con el método de máxima parsimonia, cuando se recodifican los datos o se quitan especies de evolución más rápida. Este método, como otros que se rigen por un sistema de puntuación, no es capaz de diferenciar un gran cambio repentino de una divergencia evolutiva ancestral. La atracción de ramas largas se produce comúnmente en linajes que se separaron más tempranamente que en linajes que se separaron más recientemente.[1]

Este error ocurre porque la saturación de las secuencias, la homoplasia y la heterogeneidad composicional no se miden en el análisis. Esto produce que las sustituciones paralelas (convergentes) en secuencias de evolución rápida se malinterpreten como caracteres derivados (compartidos) que pueden dar lugar a graves errores topológicos y provoca que los linajes de rápida evolución se coloquen en posición basal o con un grupo externo altamente divergente. Aunque no está bien estudiado, se sabe que la heterogeneidad composicional causa que los linajes de rápida evolución se agrupen así en los árboles debido a la composición en las secuencias de cobertura.[2]

Se han propuesto una serie de estrategias para tratar la atracción de ramas largas y la heterogeneidad composicional entre secuencias, usando métodos que incorporen ritmos diferentes de probabilidad entre linajes (máxima parsimonia, por ejemplo), eliminando las secuencias que evolucionan rápidamente, recodificando los datos con un alfabeto reducido, quitando grupos externos distantes o rompiendo las ramas largas agregando especies de evolución más lenta.[3][4]​ La máxima parsimonia puede considerarse un buen método para los análisis moleculares pero últimamente la mayoría de los especialistas han decidido emplear métodos de inferencia probabilistas (por ejemplo, inferencia bayesiana) que pueden resultar más adecuados que los enfoques de parsimonia.

Por ejemplo, los microsporidios han simplificado extremadamente su ARNr haciendo que sus secuencias parezcan más divergentes comparadas con las de sus parientes próximos. Esto provoca que en los árboles filogenéticos realizados sin tomar en cuenta los métodos mencionados aparezcan como un grupo eucariota muy primitivo mientras que los demás análisis los muestran como un grupo derivado de los hongos. La agrupación de animales espiralios "Platyzoa" que une a los platelmintos, gastrotricos y gnatiferos de evolución rápida es un ejemplo de como los linajes de evolución rápida pueden agruparse entre sí con un grupo externo divergente. Así, la interpretación de los datos tiene que realizarse con precaución.

Un ejemplo muy conocido de este error es el que hizo que Carl Woese sugiriera en su sistema de los tres dominios que los eucariotas eran uno de los clados más antiguos de la naturaleza junto con las arqueas y bacterias, lo que se sabe que es posible tanto sobre la base de análisis morfológicos como paleontológicos y análisis moleculares recientes con métodos mejorados que los eucariotas por lo general derivan de las arqueas y no pudieron haber aparecido más tempranamente.[2]

Causas[editar]

La atracción de ramas largas se reconoció por primera vez como problemático al analizar conjuntos de caracteres morfológicos discretos bajo criterios de parsimonia, sin embargo, los análisis de máxima verosimilitud del ADN o las secuencias de proteínas también son susceptibles. Se puede encontrar un ejemplo hipotético simple como Felsenstein en 1978, donde se demuestra que para ciertos árboles "verdaderos" desconocidos, algunos métodos pueden mostrar un sesgo para agrupar ramas largas, lo que en última instancia da como resultado la inferencia de una relación hermana falsa. A menudo esto se debe a que la evolución convergente de uno o más caracteres incluidos en el análisis ha ocurrido en múltiples taxones. Aunque se derivaron de forma independiente, estos rasgos compartidos pueden mal interpretarse en el análisis como compartidos debido a una ascendencia común.[5]

En los análisis moleculares y de agrupamiento, la atracción de ramas largas es el resultado de la forma en que funcionan los algoritmos de agrupamiento: los terminales o taxones con muchas autapomorfías (estados de caracteres únicos para una sola rama) pueden exhibir por casualidad los mismos estados que los de otra rama (homoplasia). Un análisis molecular agrupará estos taxones como un clado a menos que otras sinapomorfías superen las características homoplásticas para agrupar taxones hermanos verdaderos.[3]

La transferencia horizontal de genes que se da comúnmente en bacterias, arqueas y virus también pueden llevar al error sistemático debido al intercambio de genes que realizan estos organismos entre sí ya sea con su huésped o con otra especie similar.[3]

Resultados[editar]

El resultado de las atracciones de ramas largas en análisis moleculares es que se puede inferir que los linajes que evolucionan rápidamente son taxones hermanos, independientemente de sus verdaderas relaciones. Por ejemplo, en los análisis basados en secuencias de ADN, el problema surge cuando las secuencias de dos (o más) linajes evolucionan rápidamente. Hay solo cuatro nucleótidos posibles y cuando las tasas de sustitución de ADN son altas, aumenta la probabilidad de que dos linajes desarrollen el mismo nucleótido en el mismo sitio. Cuando esto sucede, un análisis molecular puede interpretar erróneamente esta homoplasia como una sinapomorfía (es decir, evolucionar una vez en el ancestro común de los dos linajes).[6]

Se puede observar el efecto contrario, ya que si dos (o más) ramas exhiben una evolución particularmente lenta entre un grupo más amplio y de evolución rápida, esas ramas pueden mal interpretarse como estrechamente relacionadas. Como tal, la "atracción de rama larga" puede expresarse de alguna manera mejor como "atracción de longitud de rama". Sin embargo, típicamente son ramas largas las que exhiben atracción.

El reconocimiento de la atracción de rama larga implica que hay alguna otra evidencia que sugiere que la filogenia es incorrecta. Por ejemplo, dos fuentes diferentes de datos (es decir análisis morfológicos y otros análisis moleculares) o incluso métodos o esquemas de partición diferentes podrían admitir una ubicación diferente para los grupos de ramificación larga. El Principio Auxiliar de Hennig sugiere que las sinapomorfías deben verse como evidencia de facto de agrupación a menos que haya evidencia contraria específica.[7]​ Si un análisis molecular alternativo obtuvo un resultado diferente del otro es porque también hay una atracción de ramas largas entre uno de ellos.[8]

Un método simple y efectivo para determinar si la atracción de ramas largas afecta o no la topología de los árboles es el método SAW, llamado así por Siddal y Whiting. Si se sospecha una atracción de rama larga entre un par de taxones (A y B), simplemente elimine el taxón A ("sierra" de la rama) y vuelva a ejecutar el análisis. Luego quite B y reemplace A, ejecutando el análisis nuevamente. Si cualquiera de los taxones aparece en un punto de ramificación diferente en ausencia del otro, hay evidencia de una atracción de rama larga. Dado que las ramas largas no pueden atraerse entre sí cuando solo hay una en el análisis, la colocación constante de taxones entre tratamientos indicaría que la atracción de ramas largas no es un problema. Otra estrategia propuesta es revisar las especies que se deseen incluir en el análisis puesto que algunas especies de los taxones a analizar pudieron sufrir pocas sustituciones moleculares o evolucionaron lentamente en contraposición con otras especies sesgadas que evolucionaron rápidamente o sufrieron grandes tasas de cambios moleculares. En este caso es recomendable incluir las especies de evolución más lenta reportadas ya que teóricamente se ha afirmado que las ramas no podrán mostrar sesgos para agruparse dado a que estas especies son más conservacionistas.[8]

Ejemplo[editar]

Supongamos por simplicidad que estamos considerando un solo carácter binario (puede ser + o -) distribuido en el "árbol verdadero" no enraizado con longitudes de rama proporcionales a la cantidad de cambio de estado de caracteres, que se muestra en la figura. Debido a que la distancia evolutiva de B a D es pequeña, suponemos que en la gran mayoría de los casos, B y D exhibirán el mismo estado de carácter. Aquí, asumiremos que ambos son + (+ y - se asignan arbitrariamente y cambiarlos es solo una cuestión de definición). Si este es el caso, hay cuatro posibilidades restantes. A y C pueden ser ambos +, en cuyo caso todos los taxones son iguales y todos los árboles tienen la misma longitud. A puede ser + y C puede ser -, en cuyo caso solo un personaje es diferente, y no podemos aprender nada, ya que todos los árboles tienen la misma longitud. Del mismo modo, A puede ser - y C puede ser +. La única posibilidad restante es que A y C sean ambos -. En este caso, sin embargo, vemos a A y C, o B y D, como un grupo con respecto al otro (un estado de carácter es ancestral, el otro se deriva y el estado ancestral no define un grupo). Como consecuencia, cuando tenemos un "árbol verdadero" de este tipo, cuantos más datos recopilamos (es decir, cuantos más caracteres estudiamos), más de ellos son homoplásticos y admiten el árbol incorrecto. Por supuesto, cuando tratamos con datos empíricos en estudios filogenéticos de organismos reales, nunca conocemos la topología del árbol verdadero, y la hipótesis correcta podría ser la más parsimoniosa (AC) o (BD).[9][10]

Referencias[editar]

  1. Bergsten, Johannes (1 de abril de 2005). «A review of long-branch attraction». Cladistics (en inglés) 21 (2): 163-193. ISSN 1096-0031. doi:10.1111/j.1096-0031.2005.00059.x. 
  2. a b David Moreira, Hervé Philippe (2000). Molecular phylogeny: pitfalls and progress. International Microbiology 3:9-16
  3. a b c Hervé Philippe, Beatrice Roure (2011). Difficult phylogenetic questions: more data, maybe; better methods, certainly. BMC Biology.
  4. Henner Brickmann and Hervé Philippe (2005). An Empirical Assessment of Long-Branch Attraction Artefacts in Deep Eukaryotic Phylogenomics. Systematic Biology, Oxford Academic. volumén=54 pag=743-757.
  5. Felsenstein, J. (1978). Cases in which parsimony or compatibility methods will be positively misleading. Systematic Biology, 27(4), 401-410.
  6. Felsenstein, J. (2004): Inferring Phylogenies. Sinauer Associates, Sunderland, MA.
  7. Coiro, Mario; Chomicki, Guillaume; Doyle, James A. (August 2018). «Experimental signal dissection and method sensitivity analyses reaffirm the potential of fossils and morphology in the resolution of the relationship of angiosperms and Gnetales». Paleobiology 44 (3): 490-510. ISSN 0094-8373. doi:10.1017/pab.2018.23. 
  8. a b Siddall, M. E.; Whiting, M. F. (1999). «Long-Branch Abstractions». Cladistics 15: 9-24. doi:10.1111/j.1096-0031.1999.tb00391.x. 
  9. Huelsenbeck, J. P. and D. M. Hillis. 1993. Success of phylogenetic methods in the four-taxon case. Syst. Biol. 42:247-264.
  10. Hérve Philippe et Felsenstein (2005). Heterotachy and long-branch attraction in phylogenetics. BMC Evolutionary Biology. volumen=50.