Pangenoma

De Wikipedia, la enciclopedia libre

En el campo de la genómica, el término pangenoma se refiere al conjunto completo de genes de todas las cepas que forman un clado filogenético. En otras palabras, un pangenoma es la unión de todos los genomas de los organismos que pertenecen a un mismo clado[1][2][3][4]​. El campo de estudio del pangenoma se llama ‘pangenómica’[1]​. La finalidad de los estudios pangenómicos es comprender la diversidad de la totalidad de los genes codificados en un grupo de organismos cercanos filogenéticamente. Para ello, mediante el uso de herramientas bioinformáticas especializadas, se clasifican cada uno de los genes presentes en cada uno de los genomas analizados en grupos o familias de genes ortólogos. El total de familias de genes identificados en esta comparación determina el tamaño del pangenoma de los organismos analizados. La mayoría de las herramientas de análisis pangenómicos entregan, como resultado, una matriz de presencia y ausencia de cada uno de los genes ortólogos para cada genoma analizado. A partir de esta matriz, se puede conocer cuáles de estas familias de genes ortólogos están presentes en todos los genomas analizados y cuáles solo están presentes en algunas cepas.

Con base en estos conceptos, un pangenoma puede dividirse en un “genoma central” (también conocido como “core genome”) el cual representa al conjunto de genes que están presentes en todos los individuos del clado, un “genoma periférico” (o “shell pangenome”) que contiene los genes presentes en dos o más organismos pero que no pertenecen al genoma central y, un “genoma diferencial” ( o “cloud pangenome”) referente al conjunto de genes únicos los cuales están presentes sólo en un organismo del clado[2][3][5]​.

Actualmente no existe una definición de consenso para las diferentes partes del pangenoma. Por ejemplo, algunos autores han propuesto una definición menos estricta para el genoma central,  la cual considera a todos los genes presentes en el 99-100% de los individuos del clado de estudio. Por otro lado, algunos autores se refieren al genoma diferencial como "genoma accesorio", el cual contiene genes ‘dispensables’ o ‘innecesarios’ que solo están presentes en algunos de los organismos comparados. Sin embargo, el término ‘dispensable’ ha sido cuestionado por otros autores, al menos en el área de genómica de plantas, ya que se considera que los genes accesorios juegan “un papel importante en la evolución genómica así como en la compleja interacción genoma-medio ambiente”[4]​.

En bacterias, el repertorio genético representativo de una especie generalmente es más grande que el contenido de genes de una sola cepa[6]​. Bajo este fundamento, a nivel de organismos o clados filogenéticos, también existe un criterio de clasificación para los pangenomas: abierto o cerrado. Cuando se asigna la clasificación de ‘pangenoma cerrado’ a una especie o grupo de organismos significa que muy pocos genes nuevos se añaden al pangenoma por genoma secuenciado (después de secuenciar muchas cepas), y que el tamaño real del pangenoma de la especie en cuestión puede ser calculado teóricamente. Por otro lado, la clasificación de ‘pangenoma abierto’ se utiliza para describir que el tamaño del pangenoma de una especie en particular no puede ser calculado teóricamente debido a que cuanto más se añaden genomas nuevos al pangenoma, el número de genes nuevos incrementa en gran medida.

Originalmente, el término pangenoma fue construido para describir la diversidad genética de bacterias y arqueas. Sin embargo, actualmente este término también se utiliza para describir el contenido de genes diferenciales en genomas eucariotas. La importancia de los estudios pangenómicos surgió a partir de un contexto evolutivo y, actualmente, son considerados relevantes desde un contexto genómico más amplio[7]​, por ejemplo, en estudios de metagenómica[8]​. El libro “The Pangenome - Diversity, Dynamics and Evolution of Genomes”[9]​ publicado en 2020 por Hervé Tettelin y Duccio Medini, incluye una descripción completa del concepto de pangenoma, su historia y principales avances en el área, así como importantes discusiones que han surgido en el área de la pangenómica en los últimos años.

Etimología[editar]

El término ‘pangenoma’ fue definido con su significado actual por Tettelin en 2005[1]​; ‘pan’ se deriva del griego y significa ‘entero’ o ‘todo’, mientras que el ‘genoma’ es un término comúnmente utilizado para describir el material genético completo de un organismo. Tettelin aplicó el término específicamente de las bacterias, cuyo pangenoma “incluye un genoma central que contienen genes presentes en todas las cepas y un genoma prescindible compuesto por genes ausentes en una o más cepas y genes que son exclusivos de cada cepa”[1]​.

Partes del genoma[editar]

En el pangenoma, podemos identificar tres conjuntos de genes: el central, periférico y diferencial. El genoma central comprende los genes que están presentes en todos los genomas analizados. Para evitar descartar familias debido a artefactos de secuenciación, algunos autores consideran el genoma central relajado (>95% de ocurrencia). El genoma periférico consiste en los genes compartidos por la mayoría de los genomas (10-95% de ocurrencia). Las familias de genes presentes en un solo genoma o <10% de ocurrencia se describen como genoma diferencial.

Genoma central[editar]

Es la parte del pangenoma que comparten todos los genomas del conjunto analizado. Algunos autores han dividido el genoma central en genoma central estricto, aquellas familias de genes homólogos que tienen al menos una copia de la familia compartida por cada genoma (100% de los genomas) y el genoma central relajado[10]​, a aquellas familias distribuidas por encimas de cierto umbral (90%). En un estudio que involucra los pangenomas de Bacillus cereus y Staphylococcus aureus, algunos de ellos  aislados de la estación espacial internacional, los umbrales utilizados para segmentar los pangenomas fueron los siguientes: "diferencial", "periférico" y "central" correspondientes al gen familias con presencia en <10%, 10 a 95% y >95% de los genomas, respectivamente.[11]

El tamaño del genoma central y la proporción con el pangenoma depende de varios factores, pero depende especialmente de la similitud filogenética de los genomas considerados. Por ejemplo, el genoma central de dos genomas idénticos también sería el pangenoma completo. El genoma central de un género siempre será más pequeño que el genoma central de una especie. Los genes que pertenecen al genoma central a menudo están relacionados con funciones constitutivas y del metabolismo primario del linaje; sin embargo, el genoma central también puede contener algunos genes que diferencian a la especie de otras especies del género, es decir, que pueden estar relacionados con la patogenicidad del nicho[12]​.

Genoma periférico[editar]

Es la parte del pangenoma compartida por la mayoría de los genomas de un pangenoma[13]​. No existe un umbral universalmente aceptado para definir el genoma periférico, algunos autores consideran una familia de genes como parte del genoma periférico si es compartida por más del 50% de los genomas del pangenoma[14]​. Una familia puede formar parte del genoma periférico por varias dinámicas evolutivas, por ejemplo por la pérdida de un gen en un linaje donde anteriormente formaba parte del genoma central, tal es el caso de las enzimas en el  operón de triptófano de Actiniomyces[15]​ , o por ganancia de genes y fijación de una familia de genes que anteriormente formaba parte del genoma prescindible, tal es el caso del gen trpF en varias especies de Corynebacterium.[16]

Genoma diferencial[editar]

El genoma diferencial consiste en aquellas familias de genes compartidas por un subconjunto mínimo de los genomas en el pangenoma[3]​, incluye singletons o genes presentes en sólo uno de los genomas. Las familias de genes en esta categoría a menudo están relacionadas con la adaptación ecológica.

Clasificación[editar]

a) Los pangenomas cerrados se caracterizan por genomas centrales grandes y genomas accesorios pequeños. b) Los pangenomas abiertos tienden a tener genomas centrales pequeños y genomas accesorios grandes. c) El tamaño de los pangenomas abiertos tiende a aumentar con cada genoma que se va agregando, mientras que el tamaño de los pangenomas cerrados tiende a ser asintótico al agregar más genomas. Debido a esta característica, se puede hacer una predicción del tamaño completo del pangenoma para pangenomas cerrados.

El pangenoma se puede clasificar como abierto o cerrado según el valor alfa de la ley de Heaps[17][10]

  • Número de familias de genes.
  • Número de genomas
  • Constante de proporcionalidad.
  • Exponente calculado para ajustar la curva de número de familias de genes vs nuevo genoma.


Si  el pangenoma está abierto. Si el pangenoma está cerrado.


Usualmente, el software que analiza un pangenoma puede calcular los parámetros de la ley de Heaps que mejor describen el comportamiento de los datos.

Pangenoma abierto[editar]

Un pangenoma abierto ocurre cuando el número de nuevas familias de genes sigue aumentando en un linaje taxonómico y este incremento no parece ser asintótico independientemente de cuántos genomas nuevos se agreguen al pangenoma. Escherichia coli es un ejemplo de una especie con un pangenoma abierto. Cualquier tamaño de genoma de E. coli tiene un rango de 4,000-5,000 genes y el tamaño del pangenoma estimado para esta especie considerando aproximadamente 2,000 genomas está compuesto por 89,000 familias de genes diferentes.[18]​ El pangenoma del dominio bacteria también se considera abierto.

Pangenoma cerrado[editar]

Un pangenoma cerrado ocurre en un linaje cuando solo se agregan unas pocas familias de genes al momento de incorporar nuevos genomas al análisis del pangenoma, y la cantidad total de familias de genes en el pangenoma parece ser asintótica a un número. Se cree que el parasitismo y las especies que son especialistas en algún nicho ecológico tienden a tener pangenomas cerrados. Staphylococcus lugdunensis es un ejemplo de bacteria comensal con pangenoma cerrado[19]​.

Historia[editar]

Pangenoma[editar]

El concepto original de pangenoma fue desarrollado por Tetellin y colaboradores[1]​ cuando analizaron los genomas de ocho aislados de Streptococcus agalactiae. En este análisis describieron un genoma central, el cual es compartido por los ocho genomas y representa aproximadamente el 80% de cada uno de los genomas; además, describieron un genoma accesorio que contiene los genes que son parcialmente compartidos y los genes que son únicos de las cepas. La extrapolación sugiere que la cantidad de genes en el pangenoma de S. agalactiae es enorme y  seguirán identificando nuevos genes únicos incluso después de haber secuenciado cientos de genomas[1]​. El pangenoma comprende la cantidad total de los genes descubiertos en los genomas secuenciados de una determinada especie microbiana y esta cantidad puede ir cambiando cuando se secuencias nuevos genomas y se incorporan al pangenoma.

El supergenoma es definido como todos los genes accesibles para ciertas especies, el pangenoma si la secuenciación de todos los genomas estuviera disponible. Metapangenoma es el análisis del pangenoma aplicado a muestras metagenómicas, donde la unión de genes de varias especies es evaluada según un hábitat dado.

El pangenoma de un linaje explica la variabilidad intra-linaje del contenido génico. El pangenoma evoluciona por medio de diversos mecanismos como lo son: la duplicación de genes, la ganancia y pérdida de genes y la interacción del genoma con elementos móviles que están moldeados por la selección y la deriva[20]​. Además, algunos estudios señalan que los pangenomas de procariotas son el resultado de una evolución adaptativa, no neutral, que confiere a las especie la capacidad de migrar a nuevos nichos[21]​.

Supergenoma[editar]

El supergenoma puede ser pensado como el tamaño real del pangenoma si todos los genomas de una especie son secuenciados[22]​. Este se define como todos los genes accesibles para ser adquiridos por una determinada especie. Esto no puede ser calculado directamente pero el tamaño puede ser estimado a partir del tamaño del pangenoma calculado con datos genómicos disponibles. Estimar el tamaño del genoma accesorio puede ser problemático, porque depende de la ocurrencia de genes y genomas raros. En 2011 la fluidez genómica fue propuesta como una medida para categorizar la similitud a nivel de genes entre grupos de aislados secuenciados[23]​. En algunos lineages los supergenomas pueden aparentar ser infinitos[24]​, como en el caso del dominio Bacteria[25]​.

Metapangenoma[editar]

Metapangenoma ha sido definido como el resultado del análisis de pangenomas junto con el entorno donde la abundancia y la prevalencia de grupos de genes y genomas se recuperan a través de metagenomas de shotgun[26]​. La combinación de metagenomas con pangenomas, también conocida como Metapangenómica, revela los resultados a nivel de población del filtrado específico del hábitat del acervo genético pangenómico[27]​.

Algunos autores consideran que la Metapangenómica amplía el concepto de pangenoma al incorporar secuencias génicas obtenidas de microorganismos no cultivados mediante un enfoque metagenómico. Un metapangenoma comprende secuencias de genomas ensamblados a partir de metagenomas (MAGs) y los genomas obtenidos de microorganismos cultivados[28]​. La metagenómica se ha aplicado para evaluar la diversidad de una comunidad, la adaptación al nicho microbiano, la evolución microbiana, las actividades funcionales  y las redes de interacción de la comunidad[29]​. La plataforma Anvi ́o desarrolló un flujo de trabajo que integra el análisis y la visualización de metapangenomas generando pangenomas y estudiándolos junto con metagenomas[26]​.

Ejemplos[editar]

Pangenoma procariótico[editar]

El pangenoma de S. pneumoniae. (a) Numero de nuevos genes como función del número de genomas secuenciados. El numero predicho de nuevos genomas cae notoriamente cuando el número de genomas excede la cantidad de 50. (b) Numero de genes centrales como función de genomas secuenciados. El número de genes centrales converge a 1,647 para un número de genomas n →∞. De Donati et al.[30]

En 2018, el 87% de las secuencias genómicas completas disponibles eran de bacterias, lo cual impulsaba a los investigadores a calcular los pangenomas procarióticos en diferentes niveles taxonómicos[3]​. En 2015, el pangenoma de 44 cepas de la bacteria Streptococcus pneumoniae mostró pocos genes nuevos descubiertos con cada genoma nuevo secuenciado (ver figura). De hecho, el número predicho de genes nuevos descendió a cero cuando el número de genomas excedió el 50 (sin embargo, este patrón no es igual en todas las especies). Esto significaría que S. pneumoniae tiene un “pangenoma cerrado”[31]​. La fuente principal de genes nuevos en S. pneumoniae fue Streptococcus mitis a partir del cual los genes fueron transferidos horizontalmente. El tamaño del pangenoma de S. pneumoniae incrementó logarítmicamente con el número de cepas y linealmente con el número de sitios polimórficos de los genomas muestreados, lo que sugirió que los genes adquiridos se acumulan proporcionalmente a la edad de las clonas[32]​. Otro ejemplo de un pangenoma procariótico es Prochlorococcus, en el cual el conjunto de genes centrales es mucho menor que el pangenoma, el cual es usado por diferentes ecotipos de Prochlorococcus [33]​. Pangenomas abiertos han sido observados en aislados ambientales tales como Alcaligenes sp.[34]​ y Serratia sp.[35]​, que tienen un estilo de vida simpátrico. Sin embargo, los pangenomas abiertos no son exclusivos de los microorganismos de vida libre. Un estudio de 2015 de la bacteria Prevotella aislada de humanos, comparada con el repertorio de genes de su especie proveniente de diferentes partes del cuerpo humano, también mostró un pangenoma abierto con un acervo genético diverso[36]​.

También existen algunos estudios de pangenómica de arqueas. El pangenoma de Halobacteria tiene la cantidad siguiente de familias génicas divididas en los subconjuntos del pangenoma: genoma central(300), genoma accesorio (genoma central relajado: 998, diferencial: 36531, periférico: 11784)[37]​.

Pangenoma eucariótico[editar]

Los organismos eucarióticos como los hongos, animales y plantas también han mostrado evidencias de tener pangenomas. En cuatro especies de hongos cuyo pangenoma fue estudiado, entre el 80 y el 90% de los modelos génicos fueron identificados como genes centrales. Los genes accesorios restantes están involucrados principalmente en patogénesis y resistencia antimicrobiana[38]​.

En los animales se ha estudiado el pangenoma humano. En 2010 un estudio estimó que el pangenoma humano completo contiene ~19-40 Megabases de secuencias nuevas no presentes en el genoma actual de referencia[39]​. En 2021 el consorcio del Pangenoma Humano tiene el objetivo de reconocer toda la diversidad genómica humana.

Entre las plantas hay ejemplos de pangenomas estudiados en especies modelo, tanto diploides[40]​ como poliploides[41]​, y una creciente lista de cultivos[42][43]​. Un concepto emergente basado en las plantas es el del pan-NLRome, el cual es el repertorio de las proteínas de unión a nucleótidos con repeticiones ricas en leucina (NLR), receptores inmunológicos intracelulares que reconocen proteínas de patógenos y confieren resistencia a enfermedades[44]​.

Pangenoma viral[editar]

Los virus no necesariamente tienen genes extensivamente compartidos por clados, como es el gen 16S en las bacterias, y por lo tanto el genoma central del dominio viral completo está vacío. Sin embargo, varios estudios han calculado el pangenoma de algunos linajes virales. El genoma central de seis especies de pandoraviruses comprende 352 familias génicas, sólo el 4.7% del pangenoma, lo cual resulta en un pangenoma abierto[45]​.

Estructura de datos y herramientas de software[editar]

Estructuras de datos[editar]

Análisis del pangenoma de Streptococcus Agalactie.[46]​ Ejemplo de filogenias generadas con el software BPGA. Este software nos permite generar filogenias basadas en el genoma central o el pangenoma.

La cantidad de genomas secuenciados está creciendo continuamente “simplemente escalar los procedimientos bioinformáticos establecidos no será suficiente para aprovechar el potencial completo de los conjuntos de datos genómicos tan abundantes”[47]​. Las gráficas de pangenomas son estructuras de datos emergentes diseñadas para representar los pangenomas y mapear eficientemente lecturas a ellos. Estas han sido revisadas por Eizenga et al[48]​.

Herramientas de software[editar]

Conforme el interés en los pangenomas ha ido aumentando, se han desarrollado varias herramientas de software para ayudar a analizar este tipo de datos. Para iniciar un análisis pangenómico el primer paso es la homogeneización de la anotación de los genomas[17]​. El mismo software debe ser usado para anotar todos los genomas usados, como GeneMark[49]​ o RAST[50]​. En 2015, un grupo revisó diferentes tipos de análisis y herramientas accesibles para los investigadores[51]​. Hay siete tipos de software especializado en pangenomas: dedicados a conglomerar genes homólogos, identificar SNPs, graficar perfiles pangenómicos, construir relaciones filogenéticas de genes/familias ortólogas de cepas/aislados, hacer búsqueda basada en funcionalidad, anotación y/o curación y visualización[51]​.

Los dos softwares más citados para el análisis pangenómico para finales del 2014[51]​ fueron Panseq[52]​ y PGAP (Pan-genomes analysis pipeline)[53]​. Otras opciones incluyen BPGA (A Pan-Genome Analysis Pipeline for prolaryotic genomes)[54]​, GET_HOMOLOGUES[55]​, Roary[56]​ y PanDelos[57]​. En 2015 fueron publicados un artículo de revisión concentrado en pangenomas procarióticos[58]​ y otro para pangenomas de plantas[59]​. Dentro de los primeros paquetes de software diseñados para pangenomas de plantas estuvieron PanTools[60]​ y GET_HOMOLOGUES-EST[61][55]​. En 2018 panX fue liberado, una herramienta web interactiva que permite la inspección de la historia evolutiva de familias de genes[62]​. PanX puede mostrar un alineamiento de genomas, un árbol filogenético, alineamiento de mutaciones e inferencias acerca de la ganancia y pérdida de la familia en relación con la filogenia del genoma central. En 2019 OrthoVenn 2.0[63]​ permitió la visualización comparativa de familias de genes homólogos en diagramas de Venn para hasta 12 genomas. En 2020 Anvi’o[64]​ estaba disponible como una plataforma multi-ómica que contenía análisis pangenómicos y metapangenómicos así como flujos de trabajo de visualización. En Anvi’o, los genomas se muestran en círculos concéntricos y cada radio representa una familia de genes, permitiendo la comparación de más de 100 genomas en su visualización interactiva.

En 2020, una comparación de herramientas para extraer contenido pangenómico basado en genes (como GET_HOMOLOGUES, PanDelos, Roary, y otros) fue publicada[65]​. Las herramientas fueron comparadas desde una perspectiva metodológica, analizando las causas que llevaron a cierta metodología a superar otras herramientas. Los análisis fueron hechos tomando en cuenta diferentes poblaciones de bacterias, las cuales eran sintéticamente generadas cambiando los parámetros de evolución. Los resultados mostraron diferente desempeño de cada herramienta que dependía de la composición de los genomas de entrada.

Véase también[editar]

Referencias[editar]

  1. a b c d e f Tettelin, Hervé; Masignani, Vega; Cieslewicz, Michael J.; Donati, Claudio; Medini, Duccio; Ward, Naomi L.; Angiuoli, Samuel V.; Crabtree, Jonathan et al. (27 de septiembre de 2005). «Genome analysis of multiple pathogenic isolates of Streptococcus agalactiae : Implications for the microbial “pan-genome”». Proceedings of the National Academy of Sciences (en inglés) 102 (39): 13950-13955. ISSN 0027-8424. PMC 1216834. PMID 16172379. doi:10.1073/pnas.0506758102. Consultado el 13 de septiembre de 2022. 
  2. a b Medini, Duccio; Donati, Claudio; Tettelin, Hervé; Masignani, Vega; Rappuoli, Rino (2005-12). «The microbial pan-genome». Current Opinion in Genetics & Development (en inglés) 15 (6): 589-594. doi:10.1016/j.gde.2005.09.006. Consultado el 13 de septiembre de 2022. 
  3. a b c d Vernikos, George; Medini, Duccio; Riley, David R; Tettelin, Hervé (2015-02). «Ten years of pan-genome analyses». Current Opinion in Microbiology (en inglés) 23: 148-154. doi:10.1016/j.mib.2014.11.016. Consultado el 13 de septiembre de 2022. 
  4. a b Marroni, Fabio; Pinosio, Sara; Morgante, Michele (2014-04). «Structural variation and genome complexity: is dispensable really dispensable?». Current Opinion in Plant Biology (en inglés) 18: 31-36. doi:10.1016/j.pbi.2014.01.003. Consultado el 13 de septiembre de 2022. 
  5. Wolf, Yuri I; Makarova, Kira S; Yutin, Natalya; Koonin, Eugene V (2012). «Updated clusters of orthologous genes for Archaea: a complex ancestor of the Archaea and the byways of horizontal gene transfer». Biology Direct (en inglés) 7 (1): 46. ISSN 1745-6150. PMC 3534625. PMID 23241446. doi:10.1186/1745-6150-7-46. Consultado el 13 de septiembre de 2022. 
  6. Mira, Alex; Martín-Cuadrado, Ana B.; D’Auria, Giuseppe; Rodríguez-Valera, Francisco (20 de septiembre de 2010). «The bacterial pan-genome: a new paradigm in microbiology». International Microbiology (en inglés) 13 (2): 45-57. ISSN 1618-1905. doi:10.2436/im.v13i2.11019. Consultado el 15 de septiembre de 2022. 
  7. Reinhardt, Josephine A.; Baltrus, David A.; Nishimura, Marc T.; Jeck, William R.; Jones, Corbin D.; Dangl, Jeffery L. (2009-02). «De novo assembly using low-coverage short read sequence data from the rice pathogen Pseudomonas syringae pv. oryzae». Genome Research 19 (2): 294-305. ISSN 1088-9051. PMC 2652211. PMID 19015323. doi:10.1101/gr.083311.108. Consultado el 15 de septiembre de 2022. 
  8. Reno, Michael L.; Held, Nicole L.; Fields, Christopher J.; Burke, Patricia V.; Whitaker, Rachel J. (26 de mayo de 2009). «Biogeography of the Sulfolobus islandicus pan-genome». Proceedings of the National Academy of Sciences (en inglés) 106 (21): 8605-8610. ISSN 0027-8424. PMC 2689034. PMID 19435847. doi:10.1073/pnas.0808945106. Consultado el 15 de septiembre de 2022. 
  9. editor., Tettelin, Hervé, editor. Medini, Duccio,. The pangenome : diversity, dynamics and evolution of genomes. ISBN 978-3-030-38281-0. OCLC 1170717683. Consultado el 15 de septiembre de 2022. 
  10. a b Halachev, Mihail R.; Loman, Nicholas J.; Pallen, Mark J. (12 de diciembre de 2011). «Calculating Orthologs in Bacteria and Archaea: A Divide and Conquer Approach». PLOS ONE (en inglés) 6 (12): e28388. ISSN 1932-6203. PMC 3236195. PMID 22174796. doi:10.1371/journal.pone.0028388. Consultado el 14 de septiembre de 2022. 
  11. Blaustein, Ryan A.; McFarland, Alexander G.; Ben Maamar, Sarah; Lopez, Alberto; Castro-Wallace, Sarah; Hartmann, Erica M. (2019-01). «Pangenomic Approach To Understanding Microbial Adaptations within a Model Built Environment, the International Space Station, Relative to Human Hosts and Soil». mSystems 4 (1): e00281-18. ISSN 2379-5077. PMC 6325168. PMID 30637341. doi:10.1128/mSystems.00281-18. Consultado el 15 de septiembre de 2022. 
  12. Mosquera-Rendón, Jeanneth; Rada-Bravo, Ana M.; Cárdenas-Brito, Sonia; Corredor, Mauricio; Restrepo-Pineda, Eliana; Benítez-Páez, Alfonso (12 de enero de 2016). «Pangenome-wide and molecular evolution analyses of the Pseudomonas aeruginosa species». BMC Genomics 17 (1): 45. ISSN 1471-2164. PMC 4710005. PMID 26754847. doi:10.1186/s12864-016-2364-4. Consultado el 14 de septiembre de 2022. 
  13. Snipen, Lars; Ussery, David W. (28 de enero de 2010). «Standard operating procedure for computing pangenome trees». Standards in Genomic Sciences (en inglés) 2 (1): 135-141. ISSN 1944-3277. PMC 3035256. PMID 21304685. doi:10.4056/sigs.38923. Archivado desde el original el 22 de febrero de 2014. Consultado el 14 de septiembre de 2022. 
  14. Sélem-Mojica, Nelly; Aguilar, César; Gutiérrez-García, Karina; Martínez-Guerrero, Christian E.; Barona-Gómez, FanciscoYR 2019. «EvoMining reveals the origin and fate of natural product biosynthetic enzymes». Microbial Genomics 5 (12): e000260. ISSN 2057-5858. PMC 6939163. PMID 30946645. doi:10.1099/mgen.0.000260. Consultado el 14 de septiembre de 2022. 
  15. Juárez-Vázquez, Ana Lilia; Edirisinghe, Janaka N; Verduzco-Castro, Ernesto A; Michalska, Karolina; Wu, Chenggang; Noda-García, Lianet; Babnigg, Gyorgy; Endres, Michael et al. (31 de marzo de 2017). «Evolution of substrate specificity in a retained enzyme driven by gene loss». En Valencia, Alfonso, ed. eLife 6: e22679. ISSN 2050-084X. PMC 5404923. PMID 28362260. doi:10.7554/eLife.22679. Consultado el 14 de septiembre de 2022. 
  16. Noda-García, Lianet; Camacho-Zarco, Aldo R.; Medina-Ruíz, Sofía; Gaytán, Paul; Carrillo-Tripp, Mauricio; Fülöp, Vilmos; Barona-Gómez, Francisco (2013-09). «Evolution of Substrate Specificity in a Recipient’s Enzyme Following Horizontal Gene Transfer». Molecular Biology and Evolution (en inglés) 30 (9): 2024-2034. ISSN 1537-1719. doi:10.1093/molbev/mst115. Consultado el 15 de septiembre de 2022. 
  17. a b Costa, Sávio Souza; Guimarães, Luís Carlos; Silva, Artur; Soares, Siomar Castro; Baraúna, Rafael Azevedo (2020-01). «First Steps in the Analysis of Prokaryotic Pan-Genomes». Bioinformatics and Biology Insights (en inglés) 14: 117793222093806. ISSN 1177-9322. PMC 7418249. PMID 32843837. doi:10.1177/1177932220938064. Consultado el 13 de septiembre de 2022. 
  18. Land, Miriam; Hauser, Loren; Jun, Se-Ran; Nookaew, Intawat; Leuze, Michael R.; Ahn, Tae-Hyuk; Karpinets, Tatiana; Lund, Ole et al. (1 de marzo de 2015). «Insights from 20 years of bacterial genome sequencing». Functional & Integrative Genomics (en inglés) 15 (2): 141-161. ISSN 1438-7948. PMC 4361730. PMID 25722247. doi:10.1007/s10142-015-0433-4. Consultado el 13 de septiembre de 2022. 
  19. Argemi, Xavier; Matelska, Dorota; Ginalski, Krzysztof; Riegel, Philippe; Hansmann, Yves; Bloom, Jochen; Pestel-Caron, Martine; Dahyot, Sandrine et al. (20 de agosto de 2018). «Comparative genomic analysis of Staphylococcus lugdunensis shows a closed pan-genome and multiple barriers to horizontal gene transfer». BMC Genomics 19 (1): 621. ISSN 1471-2164. PMC 6102843. PMID 30126366. doi:10.1186/s12864-018-4978-1. Consultado el 13 de septiembre de 2022. 
  20. Brockhurst, Michael A.; Harrison, Ellie; Hall, James P. J.; Richards, Thomas; McNally, Alan; MacLean, Craig (21 de octubre de 2019). «The Ecology and Evolution of Pangenomes». Current Biology (en inglés) 29 (20): R1094-R1103. ISSN 0960-9822. PMID 31639358. doi:10.1016/j.cub.2019.08.012. Consultado el 13 de septiembre de 2022. 
  21. McInerney, James O.; McNally, Alan; O'Connell, Mary J. (28 de marzo de 2017). «Why prokaryotes have pangenomes». Nature Microbiology (en inglés) 2 (4): 1-5. ISSN 2058-5276. doi:10.1038/nmicrobiol.2017.40. Consultado el 13 de septiembre de 2022. 
  22. Koonin, Eugene V. (1 de junio de 2015). «The Turbulent Network Dynamics of Microbial Evolution and the Statistical Tree of Life». Journal of Molecular Evolution (en inglés) 80 (5): 244-250. ISSN 1432-1432. PMC 4472940. PMID 25894542. doi:10.1007/s00239-015-9679-7. Consultado el 13 de septiembre de 2022. 
  23. Kislyuk, Andrey O.; Haegeman, Bart; Bergman, Nicholas H.; Weitz, Joshua S. (13 de enero de 2011). «Genomic fluidity: an integrative view of gene diversity within microbial populations». BMC Genomics 12 (1): 32. ISSN 1471-2164. PMC 3030549. PMID 21232151. doi:10.1186/1471-2164-12-32. Consultado el 13 de septiembre de 2022. 
  24. Puigbò, Pere; Lobkovsky, Alexander E.; Kristensen, David M.; Wolf, Yuri I.; Koonin, Eugene V. (21 de agosto de 2014). «Genomes in turmoil: quantification of genome dynamics in prokaryote supergenomes». BMC Biology 12 (1): 66. ISSN 1741-7007. PMC 4166000. PMID 25141959. doi:10.1186/s12915-014-0066-4. Consultado el 13 de septiembre de 2022. 
  25. Lapierre, Pascal; Gogarten, J. Peter (1 de marzo de 2009). «Estimating the size of the bacterial pan-genome». Trends in Genetics (en inglés) 25 (3): 107-110. ISSN 0168-9525. PMID 19168257. doi:10.1016/j.tig.2008.12.004. Consultado el 13 de septiembre de 2022. 
  26. a b Delmont, Tom O.; Eren, A. Murat (25 de enero de 2018). «Linking pangenomes and metagenomes: the Prochlorococcus metapangenome». PeerJ (en inglés) 6: e4320. ISSN 2167-8359. PMC 5804319. PMID 29423345. doi:10.7717/peerj.4320. Consultado el 13 de septiembre de 2022. 
  27. Utter, Daniel R.; Borisy, Gary G.; Eren, A. Murat; Cavanaugh, Colleen M.; Mark Welch, Jessica L. (16 de diciembre de 2020). «Metapangenomics of the oral microbiome provides insights into habitat adaptation and cultivar diversity». Genome Biology 21 (1): 293. ISSN 1474-760X. PMC 7739467. PMID 33323129. doi:10.1186/s13059-020-02200-2. Consultado el 13 de septiembre de 2022. 
  28. Ma, Bing; France, Michael; Ravel, Jacques (2020). Tettelin, Hervé, ed. Meta-Pangenome: At the Crossroad of Pangenomics and Metagenomics (en inglés). Springer International Publishing. pp. 205-218. ISBN 978-3-030-38281-0. doi:10.1007/978-3-030-38281-0_9. Consultado el 13 de septiembre de 2022. 
  29. Zhong, Chaofang; Chen, Chaoyun; Wang, Lusheng; Ning, Kang (1 de enero de 2021). «Integrating pan-genome with metagenome for microbial community profiling». Computational and Structural Biotechnology Journal (en inglés) 19: 1458-1466. ISSN 2001-0370. PMC 8010324. PMID 33841754. doi:10.1016/j.csbj.2021.02.021. Consultado el 13 de septiembre de 2022. 
  30. Donati, Claudio; Hiller, N. Luisa; Tettelin, Hervé; Muzzi, Alessandro; Croucher, Nicholas J.; Angiuoli, Samuel V.; Oggioni, Marco; Dunning Hotopp, Julie C. et al. (2010). «Structure and dynamics of the pan-genome of Streptococcus pneumoniae and closely related species». Genome Biology 11 (10): R107. ISSN 1474-760X. PMC 3218663. PMID 21034474. doi:10.1186/gb-2010-11-10-r107. Consultado el 16 de septiembre de 2022. 
  31. Rouli, L.; Merhej, V.; Fournier, P. -E.; Raoult, D. (1 de septiembre de 2015). «The bacterial pangenome as a new tool for analysing pathogenic bacteria». New Microbes and New Infections (en inglés) 7: 72-85. ISSN 2052-2975. PMC 4552756. PMID 26442149. doi:10.1016/j.nmni.2015.06.005. Consultado el 13 de septiembre de 2022. 
  32. Donati, Claudio; Hiller, N. Luisa; Tettelin, Hervé; Muzzi, Alessandro; Croucher, Nicholas J.; Angiuoli, Samuel V.; Oggioni, Marco; Dunning Hotopp, Julie C. et al. (29 de octubre de 2010). «Structure and dynamics of the pan-genome of Streptococcus pneumoniae and closely related species». Genome Biology 11 (10): R107. ISSN 1474-760X. PMC 3218663. PMID 21034474. doi:10.1186/gb-2010-11-10-r107. Consultado el 13 de septiembre de 2022. 
  33. Kettler, Gregory C.; Martiny, Adam C.; Huang, Katherine; Zucker, Jeremy; Coleman, Maureen L.; Rodrigue, Sebastien; Chen, Feng; Lapidus, Alla et al. (21 de diciembre de 2007). «Patterns and Implications of Gene Gain and Loss in the Evolution of Prochlorococcus». PLOS Genetics (en inglés) 3 (12): e231. ISSN 1553-7404. PMC 2151091. PMID 18159947. doi:10.1371/journal.pgen.0030231. Consultado el 13 de septiembre de 2022. 
  34. Basharat, Zarrin; Yasmin, Azra; He, Tongtong; Tong, Yigang (26 de febrero de 2018). «Genome sequencing and analysis of Alcaligenes faecalis subsp. phenolicus MB207». Scientific Reports (en inglés) 8 (1): 3616. ISSN 2045-2322. PMC 5827749. PMID 29483539. doi:10.1038/s41598-018-21919-4. Consultado el 13 de septiembre de 2022. 
  35. Basharat, Zarrin; Yasmin, Azra (13 de octubre de 2016). «Pan-genome Analysis of the Genus Serratia». arXiv:1610.04160 [q-bio]. Consultado el 13 de septiembre de 2022. 
  36. Gupta, Vinod Kumar; Chaudhari, Narendrakumar M.; Iskepalli, Suchismitha; Dutta, Chitra (5 de marzo de 2015). «Divergences in gene repertoire among the reference Prevotella genomes derived from distinct body sites of human». BMC Genomics 16 (1): 153. ISSN 1471-2164. PMC 4359502. PMID 25887946. doi:10.1186/s12864-015-1350-6. Consultado el 13 de septiembre de 2022. 
  37. Gaba, Sonam; Kumari, Abha; Medema, Marnix; Kaushik, Rajeev (3 de diciembre de 2020). «Pan-genome analysis and ancestral state reconstruction of class halobacteria: probability of a new super-order». Scientific Reports (en inglés) 10 (1): 21205. ISSN 2045-2322. PMC 7713125. PMID 33273480. doi:10.1038/s41598-020-77723-6. Consultado el 13 de septiembre de 2022. 
  38. McCarthy, Charley G. P.; Fitzpatrick, David A.YR 2019. «Pan-genome analyses of model fungal species». Microbial Genomics 5 (2): e000243. ISSN 2057-5858. PMC 6421352. PMID 30714895. doi:10.1099/mgen.0.000243. Consultado el 13 de septiembre de 2022. 
  39. Li, Ruiqiang; Li, Yingrui; Zheng, Hancheng; Luo, Ruibang; Zhu, Hongmei; Li, Qibin; Qian, Wubin; Ren, Yuanyuan et al. (2010-01). «Building the sequence map of the human pan-genome». Nature Biotechnology (en inglés) 28 (1): 57-63. ISSN 1546-1696. doi:10.1038/nbt.1596. Consultado el 13 de septiembre de 2022. 
  40. Gordon, Sean P.; Contreras-Moreira, Bruno; Woods, Daniel P.; Des Marais, David L.; Burgess, Diane; Shu, Shengqiang; Stritt, Christoph; Roulin, Anne C. et al. (19 de diciembre de 2017). «Extensive gene content variation in the Brachypodium distachyon pan-genome correlates with population structure». Nature Communications (en inglés) 8 (1): 2184. ISSN 2041-1723. PMC 5736591. PMID 29259172. doi:10.1038/s41467-017-02292-8. Consultado el 13 de septiembre de 2022. 
  41. Gordon, Sean P.; Contreras-Moreira, Bruno; Levy, Joshua J.; Djamei, Armin; Czedik-Eysenberg, Angelika; Tartaglio, Virginia S.; Session, Adam; Martin, Joel et al. (29 de julio de 2020). «Gradual polyploid genome evolution revealed by pan-genomic analysis of Brachypodium hybridum and its diploid progenitors». Nature Communications (en inglés) 11 (1): 3670. ISSN 2041-1723. PMC 7391716. PMID 32728126. doi:10.1038/s41467-020-17302-5. Consultado el 13 de septiembre de 2022. 
  42. Gao, Lei; Gonda, Itay; Sun, Honghe; Ma, Qiyue; Bao, Kan; Tieman, Denise M.; Burzynski-Chang, Elizabeth A.; Fish, Tara L. et al. (2019-06). «The tomato pan-genome uncovers new genes and a rare allele regulating fruit flavor». Nature Genetics (en inglés) 51 (6): 1044-1051. ISSN 1546-1718. doi:10.1038/s41588-019-0410-2. Consultado el 13 de septiembre de 2022. 
  43. Jayakodi, Murukarthick; Padmarasu, Sudharsan; Haberer, Georg; Bonthala, Venkata Suresh; Gundlach, Heidrun; Monat, Cécile; Lux, Thomas; Kamal, Nadia et al. (2020-12). «The barley pan-genome reveals the hidden legacy of mutation breeding». Nature (en inglés) 588 (7837): 284-289. ISSN 1476-4687. PMC 7759462. PMID 33239781. doi:10.1038/s41586-020-2947-8. Consultado el 13 de septiembre de 2022. 
  44. Van de Weyer, Anna-Lena; Monteiro, Freddy; Furzer, Oliver J.; Nishimura, Marc T.; Cevik, Volkan; Witek, Kamil; Jones, Jonathan D.G.; Dangl, Jeffery L. et al. (2019-08). «A Species-Wide Inventory of NLR Genes and Alleles in Arabidopsis thaliana». Cell 178 (5): 1260-1272.e14. ISSN 0092-8674. PMC 6709784. PMID 31442410. doi:10.1016/j.cell.2019.07.038. Consultado el 13 de septiembre de 2022. 
  45. Aherfi, Sarah; Andreani, Julien; Baptiste, Emeline; Oumessoum, Amina; Dornas, Fábio P.; Andrade, Ana Claudia dos S. P.; Chabriere, Eric; Abrahao, Jonatas et al. (2018). «A Large Open Pangenome and a Small Core Genome for Giant Pandoraviruses». Frontiers in Microbiology 9. ISSN 1664-302X. PMC 6048876. PMID 30042742. doi:10.3389/fmicb.2018.01486. Consultado el 13 de septiembre de 2022. 
  46. Tettelin, Hervé; Masignani, Vega; Cieslewicz, Michael J.; Donati, Claudio; Medini, Duccio; Ward, Naomi L.; Angiuoli, Samuel V.; Crabtree, Jonathan et al. (27 de septiembre de 2005). «Genome analysis of multiple pathogenic isolates of Streptococcus agalactiae: implications for the microbial "pan-genome"». Proceedings of the National Academy of Sciences of the United States of America 102 (39): 13950-13955. ISSN 0027-8424. PMC 1216834. PMID 16172379. doi:10.1073/pnas.0506758102. Consultado el 16 de septiembre de 2022. 
  47. «Computational pan-genomics: status, promises and challenges». Briefings in Bioinformatics: bbw089. 21 de octubre de 2016. ISSN 1467-5463. PMC 5862344. PMID 27769991. doi:10.1093/bib/bbw089. Consultado el 13 de septiembre de 2022. 
  48. Eizenga, Jordan M.; Novak, Adam M.; Sibbesen, Jonas A.; Heumos, Simon; Ghaffaari, Ali; Hickey, Glenn; Chang, Xian; Seaman, Josiah D. et al. (31 de agosto de 2020). «Pangenome Graphs». Annual Review of Genomics and Human Genetics (en inglés) 21 (1): 139-162. ISSN 1527-8204. PMC 8006571. PMID 32453966. doi:10.1146/annurev-genom-120219-080406. Consultado el 13 de septiembre de 2022. 
  49. Besemer, Lomsadze, Borodovsky, John, Alexandre, Mark (2001). «GeneMarkS: a self-training method for prediction of gene starts in microbial genomes. Implications for finding sequence motifs in regulatory regions». Nucelic Acid Research. PMID 11410670. doi:10.1093/nar/29.12.2607. Consultado el 13 de septiembre de 2022. 
  50. Aziz, Ramy K.; Bartels, Daniela; Best, Aaron A.; DeJongh, Matthew; Disz, Terrence; Edwards, Robert A.; Formsma, Kevin; Gerdes, Svetlana et al. (8 de febrero de 2008). «The RAST Server: Rapid Annotations using Subsystems Technology». BMC Genomics 9 (1): 75. ISSN 1471-2164. PMC 2265698. PMID 18261238. doi:10.1186/1471-2164-9-75. Consultado el 14 de septiembre de 2022. 
  51. a b c Xiao, Jingfa; Zhang, Zhewen; Wu, Jiayan; Yu, Jun (1 de febrero de 2015). «A Brief Review of Software Tools for Pangenomics». Genomics, Proteomics & Bioinformatics (en inglés) 13 (1): 73-76. ISSN 1672-0229. PMC 4411478. PMID 25721608. doi:10.1016/j.gpb.2015.01.007. Consultado el 14 de septiembre de 2022. 
  52. Laing, Chad; Buchanan, Cody; Taboada, Eduardo N.; Zhang, Yongxiang; Kropinski, Andrew; Villegas, Andre; Thomas, James E.; Gannon, Victor PJ (15 de septiembre de 2010). «Pan-genome sequence analysis using Panseq: an online tool for the rapid analysis of core and accessory genomic regions». BMC Bioinformatics 11 (1): 461. ISSN 1471-2105. PMC 2949892. PMID 20843356. doi:10.1186/1471-2105-11-461. Consultado el 14 de septiembre de 2022. 
  53. Zhao, Yongbing; Wu, Jiayan; Yang, Junhui; Sun, Shixiang; Xiao, Jingfa; Yu, Jun (29 de noviembre de 2011). «PGAP: pan-genomes analysis pipeline». Bioinformatics 28 (3): 416-418. ISSN 1460-2059. PMC 3268234. PMID 22130594. doi:10.1093/bioinformatics/btr655. Consultado el 14 de septiembre de 2022. 
  54. Chaudhari, Narendrakumar M.; Gupta, Vinod Kumar; Dutta, Chitra (13 de abril de 2016). «BPGA- an ultra-fast pan-genome analysis pipeline». Scientific Reports (en inglés) 6 (1): 24373. ISSN 2045-2322. PMC 4829868. PMID 27071527. doi:10.1038/srep24373. Consultado el 14 de septiembre de 2022. 
  55. a b Contreras-Moreira, Bruno; Vinuesa, Pablo (15 de diciembre de 2013). «GET_HOMOLOGUES, a Versatile Software Package for Scalable and Robust Microbial Pangenome Analysis». Applied and Environmental Microbiology (en inglés) 79 (24): 7696-7701. ISSN 0099-2240. PMC 3837814. PMID 24096415. doi:10.1128/AEM.02411-13. Consultado el 14 de septiembre de 2022. 
  56. Page, Cummins, Hunt, Wong, Reuter, Holden, Fookes, Falush, Keane, Parkhill, Andrew J., Carla A., Martin, Vanessa K., Sandra, Matthew T.G., Maria, Daniel, Jaqueline A., Julian (2015). «Roary: rapid large-scale prokaryote pan genome analysis». Bioinformatics. PMID 26198102. doi:10.1093/bioinformatics/btv421. Consultado el 13 de septiembre de 2022. 
  57. Bonnici, Vincenzo; Giugno, Rosalba; Manca, Vincenzo (30 de noviembre de 2018). «PanDelos: a dictionary-based method for pan-genome content discovery». BMC Bioinformatics 19 (15): 437. ISSN 1471-2105. PMC 6266927. PMID 30497358. doi:10.1186/s12859-018-2417-6. Consultado el 14 de septiembre de 2022. 
  58. Guimaraes, Luis Carlos; Jesus, Leandro Benevides de; Viana, Marcus Vinicius Canario; Silva, Artur; Ramos, Rommel Thiago Juca; Soares, Siomar de Castro; Azevedo, Vasco. «Inside the Pan-genome - Methods and Software Overview». Current Genomics (en inglés) 16 (4): 245-252. PMC 4765519. PMID 27006628. doi:10.2174/1389202916666150423002311. Consultado el 14 de septiembre de 2022. 
  59. Golicz, Agnieszka A.; Batley, Jacqueline; Edwards, David (2016-04). «Towards plant pangenomics». Plant Biotechnology Journal (en inglés) 14 (4): 1099-1105. doi:10.1111/pbi.12499. Consultado el 14 de septiembre de 2022. 
  60. Sheikhizadeh, Siavash; Schranz, M. Eric; Akdel, Mehmet; de Ridder, Dick; Smit, Sandra (1 de septiembre de 2016). «PanTools: representation, storage and exploration of pan-genomic data». Bioinformatics 32 (17): i487-i493. ISSN 1367-4803. doi:10.1093/bioinformatics/btw455. Consultado el 14 de septiembre de 2022. 
  61. Contreras-Moreira, Bruno; Cantalapiedra, Carlos P.; García-Pereira, María J.; Gordon, Sean P.; Vogel, John P.; Igartua, Ernesto; Casas, Ana M.; Vinuesa, Pablo (2017). «Analysis of Plant Pan-Genomes and Transcriptomes with GET_HOMOLOGUES-EST, a Clustering Solution for Sequences of the Same Species». Frontiers in Plant Science 8. ISSN 1664-462X. PMC 5306281. PMID 28261241. doi:10.3389/fpls.2017.00184. Consultado el 14 de septiembre de 2022. 
  62. Ding, Wei; Baumdicker, Franz; Neher, Richard A (25 de octubre de 2017). «panX: pan-genome analysis and exploration». Nucleic Acids Research 46 (1): e5-e5. ISSN 0305-1048. PMC 5758898. PMID 29077859. doi:10.1093/nar/gkx977. Consultado el 14 de septiembre de 2022. 
  63. Xu, Dong, Fang, Luo, Wei, Guo, Zhang, Gu, Coleman-Derr, Xia, Wang, Ling, Zhaobin, Lu, Yongjiang, Zhaoyuan, Hailong, Guoqing, Yong, Devin, Quingyou, Yi (2019). «OrthoVenn2: a web server for whole-genome comparison and annotation of orthologous clusters across multiple species». Nucleic Acids Research. PMID 31053848. doi:10.1093/nar/gkz333. Consultado el 13 de septiembre de 2022. 
  64. Eren, A. Murat; Kiefl, Evan; Shaiber, Alon; Veseli, Iva; Miller, Samuel E.; Schechter, Matthew S.; Fink, Isaac; Pan, Jessica N. et al. (2021-01). «Community-led, integrated, reproducible multi-omics with anvi’o». Nature Microbiology (en inglés) 6 (1): 3-6. ISSN 2058-5276. PMC 8116326. PMID 33349678. doi:10.1038/s41564-020-00834-3. Consultado el 14 de septiembre de 2022. 
  65. Bonnici, Vincenzo; Maresi, Emiliano; Giugno, Rosalba (7 de septiembre de 2020). «Challenges in gene-oriented approaches for pangenome content discovery». Briefings in Bioinformatics 22 (3). ISSN 1467-5463. doi:10.1093/bib/bbaa198. Consultado el 14 de septiembre de 2022.