Metagenómica

La metagenómica se define como el estudio del material genético recuperado directamente de muestras ambientales, sin necesidad de aislar ni cultivar los microorganismos presentes. Este campo ha transformado nuestra comprensión de la biodiversidad microbiana y sus funciones ecológicas en diferentes ambientes.[1]
A diferencia de la microbiología tradicional o de la genómica microbiana clásica, que dependen de la clonación y el cultivo de cepas individuales, la metagenómica analiza de manera directa el ADN total de una comunidad microbiana, permitiendo no solo conocer qué microorganismos están presentes, sino también qué funciones metabólicas y genes poseen.[2]
Con el desarrollo de técnicas de secuenciación masiva (NGS), la metagenómica moderna utiliza tanto la secuenciación de amplicones (por ejemplo, 16S, 18S o ITS) como la secuenciación metagenómica tipo shotgun para recuperar y analizar fragmentos de todos los genes presentes en una muestra ambiental. Estos avances han permitido descubrir nuevos linajes microbianos, reconstruir genomas metagenómicos (MAGs) y explorar las funciones metabólicas de comunidades completas, desde ecosistemas marinos hasta el microbioma humano.[3][1]
Hoy en día, gracias a la continua reducción en los costos de secuenciación y a la disponibilidad de herramientas bioinformáticas más robustas, la metagenómica permite estudiar la ecología microbiana a una escala y resolución sin precedentes. Este enfoque no solo ha revolucionado la biología ambiental y evolutiva, sino que también tiene aplicaciones en biotecnología, salud humana, agricultura sostenible y monitorización ambiental.[4]
Etimología
[editar]El término "metagenómica" fue utilizado por primera vez por, entre otros, Jo Handlesman, Jon Clardly y Robert M. Goodman. Fue en 1998 cuando apareció por primera vez en una publicación científica.[5] El término metagenoma hacía referencia a un abordaje que pretendía analizar una colección de genes secuenciados de una muestra ambiental como si se tratara de un único genoma. Recientemente, Kevin Chen y Lior Pachter (investigadores de la Universidad de California, en Berkeley), definieron la metagenómica como «la aplicación de técnicas genómicas modernas para el estudio directo de comunidades de microorganismos en su entorno natural, evitando la necesidad de aislar y cultivar cada una de las especies que componen la comunidad».[6]
Historia
[editar]La secuenciación convencional comienza con un cultivo de células idénticas como fuente de ADN. Sin embargo, los primeros estudios metagenómicos revelaron que hay muchos grupos de microorganismos en diferentes ambientes que no pueden ser cultivados y por lo tanto no pueden ser secuenciados. Estos primeros estudios se concentraban en las secuencias de ARN ribosomal 16S que son relativamente cortas, normalmente conservada dentro de una especie, y generalmente diferente entre especies Muchas secuencias del ARNr 16S que han sido encontradas no corresponden a ninguna especie cultivada, indicando que hay una gran cantidad de organismos que no han sido aislado. Estos estudios de los genes de ARNr que se toman directamente del medio ambiente revelaron que los métodos de cultivos básicos encuentran menos del 1% de las bacterias y arqueas en una muestra.[7] Gran parte del interés en la metagenómica viene de estos descubrimientos, que demostraron que la gran mayoría de los microorganismos han pasado desapercibidos.
Los primeros trabajos moleculares llevados a cabo en el campo fueron dirigidos por Norman R. Pace y sus colegas, quienes usaron PCR para explorar la diversidad de las secuencias de ARN ribosomal.[8] La percepción que se obtuvo a partir de estos estudios tan avanzados condujeron a Pace a proponer la idea de clonar ADN directamente de muestras del medio ambiente a principios de 1985.[9] Esto condujo al primer reporte de aislamiento y clonación ADN desde muestras ambientales, publicado por Pace y sus colegas en 1991,[10] cuando Pace estaba en el Departamento de Biología en la Universidad de Indiana. Considerables esfuerzos aseguraron que no se tratase de falsos positivos del PCR y apoyaron la existencia de una comunidad compleja e inexplorada de especies. Aunque esta metodología estaba limitada a explorar genes no codificadores para proteínas que se conservan bastante, también ayudó a realizar las primeras observaciones microbianas basadas en la morfología demostrando que la diversidad era mucho más compleja que la conocida por los métodos de cultivo. Poco después de eso Healy reportó el aislamiento metagenómico de genes funcionales de "zoolibraries" construidas a partir de un cultivo complejo de organismos ambientales crecidos en un laboratorio en hierbas secas en 1995.[11] Tras dejar el laboratorio de Pace, Edward DeLong continuó en el campo y ha publicado trabajos que básicamente ha fijado las bases de trabajo para ofilogenias ambientales basado en la firma de secuencias 16S, empezando con la construcción de bibliotecas de muestras marinas por parte de su equipo.[12]
En 2002, Mya Breitbart, Forest Rohwer y sus colegas utilizaron la secuenciación de escopeta (ver abajo) para el ambiente para mostrar que 200 litros de agua de mar contienen más de 5000 virus diferentes.[13] Estudios subsiguientes demostraron que hay más de mil especies virales en las heces humanas y posiblemente un millón de virus diferentes por kilogramo de sedimento marino, incluyendo bacteriófagos. Básicamente todos los virus en estos estudios eran especies nuevas. En 2004, Gene Tyson, Jill Banfield, y sus colegas en University of California, Berkeley y el Joint Genome Institute secuenciaron el ADN extraído de un sistema de drenaje de minas de ácidos[14] Este esfuerzo resultó en los genomas completos o casi completos de un grupo de bacterias y arqueas que habían resistido intentos previos para ser cultivados.[15]

Empezando en el 2003, Craig Venter, líder del proyecto fundado de manera privada y paralelo al Proyecto del Genoma Humano, dirigió la Expedición Global Oceánica de Muestras (GOS), circunnavegando el globo y recolectando muestras metagenómicas durante todo el viaje. Todas estas muestras se secuenciaron usando secuenciación de escopeta, con la esperanza de que fueran identificados nuevos genomas (y por lo tanto nuevos organismos). El proyecto piloto, que se llevó a cabo en el mar de los Sargazos, encontró ADN de casi 2000 especies diferentes, incluyendo 148 tipos de bacterias nunca vistas anteriormente.[17] Venter ha circunnavegado el globo y explorado a fondo la costa Oeste de Estados Unidos, completó una expedición de dos años para explorar el mar Báltico, el mar Mediterráneo y el mar Negro. Los análisis de la información metagenómica recopilada durante dicho viaje revelaron dos grupos de organismos, uno compuesto de taxones adaptado para condiciones ambientales 'feast or famine', y un segundo compuesto de relativamente menos, pero más abundantes y mejor distribuidos taxones, compuestos principalmente de plankton.[18]
En el 2005 Stephan C. Schuster en Penn State University y sus colegas publicaron las primeras secuencias de una muestra ambiental generada mediante secuenciación de alto rendimiento, en este caso pirosecuenciación masiva y paralela desarrollada por 454 Life Sciences.[19] Otro trabajo que apareció a principios de estos estudios fue de Robert Edwards, Forest Rohwer, y sus colegas en el 2006 en San Diego State University.[20]
Secuenciación
[editar]La recuperación de secuencias de ADN superiores a unos pocos miles de pares de bases resultaba extremadamente compleja hasta la aparición de técnicas avanzadas de biología molecular que posibilitaron la construcción de bibliotecas genómicas en cromosomas artificiales bacterianos (BACs, Bacterial Artificial Chromosomes). Estos vectores ofrecen una capacidad de inserción significativamente mayor (hasta 300 kb) y una mayor estabilidad en comparación con los vectores plasmídicos o cosmídicos tradicionales, lo que permitió clonar fragmentos extensos de ADN genómico y facilitó los proyectos de secuenciación a gran escala.[21][22]
En el contexto de la metagenómica, la recuperación de fragmentos largos de ADN a partir de muestras ambientales representó un reto durante años, debido a la fragmentación del ADN y la complejidad de las comunidades microbianas. Sin embargo, los avances en las técnicas de clonación y la implementación de BACs, junto con el desarrollo de cromosomas artificiales de levadura (YACs) y cromosomas artificiales humanos (HACs), hicieron posible la manipulación y conservación de secuencias genómicas extensas, incluso de organismos no cultivables.[23]
Posteriormente, la revolución de la secuenciación masiva de nueva generación (NGS) y, más recientemente, las plataformas de tercera generación como PacBio SMRT y Oxford Nanopore Technologies, permitieron obtener lecturas largas (long reads) directamente, reduciendo la dependencia de bibliotecas clonadas y mejorando notablemente la cobertura, continuidad y precisión del ensamblaje genómico.[24] [25] Estas tecnologías han sido clave para la reconstrucción de genomas a partir de metagenomas (MAGs) y la exploración de la diversidad microbiana en ecosistemas naturales y artificiales.
En conjunto, la evolución desde las bibliotecas de BACs hasta las tecnologías de lectura larga ha transformado la genómica y la metagenómica, haciendo posible recuperar y ensamblar fragmentos de ADN que antes resultaban inaccesibles, con aplicaciones que abarcan desde la genómica comparativa hasta la ecología microbiana y la biotecnología ambiental.[26]


Secuenciación de alto rendimiento
[editar]La secuenciación de alto rendimiento (High-Throughput Sequencing, HTS), también conocida como secuenciación de nueva generación (Next-Generation Sequencing, NGS), ha revolucionado el estudio de la diversidad microbiana y la metagenómica. Estas tecnologías permiten generar millones de lecturas de ADN de forma simultánea, lo que facilita el análisis exhaustivo del material genético presente en muestras ambientales sin necesidad de cultivar los microorganismos.
Los primeros estudios metagenómicos de este tipo emplearon la plataforma 454 Pyrosequencing, la cual marcó el inicio de la era NGS al ofrecer lecturas más rápidas y económicas que la secuenciación tradicional de Sanger.[27] Posteriormente, surgieron otras plataformas como Ion Torrent, Illumina MiSeq/HiSeq/NextSeq, y Applied Biosystems SOLiD, que introdujeron mejoras en precisión, profundidad de lectura y reducción de costos.[28] [26]
En general, estas tecnologías producen lecturas más cortas que la secuenciación de Sanger (~700–900 pb), pero compensan esta limitación con una enorme capacidad de secuenciación. Por ejemplo, mientras que la pirosecuenciación de 454 generaba entre 200–500 megabases de datos, las plataformas Illumina actuales pueden producir más de un terabase (10¹² bases) en una sola corrida, con lecturas que superan los 300 pb por extremo. Esto ha permitido explorar comunidades microbianas complejas y detectar organismos raros o de baja abundancia con una alta resolución sin precedentes.[29]
Además, las tecnologías más recientes, denominadas de tercera generación, como Pacific Biosciences (PacBio SMRT) y Oxford Nanopore Technologies (ONT), han introducido la posibilidad de obtener lecturas ultralargas (hasta cientos de kilobases) sin necesidad de amplificación, lo que mejora la continuidad de los ensamblajes y la detección de estructuras genómicas complejas. [25][24]
Una de las principales ventajas de la secuenciación de alto rendimiento es que no requiere clonación previa del ADN, eliminando así procesos largos, costosos y propensos a sesgos. Esto permite un acceso más directo al ADN ambiental, reduciendo los pasos experimentales y acelerando la generación de datos genómicos.
Secuenciación shotgun
[editar]Dentro de las estrategias de secuenciación de alto rendimiento, la secuenciación shotgun representa un enfoque fundamental. Este método consiste en fragmentar aleatoriamente el ADN total extraído de una muestra ambiental en millones de fragmentos cortos, los cuales se secuencian y posteriormente se ensamblan bioinformáticamente para reconstruir secuencias continuas más largas (contigs) o incluso genomas metagenómicos (MAGs), dependiendo de la complejidad de la muestra y cantidad de datos.[29]
Originalmente, la secuenciación shotgun requería la construcción de bibliotecas de clonación en vectores como los cromosomas artificiales bacterianos (BACs). Sin embargo, con el desarrollo de las plataformas de secuenciación masiva, esta etapa se ha vuelto innecesaria, ya que los sistemas NGS permiten obtener directamente un volumen masivo de secuencias, con mayor cobertura y menor costo. [30]
La metagenómica shotgun proporciona una visión integral de la composición y función de las comunidades microbianas: revela qué organismos están presentes (perfil taxonómico) y qué genes o rutas metabólicas potenciales poseen (perfil funcional). Su carácter no dirigido y aleatorio permite detectar también microorganismos raros o no cultivables, que quedarían fuera del alcance de técnicas basadas en cultivos o en marcadores específicos como el gen 16S rRNA .[30][29]
No obstante, la naturaleza aleatoria de la secuenciación shotgun implica que los organismos más abundantes en la muestra estarán sobrerrepresentados, mientras que las especies raras pueden requerir una mayor profundidad de secuenciación para obtener cobertura suficiente. Por ello, los proyectos metagenómicos suelen equilibrar costos, profundidad y complejidad del ensamblaje mediante el uso combinado de tecnologías de lectura corta y larga, junto con estrategias de coensamblaje y binning metagenómico.[31]
Bioinformática
[editar]La cantidad de datos generada por los experimentos de metagenómica es enorme y, además, intrínsecamente ruidosa, ya que contiene fragmentos de ADN procedentes de miles de organismos distintos que coexisten en una misma muestra. En un solo análisis metagenómico pueden detectarse secuencias correspondientes a más de 10000 especies microbianas, muchas de ellas aún no descritas.[32][33] Por ejemplo, en el caso de la microbiota ruminal, un estudio de gran escala recopiló un total de 4941 MAGs a partir de aproximadamente 6,5 terabases de datos generados mediante la combinación de secuenciación de lecturas largas y cortas,[34] lo que permitió ampliar considerablemente el conocimiento sobre la diversidad microbiana del rumen bovino. De manera similar, en el ámbito del microbioma intestinal humano, el catálogo Unified Human Gastrointestinal Genome (UHGG) consolidó 204938 genomas no redundantes pertenecientes a 4644 especies bacterianas,[35] proporcionando un marco de referencia unificado para el estudio de la diversidad y función microbiana en el intestino humano.
El procesamiento de estos volúmenes de datos implica numerosos desafíos bioinformáticos. Las etapas incluyen la limpieza y control de calidad de las secuencias, el ensamblaje de fragmentos en contigs, la agrupación de secuencias en genomas metagenómicos (MAGs), la anotación funcional y taxonómica, y el análisis comparativo entre muestras o ecosistemas.[36][37] Cada una de estas fases requiere herramientas computacionales especializadas y una gran capacidad de cómputo. Por ello, la bioinformática se ha convertido en una disciplina esencial dentro de la metagenómica, permitiendo transformar datos fragmentados y masivos en conocimiento biológico útil sobre la composición, función y ecología de las comunidades microbianas.
Control de calidad de secuencias
[editar]El primer paso del análisis de datos metagenómicos consiste en realizar un control de calidad y prefiltrado de las lecturas crudas obtenidas por secuenciación. Este proceso busca eliminar errores técnicos y fuentes de contaminación que podrían sesgar los análisis posteriores. Entre las tareas más comunes se incluyen la filtración por calidad de bases, la eliminación de adaptadores, la remoción de lecturas redundantes o demasiado cortas, y la detección de secuencias contaminantes.[36][38]
Las lecturas con valores de calidad (Q-score) bajos o con presencia de bases ambiguas suelen ser descartadas o recortadas en sus extremos para mejorar la precisión del ensamblaje. Herramientas ampliamente utilizadas para esta etapa incluyen FastQC,[39] que genera reportes visuales de la calidad de las lecturas, y fastp,[40] un programa rápido y automatizado que combina filtrado, recorte, corrección de bases y generación de estadísticas resumidas. Otros programas con funciones similares son Trimmomatic[41] y Cutadapt,[42] que permiten ajustar umbrales de calidad y longitud de manera flexible.
En muestras metagenómicas de origen humano u otros animales, un paso adicional esencial es la remoción de secuencias del hospedero para evitar la presencia de ADN eucariótico en los análisis microbianos. Esto se realiza mediante la alineación de las lecturas contra el genoma de referencia del hospedero y la posterior eliminación de las coincidencias.[36] Herramientas modernas como Hostile[43] automatizan este proceso, ofreciendo una detección rápida y eficiente de secuencias de hospedero; mientras que métodos previos, como DeconSeq[44] y Eu-Detect,[45] también se utilizan con objetivos similares.
La aplicación rigurosa de estos pasos de control de calidad garantiza que los datos finales utilizados para el ensamblaje y la anotación reflejen con mayor fidelidad la composición microbiana real de la muestra, reduciendo el ruido técnico y las posibles contaminaciones.
Ensamblaje
[editar]La información derivada de proyectos genómicos y metagenómicos se basa en secuencias de ADN, pero existen diferencias fundamentales entre ambas. En los proyectos genómicos, las secuencias provienen de un solo organismo y suelen presentar una cobertura alta y redundante, lo que facilita un ensamblaje completo y confiable del genoma. En cambio, los proyectos metagenómicos analizan mezclas de ADN de múltiples organismos en una muestra ambiental, por lo que las secuencias obtenidas tienden a ser más fragmentadas, heterogéneas y con menor redundancia.[46]
Actualmente, las lecturas cortas generadas por tecnologías como Illumina son altamente confiables y precisas, con tasas de error muy bajas (generalmente menores al 0.1%). Sin embargo, la dificultad de ensamblar metagenomas no proviene principalmente de los errores de secuenciación, sino de factores biológicos y estructurales intrínsecos a las muestras ambientales. Entre estos factores se incluyen la gran diversidad de especies con abundancias desiguales, la presencia de regiones repetitivas o altamente conservadas entre organismos, y la similitud genética entre cepas cercanas, que puede conducir a contigs quiméricos o ensamblajes ambiguos.[47][46][48]
Existen diversos programas de ensamblaje que utilizan la información de lecturas pareadas (paired-end reads) para mejorar la precisión y continuidad de los ensamblajes. Los primeros ensambladores, como Phrap o Celera Assembler, fueron diseñados para genomas aislados y lecturas largas de Sanger, pero sentaron las bases para los métodos actuales y aún pueden producir resultados aceptables en conjuntos metagenómicos simples. Con la llegada de las tecnologías de segunda generación (por ejemplo, Illumina), que generan grandes volúmenes de lecturas cortas, surgieron ensambladores optimizados basados en grafos de De Bruijn, como Velvet, SOAPdenovo, SPAdes y MEGAHIT. Estos programas están diseñados para manejar la redundancia y el enorme tamaño de los datos metagenómicos, logrando ensamblajes más eficientes y escalables.[47][46][49]
El uso de genomas de referencia puede mejorar la reconstrucción de las especies más abundantes o bien caracterizadas, mediante enfoques de ensamblaje guiado (reference-guided) o híbrido. Sin embargo, este método sigue limitado por la disponibilidad de genomas representativos, que solo abarcan una fracción reducida de la diversidad microbiana conocida.[46]
Binning
[editar]Una vez obtenido el ensamblaje, surge un desafío adicional: el binning, que consiste en determinar a qué organismos pertenecen las secuencias ensambladas. Este proceso se apoya en características como la composición del ADN (por ejemplo, contenido GC o frecuencias de k-mers), la cobertura de lectura y la coocurrencia entre muestras, y se implementa en herramientas modernas como MetaBAT2, MaxBin2, CONCOCT o enfoques más recientes basados en aprendizaje automático.[49]
Predicción de genes
[editar]Los análisis metagénomicos de las fuentes de información utilixan dos acercamientos en la anotación de regiones codificantes en los cóntigos ensamblados.[48] El primer acercamiento es identificar los genes basándose en la homología con genes que ya estén públicamente disponibles en las bases de datos de secuencia, normalmente por simples búsquedas BLAST. Este tipo de acercamiento está implementado en el programa MEGAN4.[50] El segundo, ab initio, utiliza características intrínsecas de la secuencia para predecir las regiones codificantes basándose en conjuntos de genes de organismos relacionados. Este es el acercamiento tomado por programas comoGeneMark[51] y GLIMMER. La ventaja principal de la predicción ab initio es que permite la detección de regiones codificantes que no tengan homólogos en las bases de datos de secuencias, pero resulta más preciso cuando hay grandes regiones continuas de ADN genómico para comparación.[52]
Diversidad de especies
[editar]La anotación de genes proporciona el "que", mientras que las mediciones de la diversidad de especies proporcionan el "quien" .[53] Para poder conectar la función y la composición de la comunidad en metagenomas, las secuencias deben estar agrupadas. El agrupamiento es el proceso de asociar una secuencia en partículas con un organismo.[48] En métodos de agrupamiento por similitud como BLAST se usan para buscar rápidamente marcadores filogenéticos o de otro modo secuencias similares en las bases de datos públicas existentes. Este acercamiento es implementado en MEGAN.[54] Otra herramienta, PhymmBL, utiliza modelos interpolados de Markov para asignar lecturas.[52] MetaPhlAn y AMPHORA son métodos basados en marcadores de clados específicos para estimar la abundancia relativa con desempeños computacionales mejorados.[55] Una vez que las secuencias son agrupadas, es posible llevar a cambo análisis comparativos de la diversidad y la riqueza utilizando herramientas como Unifrac.[52]
Integración de la información
[editar]La cantidad masiva de información se secuenciación que no deja de crecer exponencialmente es un reto desalentador que se complica por la complejidad de la metadata asociada con proyectos metagenómicos. La Metadata incluye información detallada acerca de la geografía tridimensional y las características ambientales de la muestra, información física acerca del sitio de la muestra y la metodología del muestreo.[56] Dicha información es necesaria tanto para asegurar la replicabilidad como para permitir el análisis downstream.[57]
Se han desarrollado varias herramientas para integrar la metadata y la información de secuencias, permitiendo un análisis comparativo downstream de diferentes conjuntos de información mediante un número de índices ecológicos. En 2007, Folker Meyer y Robert Edwards y un equipo en Argonne National Laboratory en University of Chicago liberó el Metagenomics Rapid Annotation usando el servidor de Subsystem Technology (MG-RAST), un recurso comunitario para los análisis de conjuntos de metgagenomas.[58] Desde junio del 2012, han sido analizadas más de 14.8 terabases (14x1012 bases) de ADN, con más de 10,000 conjuntos de información pública disponible dentro de MG-RAST. Más de 8,000 usuarios han presentado un total de 50,000 metagenomas a MG-RAST. El sistema Integrated Microbial Genomes/Metagenomes (IMG/M) también proporciona una serie de herramientas para el análisis funcional de comunidades microbianas basado en su secuencia de metagenoma, basado en aislamiento de genomas como referencia incluida del sistema Integrated Microbial Genomes (IMG) y del proyecto Genomic Encyclopedia of Bacteria and Archaea (GEBA).[59]
Una de las primeras y en aquel entonces única herramienta para analizar un metagenoma por alto rendimiento de información obtenida de escopeta fue MEGAN (MEta Genome ANalyzer).[50][54] Una primera versión del programa fue usada en 2005 para analizar el contexto metagenómicos de secuencias de ADN obtenidas de un hueso de mamut.[19] Basado en una comparación en BLAST contra una base de datos de referencia, esta herramienta llevó a cabo tanto el reagrupamiento taxonómico como el funcional, al colocar las lecturas en los nodos de la taxonomía NCBI usando un simple algoritmo de ancestro menos común o en los nodos de SEED o KEGG.[60]
Metagenómica comparativa
[editar]Los análisis comparativos entre metagenomas pueden proporcionar una percepción adicional hacia la función de comunidades microbianas complejas y su papel en la salud del huésped.[61] Una comparación múltiple entre metagenomas puede hacerse a un nivel de la composición de la secuencia (comparando contenido GC o tamaño del genoma) taxonomía, diversidad o complemento funcional. Las comparaciones de las estructuras poblacionales y la diversidad filogenética pueden hacerse en la base de 16S y otros marcadores filogenéticos, o —en el caso de comunidades poco diversas— por reconstrucción de genoma del conjunto de información metagenómica.[62] Las comparaciones funcionales entre metagenomas pueden hacerse al comparar secuencias contra las referencias en las bases de datos como COG o KEGG, y tabulando la abundancia por categoría y evaluando cualquier diferencia por significación estadística.[60] Este acercamiento centrado en genes enfatiza el complemento funcional de la comunidad como uno, y no como grupos taxonómicos y demuestra que los complementos funcionales son análogos bajo condiciones ambientales similares.[62] Por consiguiente, la metadata en un contexto ambiental de las muestras metagenómicas es especialmente importante en análisis comparativos, ya que proporciona a los investigadores la habilidad de estudiar el efecto del hábitat sobre la estructura de la comunidad y la función.[52]
Además, varios estudios también han utilizado patrones de uso de oligonucleótidos para identificar las diferencias a través de diversas comunidades microbianas. Ejemplos de dichas metodologías incluyen el acercamiento de Willnet et al, la abundancia relativa del dinucleótido.[63] y el acercamiento de HabiSign por Ghosh et al.[64] Ghosh et al. (2011)[64] también indicó que diferencias en los patrones de uso pueden ser usadas para identificar genes (o lecturas metagenómicas) originándose en hábitats específicos. Además algunos métodos como TriageTools[65] o Compareads[66] detectan lecturas similares entre dos conjuntos de lecturas. La medida de similitud que aplican en las lecturas se basa en el número de palabras idénticas de longitud k compartido por pares de las lecturas.
Un objetivo clave en la metagenómica comparativa es poder identificar grupos microbianos que son responsables de otorgar características específicas a cierto ecosistema. Sin embargo, debido a problemas con las tecnologías de secuenciación de los artefactos deben considerarse como si fuera metagenomeSeq.[67] Otros han caracterizado interacciones inter-microbianas entre los grupos microbianos residentes.. Una aplicación de análisis comparativo metagenómicos basado en GUI llamada Community-Analyzer ha sido desarrollada por Kuntal et al.[68], que implementa una gráfica basada en una correlación y despliega un algoritmo que no solo facilita una visualización rápida de las diferencias en las comunidades microbianas analizadas (en términos de composición taxonómica), pero también proporciona una visión hacia las interacciones inherentes inter-microbianas que ocurren ahí. Notablemente, este algoritmo desplegado también permite la agrupación de los metagenomas basándose en los patrones inter-microbianos probables más que por simplemente comparar valores de abundancias de varios grupos taxonómicos. Además, la herramienta implementa diversas funcionalidades interactivas basadas en GUI que permiten a los usuarios realizar un análisis comparativo estándar a través de microbiomas..
Análisis de datos
[editar]Metabolismo de la comunidad
[editar]En muchas comunidades bacterianas, naturales o diseñadas (como bioreactores), hay una división significativa de trabajo en el metabolismo (sintropía), durante la cual los desechos de algunos organismos son metabolitos de otros.[69] En dicho sistema, la estabilidad funcional del bioreactor metanogénico requiere la presencia de varias especies sintrópicas. (Syntrophobacterales y Synergistia) trabajando juntas para poder convertir recursos crudos en residuos metabolizados completamente (metano).[70] Usando estudios de comparación de genes y experimento de expresión con microarreglos o investigadores de proteómica pueden crear una red metabólica que vaya más allá de las fronteras de las especies. Dicho estudio requiere un conocimiento detallado acerca de qué versiones de qué proteínas son codificadas por qué especies e, incluso, por qué tipos de qué especies. Por lo tanto, la información de la genómica de comunidad es otra herramienta fundamental (junto con la metabolómica y la proteómica) en la búsqueda para determinar cómo los metabolitos son transferidos y transformados por una comunidad.[71]
Metatranscriptómica
[editar]La metagenómica permite a los investigadores acceder la diversidad funcional y metabólica de comunidades microbianas, pero no puede demostrar cual de estos procesos está activo.[62] La extracción y los análisis del ARNm metagenómico (el metatranscriptoma) proporciona información sobre la regulación y perfiles de expresión de comunidades complejas. Debido a las dificultades técnicas (la corta vida media del ARNm, por ejemplo) presentes en la recolección de ARN ambiental, ha habido relativamente pocos estudios metatranscriptómicos in situ de las comunidades microbianas hasta la fecha.[62] Mientras que originalmente estaban limitados a la tecnología de microarreglos, los estudios metatranscriptómicos han usado directamente secuenciación de alto rendimiento del ADNc para proporcionar la expresión del genoma completa y cuantificación de una comunidad microbiana,[62] primero empleada por Leininger et al. (2006) en su análisis de oxidación de amoniaco en suelos.[72]
Virus
[editar]La secuenciación metagenómica resulta particularmente útil en el estudio de comunidades virales. Como los virus no tienen un marcador filogenético universal que compartan (como el ARN 16S para bacterias y arquea y el ARN 18S para eucariota), la única manera de acceder a la diversidad genética de la comunidad viral desde una muestra ambiental es a través de la metagenómica. La metagenómica viral debe poder proporcionar más y más información acerca de la diversidad viral y la evolución.[73] Por ejemplo, una fuente de información metagenómica llamada Giant Virus Finder aportó la primera evidencia de la existencia de virus gigantes en un desierto salino.[74]
Aplicaciones
[editar]La metagenómica tiene el potencial de avanzar el conocimiento en una gran variedad de campos. También puede aplicarse a la resolución de retos prácticos en medicina, ingeniería, agricultura, sostenibilidad y ecología.[56]
Medicina
[editar]Las comunidades microbianas juegan un papel clave en la preservación de la salud humana, pero su composición y el mecanismo por el que hacen esto sigue siendo un misterio.[75] La secuenciación metagenómica está siendo usada para caracterizar las comunidades microbianas de 15-18 sitios del cuerpo de por lo menos 250 individuos. Esto es parte de la Iniciativa del Microbioma Humano, con los objetivos principales de determinar si existe un microbioma humano central, entender los cambios en el microbioma humano que pueden correlacionarse con la salud humana y desarrollar nuevas herramientas tecnológicas y de bioinformática para poder alcanzar dichos objetivos.[76]
Otro estudio médico parte del proyecto MetaHit (Metagenómica de Tracto Intestinal Humano) consistió de 124 individuos de Dinamarca y España saludables, con sobrepeso y pacientes con síndrome del intestino irritable. El estudio intentó categorizar la profundidad y la diversidad filogenética de las bacterias gastrointestinales. Utilizando datos de secuenciación de Illumina GA y SOAPdenovo, de Bruijn, una herramienta basada en gráficas diseñada específicamente para ensamblar lecturas cortas, fueron capaces de generar 6.59 millones de cóntigos mayores a 500 pares de bases para un cóntigo de longitud total de 10.3 Gb y un N50 de 2.2 kb.
El estudio demostró que dos divisiones bacterianas, Bacteroidetes y Firmicutes, constituyen más del 90% de las categorías filogenéticas que dominan la bacteria intestinal. Usando las frecuencias relativas de los genes encontrados dentro del intestino, estos investigadores encontraron 1,244 agrupaciones metagenómicas que son críticamente importantes para la salud del tracto intestinal. Hay dos tipos de funciones en estas agrupaciones: gestión interna y las que son específicas para el intestino. Las agrupaciones de genes de gestión interna son necesarias en todas las bacterias y normalmente son componentes clave en los principales mecanismos metabólicos incluyendo el metabolismo central del carbono y la síntesis de aminoácidos. Las funciones específicas del intestino incluyen adhesión a proteínas huéspedes y la cosecha de azúcares a partir de los glicolípidos globoseries. Pacientes con el síndrome del intestino irritable exhibieron un 25% menos de genes y menor diversidad bacteriana que los individuos que no sufrían de la enfermedad, indicando que cambios en la diversidad de la bioma intestinal del paciente pueden estar asociados con esta condición.
Mientras estos estudio destacan algunas aplicaciones potenciales médicas importantes, solo 31-48.8% de las lecturas puede alinearse a 194 genomas públicos del intestino humano y 7.6-21.2% a los genomas de las bacterias disponibles en GenBank, lo cual indica que hace falta mucha más investigación para capturar los genomas bacterianos necesarios.[77]
Biocombustibles
[editar]
Los biocombustibles son combustibles derivados de la conversión de biomasa, como en la conversión de celulosa contenida en tallos de maíz y otra biomasa en etanol celulósico.[56] Este proceso depende de los consorcios microbianos que transforman la celulosa en azúcares, seguido de la fermentación de los azúcares para formar etanol. Los microbios ambientan producen una variedad de fuentes de bioenergía incluyendo metano e hidrógeno.[56]
La deconstrucción eficiente a escala industrial de biomasa requiere enzimas nuevas con mayor productividad y menor costo.[78] Los acercamientos metagenómicos al análisis de comunidades microbianas complejas permite la proyección de enzimas con aplicaciones industriales para la producción de biocombustibles como las hidrolasas glicosídicas.[79] Además se requiere conocimiento de como la función de estas comunidades microbianas se requiere para controlarlas y la metagenómica es la herramienta clave para entenderlas. Los acercamientos metagenómicos permiten análisis comparativos entre sistemas microbianos convergentes como fermentadores de biogás[80] o insectos herbívoros como el hongo del jardín de las hormigas cortahojas.[81]
Remediación Ambiental
[editar]La metagenómica puede mejorar las estrategias para monitorear el impacto de contaminantes en los ecosistemas y para limpiar los ambientes contaminados, un mejor entendimiento de como las comunidades microbianas se enfrentan con los contaminantes mejora las evaluaciones de los sitios potencialmente contaminados para recuperarlos e incrementar las oportunidades de los ensayo de bioaumentación y bioestimulación funcionen.[82]
Biotecnología
[editar]Las comunidades microbianas producen un arreglo de químicos biológicos activos que son usados en competencia y comunicación.[83] Muchos de los fármacos usados hoy en día fueron originalmente descubiertos en microbios; el progresos reciente explotando los ricos recursos genéticos de microbios no cultivables ha dirigido al descubrimiento de nuevos genes, enzimas y productos naturales.[62][84] La aplicación de la metagenómica ha permitido el desarrollo de productos, químicos finos y farmacéuticos donde el beneficio de la síntesis quiral de enzima catalizada es ampliamente reconocido.[85]
Dos tipos de análisis son usados en la bioprospección de la información metagenómica: la proyección impulsada por una función para una característica expresada y proyección impulsada en una secuencia para secuencias de ADN de interés.[86] Los análisis impulsados en una función buscan identificar clones expresando una característica deseada o una actividad útil, seguido por caracterización bioquímica y análisis de secuencia. Este acercamiento está limitado por la disponibilidad de una pantalla adecuada y el requisito de que la característica deseada debe estar expresada en la célula huésped. Además, el bajo rango de descubrimiento (menos de uno por cada 1,000 clones proyectados) y la intensa carga de trabajo que requiere limitan el acercamiento.[87] En contraste, los análisis impulsados por secuencia usan secuencias conservativas de ADN para diseñar los primers para PCR para proyectar clones para la secuencia de interés.[86] En comparación a los acercamientos basados en clonación, usar un acercamiento solo basado en la secuencia reduce la cantidad de exhibición requerida. La aplicación de secuenciación masiva paralela también aumenta de manera importante la cantidad de información de secuenciación generado, la cual requiere fuentes de análisis bioinformático de alto rendimiento.[87] El acercamiento impulsado por secuencia para proyectar está limitado por la amplitud y la precisión de las funciones de los genes presentes en bases de datos de secuencias públicas. En la práctica, en los experimentos se hace uso de una combinación de ambos acercamiento basados en la función de interés, la complejidad de la muestra a proyectarse y otros factores.[87][88]
Agricultura
[editar]Los suelos donde crecen las plantas están habitados por comunidades microbianas con un gramo de suelo conteniendo alrededor de 109-1010 células microbianas que comprenden cerca de una gigabase de información de secuencia.[89][90] Las comunidades microbianas que habitan suelos son de las más complejas conocidas por la ciencia, y permanecen poco entendidas a pesar de su importancia económica.[91] Los consorcios microbianos realizan una variedad de servicios ecológicos necesarios para el crecimiento de plantas, incluyendo fijar el nitrógeno de la atmósfera, el ciclo de nutrientes, supresión de enfermedades y secuestro de hierro y otro metales.[83] Las estrategias funcionales metagenómicas están siendo usadas en explorar la interacción entre plantas y microbios a través del cultivo independiente de las comunidades microbianas.[92] Al permitir una percepción de los papeles de miembros de la comunidad no cultivados en el ciclo de los nutrientes y la promoción del crecimiento de las plantas, los acercamientos metagenómicos puede contribuir a una mejor detección de enfermedades en cosechas y ganado y la adaptación de mejores prácticas agrícolas que mejoren la salud de las cosechas al aprovechar la relación entre los microbios y las plantas.[56]
Ecología
[editar]La metagenómica puede proporcionar una percepción muy importante hacia la ecología funcional las comunidades ambientales.[93] Los análisis metagenómicos del consorcio de bacterias encontrados en la defecación de los leones marinos australianos sugiere que las heces ricas en nutrientes de los leones marinos pueden ser un nutriente importante para ecosistemas costeros. Esto es porque las bacterias que son expulsadas simultáneamente con las heces son ideales para descomponer los nutrientes en las heces en una forma biodisponible que puede ser tomada en la cadena alimenticia.[94]
La secuenciación del ADN también puede ser usada de manera más amplia para identificar especies presentes en un cuerpo de agua,[95] los escombros filtrados del aire o una muestra de tierra. Esto puede establecer el rango de especies invasoras y especies en peligro al igual que rastrear poblaciones de temporada.
Véase también
[editar]Referencias
[editar]- ↑ a b Lema, Niguse K.; Gemeda, Mesfin T.; Woldesemayat, Adugna A. (21 de septiembre de 2023). «Recent Advances in Metagenomic Approaches, Applications, and Challenges». Current Microbiology 80 (11). doi:10.1007/s00284-023-03451-5.
- ↑ Escobar-Zepeda, Alejandra; Vera-Ponce de León, Arturo; Sanchez-Flores, Alejandro (17 de diciembre de 2015). «The Road to Metagenomics: From Microbiology to DNA Sequencing Technologies and Bioinformatics». Frontiers in Genetics 6. doi:10.3389/fgene.2015.00348.
- ↑ Usyk, Mykhaylo; Peters, Brandilyn A.; Karthikeyan, Smruthi; McDonald, Daniel; Sollecito, Christopher C.; Vazquez-Baeza, Yoshiki; Shaffer, Justin P.; Gellman, Marc D. et al. (2023-01). «Comprehensive evaluation of shotgun metagenomics, amplicon sequencing, and harmonization of these platforms for epidemiological studies». Cell Reports Methods 3 (1): 100391. doi:10.1016/j.crmeth.2022.100391.
- ↑ Nam, Nguyen; Do, Hoang; Loan Trinh, Kieu; Lee, Nae (25 de mayo de 2023). «Metagenomics: An Effective Approach for Exploring Microbial Diversity and Functions». Foods 12 (11): 2140. doi:10.3390/foods12112140.
- ↑ Handelsman, J.; Rondon, M. R.; Brady, S. F.; Clardy, J.; Goodman, R. M. (1998). «Molecular biological access to the chemistry of unknown soil microbes: A new frontier for natural products». Chemistry & Biology 5 (10): R245-R249. PMID 9818143. doi:10.1016/S1074-5521(98)90108-9..
- ↑ Chen, K.; Pachter, L. (2005). «Bioinformatics for Whole-Genome Shotgun Sequencing of Microbial Communities». PLoS Computational Biology 1 (2): e24. PMC 1185649. PMID 16110337. doi:10.1371/journal.pcbi.0010024.
- ↑ Hugenholz, P; Goebel BM; Pace NR (1 de septiembre de 1998). «Impact of Culture-Independent Studies on the Emerging Phylogenetic View of Bacterial Diversity». J. Bacteriol 180 (18): 4765-74. PMC 107498. PMID 9733676.
- ↑ Lane, DJ; Pace B; Olsen GJ; Stahl DA; Sogin ML; Pace NR (1985). «Rapid determination of 16S ribosomal RNA sequences for phylogenetic analyses». Proceedings of the National Academy of Sciences 82 (20): 6955-9. Bibcode:1985PNAS...82.6955L. PMC 391288. PMID 2413450. doi:10.1073/pnas.82.20.6955.
- ↑ Pace, NR; DA Stahl; DJ Lane; GJ Olsen (1985). «Analyzing natural microbial populations by rRNA sequences». ASM News 51: 4-12. Archivado desde el original el 4 de abril de 2012.
- ↑ Pace, NR; Delong, EF; Pace, NR (1991). «Analysis of a marine picoplankton community by 16S rRNA gene cloning and sequencing». Journal of Bacteriology 173 (14): 4371-4378. PMC 208098. PMID 2066334.
- ↑ Healy, FG; RM Ray; HC Aldrich; AC Wilkie; LO Ingram; KT Shanmugam (1995). «Direct isolation of functional genes encoding cellulases from the microbial consortia in a thermophilic, anaerobic digester maintained on lignocellulose». Appl. Microbiol Biotechnol. 43 (4): 667-74. PMID 7546604. doi:10.1007/BF00164771.
- ↑ Stein, JL; TL Marsh; KY Wu; H Shizuya; EF DeLong (1996). «Characterization of uncultivated prokaryotes: isolation and analysis of a 40-kilobase-pair genome fragment from a planktonic marine archaeon». Journal of Bacteriology 178 (3): 591-599. PMC 177699. PMID 8550487.
- ↑ Breitbart, M; Salamon P; Andresen B; Mahaffy JM; Segall AM; Mead D; Azam F; Rohwer F (2002). «Genomic analysis of uncultured marine viral communities». Proceedings of the National Academy of Sciences of the United States of America 99 (22): 14250-14255. Bibcode:2002PNAS...9914250B. PMC 137870. PMID 12384570. doi:10.1073/pnas.202488399.
- ↑ Tyson, GW; Chapman J, Hugenholtz P, Allen EE, Ram RJ, Richardson PM, Solovyev VV, Rubin EM, Rokhsar DS, Banfield JF (2004). «Insights into community structure and metabolism by reconstruction of microbial genomes from the environment». Nature 428 (6978): 37-43. PMID 14961025. doi:10.1038/nature02340. Archivado desde el original el 11 de febrero de 2009.
- ↑ Hugenholz, P (2002). «Exploring prokaryotic diversity in the genomic era». Genome Biology 3 (2): 1-8. PMC 139013. PMID 11864374. doi:10.1186/gb-2002-3-2-reviews0003.
- ↑ Thomas, T.; Gilbert, J.; Meyer, F. (2012). «Metagenomics - a guide from sampling to data analysis». Microbial Informatics and Experimentation 2 (1): 3. PMC 3351745. PMID 22587947. doi:10.1186/2042-5783-2-3.
- ↑ Venter, JC; Remington K; Heidelberg JF; Halpern AL; Rusch D; Eisen JA; Wu D; Paulsen I; Nelson KE; Nelson W; Fouts DE; Levy S; Knap AH; Lomas MW; Nealson K; White O; Peterson J; Hoffman J; Parsons R; Baden-Tillson H; Pfannkoch C; Rogers Y; Smith HO (2004). «Environmental Genome Shotgun Sequencing of the Sargasso Sea». Science 304 (5667): 66-74. Bibcode:2004Sci...304...66V. PMID 15001713. doi:10.1126/science.1093857.
- ↑ Yooseph, Shibu; Kenneth H. Nealson; Douglas B. Rusch; John P. McCrow; Christopher L. Dupont; Maria Kim; Justin Johnson; Robert Montgomery; Steve Ferriera; Karen Beeson; Shannon J. Williamson; Andrey Tovchigrechko; Andrew E. Allen; Lisa A. Zeigler; Granger Sutton; Eric Eisenstadt; Yu-Hui Rogers; Robert Friedman; Marvin Frazier; J. Craig Venter (4 de noviembre de 2010). «Genomic and functional adaptation in surface ocean planktonic prokaryotes». Nature 468 (7320): 60-66. Bibcode:2010Natur.468...60Y. ISSN 0028-0836. PMID 21048761. doi:10.1038/nature09530. (requiere suscripción).
- ↑ a b Poinar, HN; Schwarz, C; Qi, J; Shapiro, B; Macphee, RD; Buigues, B; Tikhonov, A; Huson, D; Tomsho, LP; Auch, A; Rampp, M; Miller, W; Schuster, SC (2006). «Metagenomics to Paleogenomics: Large-Scale Sequencing of Mammoth DNA». Science 311 (5759): 392-394. Bibcode:2006Sci...311..392P. PMID 16368896. doi:10.1126/science.1123360.
- ↑ Edwards, RA; Rodriguez-Brito B; Wegley L; Haynes M; Breitbart M; Peterson DM; Saar MO; Alexander S; Alexander EC; Rohwer F (2006). «Using pyrosequencing to shed light on deep mine microbial ecology». BMC Genomics 7: 57. PMC 1483832. PMID 16549033. doi:10.1186/1471-2164-7-57.
- ↑ Shizuya, H; Birren, B; Kim, U J; Mancino, V; Slepak, T; Tachiiri, Y; Simon, M (15 de septiembre de 1992). «Cloning and stable maintenance of 300-kilobase-pair fragments of human DNA in Escherichia coli using an F-factor-based vector.». Proceedings of the National Academy of Sciences 89 (18): 8794-8797. doi:10.1073/pnas.89.18.8794.
- ↑ Beja, O.; Suzuki, MT; Koonin, EV; Aravind, L; Hadd, A; Nguyen, LP; Villacorta, R; Amjadi, M et al. (2000). «Construction and analysis of bacterial artificial chromosome libraries from a marine microbial assemblage». Environmental Microbiology 2 (5): 516-29. PMID 11233160. doi:10.1046/j.1462-2920.2000.00133.x.
- ↑ Dewar, Ken; Birren, Bruce W.; Abderrahim, Hadi (12 de abril de 2022). Bacterial Artificial Chromosomes and Animal Transgenesis. CRC Press. pp. 283-287. ISBN 978-1-003-21109-9. Consultado el 21 de octubre de 2025.
- ↑ a b Logsdon, Glennis A.; Vollger, Mitchell R.; Eichler, Evan E. (5 de junio de 2020). «Long-read human genome sequencing and its applications». Nature Reviews Genetics 21 (10): 597-614. doi:10.1038/s41576-020-0236-x.
- ↑ a b Salzberg, Steven (20 de septiembre de 2019). «Faculty Opinions recommendation of Accurate circular consensus long-read sequencing improves variant detection and assembly of a human genome.». Faculty Opinions – Post-Publication Peer Review of the Biomedical Literature.
- ↑ a b van Dijk, Erwin L.; Jaszczyszyn, Yan; Naquin, Delphine; Thermes, Claude (2018-09). «The Third Revolution in Sequencing Technology». Trends in Genetics 34 (9): 666-681. doi:10.1016/j.tig.2018.05.008.
- ↑ Sidhu, Sachdev (14 de octubre de 2005). «Faculty Opinions recommendation of Genome sequencing in microfabricated high-density picolitre reactors.». Faculty Opinions – Post-Publication Peer Review of the Biomedical Literature.
- ↑ Goodwin, Sara; McPherson, John D.; McCombie, W. Richard (17 de mayo de 2016). «Coming of age: ten years of next-generation sequencing technologies». Nature Reviews Genetics 17 (6): 333-351. doi:10.1038/nrg.2016.49.
- ↑ a b c Quince, Christopher; Walker, Alan W; Simpson, Jared T; Loman, Nicholas J; Segata, Nicola (2017-09). «Shotgun metagenomics, from sampling to analysis». Nature Biotechnology 35 (9): 833-844. doi:10.1038/nbt.3935.
- ↑ a b Kumar, Lakhan; Satyam, Rohit; Bharadvaja, Navneeta (1 de enero de 2021). Shah, Maulin P., ed. 9 - Metagenomics: a powerful lens viewing the microbial world. Elsevier. pp. 185-218. ISBN 978-0-12-823991-9. doi:10.1016/b978-0-12-823991-9.00007-1.
- ↑ Nayfach, Stephen; Pollard, Katherine S. (2016-08). «Toward Accurate and Quantitative Comparative Metagenomics». Cell 166 (5): 1103-1116. doi:10.1016/j.cell.2016.08.007.
- ↑ Lema, Niguse K.; Gemeda, Mesfin T.; Woldesemayat, Adugna A. (21 de septiembre de 2023). «Recent Advances in Metagenomic Approaches, Applications, and Challenges». Current Microbiology 80 (11). doi:10.1007/s00284-023-03451-5.
- ↑ Lindner, Blake G.; Gerhardt, Kenji; Feistel, Dorian J.; Rodriguez-R, Luis M.; Hatt, Janet K.; Konstantinidis, Konstantinos T. (30 de enero de 2024). «A user's guide to the bioinformatic analysis of shotgun metagenomic sequence data for bacterial pathogen detection». International Journal of Food Microbiology 410: 110488. doi:10.1016/j.ijfoodmicro.2023.110488.
- ↑ Stewart, Robert D.; Auffret, Marc D.; Warr, Amanda; Walker, Alan W.; Roehe, Rainer; Watson, Mick (2019-08). «Compendium of 4,941 rumen metagenome-assembled genomes for rumen microbiome biology and enzyme discovery». Nature Biotechnology 37 (8): 953-961. doi:10.1038/s41587-019-0202-3.
- ↑ Almeida, Alexandre; Nayfach, Stephen; Boland, Miguel; Strozzi, Francesco; Beracochea, Martin; Shi, Zhou Jason; Pollard, Katherine S.; Sakharova, Ekaterina et al. (2021-01). «A unified catalog of 204,938 reference genomes from the human gut microbiome». Nature Biotechnology 39 (1): 105-114. doi:10.1038/s41587-020-0603-3.
- ↑ a b c Yang, Chao; Chowdhury, Debajyoti; Zhang, Zhenmiao; Cheung, William K.; Lu, Aiping; Bian, Zhaoxiang; Zhang, Lu (1 de enero de 2021). «A review of computational tools for generating metagenome-assembled genomes from metagenomic sequencing data». Computational and Structural Biotechnology Journal 19: 6301-6314. doi:10.1016/j.csbj.2021.11.028.
- ↑ Pita-Galeana, Marco Antonio; Ruhle, Martin; López-Vázquez, Lucía; de Anda-Jáuregui, Guillermo; Hernández-Lemus, Enrique (20 de septiembre de 2025). «Computational Metagenomics: State of the Art». International Journal of Molecular Sciences 26 (18): 9206. doi:10.3390/ijms26189206.
- ↑ Zhou, Qian; Su, Xiaoquan; Ning, Kang (7 de noviembre de 2014). «Assessment of quality control approaches for metagenomic data analysis». Scientific Reports 4 (1): 6957. doi:10.1038/srep06957.
- ↑ «FastQC:A quality control tool for high throughput sequence data.».
- ↑ Chen, Shifu; Zhou, Yanqing; Chen, Yaru; Gu, Jia (1 de septiembre de 2018). «fastp: an ultra-fast all-in-one FASTQ preprocessor». Bioinformatics 34 (17): i884-i890. doi:10.1093/bioinformatics/bty560.
- ↑ Bolger, Anthony M.; Lohse, Marc; Usadel, Bjoern (1 de abril de 2014). «Trimmomatic: a flexible trimmer for Illumina sequence data». Bioinformatics 30 (15): 2114-2120. doi:10.1093/bioinformatics/btu170.
- ↑ Martin, Marcel (2 de mayo de 2011). «Cutadapt removes adapter sequences from high-throughput sequencing reads». EMBnet.journal 17 (1): 10. doi:10.14806/ej.17.1.200.
- ↑ Constantinides, Bede; Hunt, Martin; Crook, Derrick W (1 de diciembre de 2023). «Hostile: accurate decontamination of microbial host sequences». En Valencia, Alfonso, ed. Bioinformatics 39 (12). doi:10.1093/bioinformatics/btad728.
- ↑ R, Schmeider; R Edwards (2011). «Fast identification and removal of sequence contamination from genomic and metagenomic datasets». PLoS ONE 6 (3): e17288. Bibcode:2011PLoSO...617288S. PMC 3052304. PMID 21408061. doi:10.1371/journal.pone.0017288.
- ↑ Mohammed, Monzoorul Haque; Chadaram, Sudha; Komanduri, Dinakar; Ghosh, Tarini Shankar; Mande, Sharmila S. (2011-09). «Eu-Detect: an algorithm for detecting eukaryotic sequences in metagenomic data sets». Journal of Biosciences 36 (4): 709-717. PMID 2185117. doi:10.1007/s12038-011-9105-2.
- ↑ a b c d Ghurye, Jay S.; Cepeda-Espinoza, Victoria; Pop, Mihai (2016-09). «Metagenomic Assembly: Overview, Challenges and Applications». The Yale Journal of Biology and Medicine 89 (3): 353-362. ISSN 1551-4056. PMC 5045144. PMID 27698619. Consultado el 9 de octubre de 2025.
- ↑ a b Lapidus, Alla L.; Korobeynikov, Anton I. (23 de marzo de 2021). «Metagenomic Data Assembly – The Way of Decoding Unknown Microorganisms». Frontiers in Microbiology 12. doi:10.3389/fmicb.2021.613791. Consultado el 9 de octubre de 2025.
- ↑ a b c Kunin, V.; Copeland, A.; Lapidus, A.; Mavromatis, K.; Hugenholtz, P. (2008). «A Bioinformatician's Guide to Metagenomics». Microbiology and Molecular Biology Reviews 72 (4): 557-578, Table 578 Contents. PMC 2593568. PMID 19052320. doi:10.1128/MMBR.00009-08.
- ↑ a b Yang, Chao; Chowdhury, Debajyoti; Zhang, Zhenmiao; Cheung, William K.; Lu, Aiping; Bian, Zhaoxiang; Zhang, Lu (1 de enero de 2021). «A review of computational tools for generating metagenome-assembled genomes from metagenomic sequencing data». Computational and Structural Biotechnology Journal 19: 6301-6314. doi:10.1016/j.csbj.2021.11.028.
- ↑ a b Huson, Daniel H; S. Mitra; N. Weber; H. Ruscheweyh; Stephan C. Schuster (June 2011). «Integrative analysis of environmental sequences using MEGAN4». Genome Research 21 (9): 1552-1560. PMC 3166839. PMID 21690186. doi:10.1101/gr.120618.111.
- ↑ Zhu, Wenhan; Lomsadze Alex; Borodovsky Mark (2010). «Ab initio gene identification in metagenomic sequences». Nucleic Acids Research 38 (12): e132. PMC 2896542. PMID 20403810. doi:10.1093/nar/gkq275.
- ↑ a b c d Wooley, J. C.; Godzik, A.; Friedberg, I. (2010). «A Primer on Metagenomics». En Bourne, Philip E., ed. PLoS Computational Biology 6 (2): e1000667. PMC 2829047. PMID 20195499. doi:10.1371/journal.pcbi.1000667.
- ↑ Konopka, A. (2009). «What is microbial community ecology?». The ISME Journal 3 (11): 1223-1230. PMID 19657372. doi:10.1038/ismej.2009.88.
- ↑ a b Huson, Daniel H; A. Auch; Ji Qi; Stephan C Schuster (January 2007). «MEGAN Analysis of Metagenomic Data». Genome Research 17 (3): 377-386. PMC 1800929. PMID 17255551. doi:10.1101/gr.5969107.
- ↑ Nicola, Segata; Levi Waldron; Annalisa Ballarini; Vagheesh Narasimhan; Olivier Jousson; Curtis Huttenhower (2012). «Metagenomic microbial community profiling using unique clade-specific marker genes». Nature Methods 9 (8): 811-814. PMC 3443552. PMID 22688413. doi:10.1038/nmeth.2066.
- ↑ a b c d e Committee on Metagenomics: Challenges and Functional Applications, National Research Council (2007). The New Science of Metagenomics: Revealing the Secrets of Our Microbial Planet. Washington, D.C.: The National Academies Press. ISBN 0-309-10676-1.
- ↑ Pagani, Ioanna; Konstantinos Liolios; Jakob Jansson; I-Min A Chen; Tatyana Smirnova; Bahador Nosrat; Victor M Markowitz; Nikos C Kyrpides (1 de diciembre de 2011). «The Genomes OnLine Database (GOLD) v.4: status of genomic and metagenomic projects and their associated metadata». Nucleic Acids Research 40 (1): D571-9. ISSN 1362-4962. PMC 3245063. PMID 22135293. doi:10.1093/nar/gkr1100.
- ↑ Meyer, F; Paarmann D; D'Souza M; Olson R; Glass EM; Kubal M; Paczian T; Rodriguez A; Stevens R; Wilke A; Wilkening J; Edwards RA (2008). «The metagenomics RAST server – a public resource for the automatic phylogenetic and functional analysis of metagenomes». BMC Bioinformatics 9: 0. PMC 2563014. PMID 18803844. doi:10.1186/1471-2105-9-386.
- ↑ Markowitz, V. M.; Chen, I. -M. A.; Chu, K.; Szeto, E.; Palaniappan, K.; Grechkin, Y.; Ratner, A.; Jacob, B.; Pati, A.; Huntemann, M.; Liolios, K.; Pagani, I.; Anderson, I.; Mavromatis, K.; Ivanova, N. N.; Kyrpides, N. C. (2011). «IMG/M: The integrated metagenome data management and comparative analysis system». Nucleic Acids Research 40 (Database issue): D123-D129. PMC 3245048. PMID 22086953. doi:10.1093/nar/gkr975.
- ↑ a b Mitra, Suparna; Paul Rupek; Daniel C Richter; Tim Urich; Jack A Gilbert; Folker Meyer; Andreas Wilke; Daniel H Huson (2011). «Functional analysis of metagenomes and metatranscriptomes using SEED and KEGG». BMC Bioinformatics. 12 Suppl 1: S21. ISSN 1471-2105. PMC 3044276. PMID 21342551. doi:10.1186/1471-2105-12-S1-S21.
- ↑ Kurokawa, Ken; Takehiko Itoh; Tomomi Kuwahara; Kenshiro Oshima; Hidehiro Toh; Atsushi Toyoda; Hideto Takami; Hidetoshi Morita; Vineet K. Sharma; Tulika P. Srivastava; Todd D. Taylor; Hideki Noguchi; Hiroshi Mori; Yoshitoshi Ogura; Dusko S. Ehrlich; Kikuji Itoh; Toshihisa Takagi; Yoshiyuki Sakaki; Tetsuya Hayashi; Masahira Hattori (1 de enero de 2007). «Comparative Metagenomics Revealed Commonly Enriched Gene Sets in Human Gut Microbiomes». DNA Research 14 (4): 169-181. PMC 2533590. PMID 17916580. doi:10.1093/dnares/dsm018. Consultado el 18 de diciembre de 2011.
- ↑ a b c d e f Simon, C.; Daniel, R. (2010). «Metagenomic Analyses: Past and Future Trends». Applied and Environmental Microbiology 77 (4): 1153-1161. PMC 3067235. PMID 21169428. doi:10.1128/AEM.02345-10.
- ↑ Willner, D; RV Thurber; F Rohwer (2009). «Metagenomic signatures of 86 microbial and viral metagenomes.». Environmental Microbiology 11 (7): 1752-66. doi:10.1111/j.1462-2920.2009.01901.x.
- ↑ a b Ghosh, Tarini Shankar; Monzoorul Haque Mohammed; Hannah Rajasingh; Sudha Chadaram; Sharmila S Mande (2011). «HabiSign: a novel approach for comparison of metagenomes and rapid identification of habitat-specific sequences.». BMC Bioinformatics 12 (Supplement 13): S9. doi:10.1186/1471-2105-12-s13-s9.
- ↑ Fimereli, D.; Detours, V.; Konopka, T. (13 de febrero de 2013). «TriageTools: tools for partitioning and prioritizing analysis of high-throughput sequencing data». Nucleic Acids Research 41 (7): e86-e86. doi:10.1093/nar/gkt094.
- ↑ Maillet, Nicolas; Lemaitre, Claire; Chikhi, Rayan; Lavenier, Dominique; Peterlongo, Pierre. «Compareads: comparing huge metagenomic experiments». BMC Bioinformatics 13 (Suppl 19): S10. doi:10.1186/1471-2105-13-S19-S10.
- ↑ Paulson, Joseph; O Colin Stine; Hector Corrada Bravo; Mihai Pop (2013). «Differential abundance analysis for microbial marker-gene surveys». Nature Methods 10 (12): 1200-1202. PMID 24076764. doi:10.1038/nmeth.2658.
- ↑ Bhusan, Kuntal Kumar; Tarini Shankar Ghosh; Sharmila S Mande (2013). «Community-analyzer: a platform for visualizing and comparing microbial community structure across microbiomes.». Genomics 102: 409-418. doi:10.1016/j.ygeno.2013.08.004.
- ↑ Werner, Jeffrey J.; Dan Knights; Marcelo L. Garcia; Nicholas B. Scalfone; Samual Smith; Kevin Yarasheski; Theresa A. Cummings; Allen R. Beers; Rob Knight; Largus T. Angenent (8 de marzo de 2011). «Bacterial community structures are unique and resilient in full-scale bioenergy systems». Proceedings of the National Academy of Sciences of the United States of America 108 (10): 4158-4163. Bibcode:2011PNAS..108.4158W. ISSN 0027-8424. PMC 3053989. PMID 21368115. doi:10.1073/pnas.1015676108.
- ↑ McInerney, Michael J.; Jessica R. Sieber; Robert P. Gunsalus (December 2009). «Syntrophy in Anaerobic Global Carbon Cycles». Current opinion in biotechnology 20 (6): 623-632. ISSN 0958-1669. PMC 2790021. PMID 19897353. doi:10.1016/j.copbio.2009.10.001.
- ↑ Klitgord, N.; Segrè, D. (2011). «Ecosystems biology of microbial metabolism». Current Opinion in Biotechnology 22 (4): 541-546. PMID 21592777. doi:10.1016/j.copbio.2011.04.018.
- ↑ Leininger, S.; Urich, T.; Schloter, M.; Schwark, L.; Qi, J.; Nicol, G. W.; Prosser, J. I.; Schuster, S. C. et al. (2006). «Archaea predominate among ammonia-oxidizing prokaryotes in soils». Nature 442 (7104): 806-809. PMID 16915287. doi:10.1038/nature04983.
- ↑ Kristensen, DM; Mushegian AR; Dolja VV; Koonin EV (2009). «New dimensions of the virus world discovered through metagenomics». Trends in Microbiology 18 (1): 11-19. PMC 3293453. PMID 19942437. doi:10.1016/j.tim.2009.11.003.
- ↑ Kerepesi, Csaba; Grolmusz, Vince (2015). «Giant Viruses of the Kutch Desert». Archives of Virology. First online. PMID 26666442. doi:10.1007/s00705-015-2720-8.
- ↑ Zimmer, Carl (13 de julio de 2010). «How Microbes Defend and Define Us». New York Times. Consultado el 29 de diciembre de 2011.
- ↑ Nelson KE and White BA (2010). «Metagenomics and Its Applications to the Study of the Human Microbiome». Metagenomics: Theory, Methods and Applications. Caister Academic Press. ISBN 978-1-904455-54-7.
- ↑ Qin, Junjie; Ruiqiang Li; Jeroen Raes; Manimozhiyan Arumugam; Kristoffer Solvesten Burgdorf (March 2010). «A human gut microbial gene catalogue established by metagenomic sequencing». Nature 464 (7285): 59-65. PMC 3779803. PMID 20203603. doi:10.1038/nature08821.
- ↑ Hess, Matthias; Alexander Sczyrba; Rob Egan; Tae-Wan Kim; Harshal Chokhawala; Gary Schroth; Shujun Luo; Douglas S Clark; Feng Chen; Tao Zhang; Roderick I Mackie; Len A Pennacchio; Susannah G Tringe; Axel Visel; Tanja Woyke; Zhong Wang; Edward M Rubin (28 de enero de 2011). «Metagenomic discovery of biomass-degrading genes and genomes from cow rumen». Science 331 (6016): 463-467. Bibcode:2011Sci...331..463H. ISSN 1095-9203. PMID 21273488. doi:10.1126/science.1200387.
- ↑ Li, Luen-Luen; Sean R McCorkle; Sebastien Monchy; Safiyh Taghavi; Daniel van der Lelie (18 de mayo de 2009). «Bioprospecting metagenomes: glycosyl hydrolases for converting biomass». Biotechnology for Biofuels 2: 10. ISSN 1754-6834. doi:10.1186/1754-6834-2-10.
- ↑ Jaenicke, Sebastian; Christina Ander; Thomas Bekel; Regina Bisdorf; Marcus Dröge; Karl-Heinz Gartemann; Sebastian Jünemann; Olaf Kaiser; Lutz Krause; Felix Tille; Martha Zakrzewski; Alfred Pühler; Andreas Schlüter; Alexander Goesmann (26 de enero de 2011). «Comparative and Joint Analysis of Two Metagenomic Datasets from a Biogas Fermenter Obtained by 454-Pyrosequencing». En Aziz, Ramy K, ed. PLoS ONE 6 (1): e14519. Bibcode:2011PLoSO...614519J. PMC 3027613. PMID 21297863. doi:10.1371/journal.pone.0014519.
- ↑ Suen, Garret; Jarrod J Scott; Frank O Aylward; Sandra M Adams; Susannah G Tringe; Adrián A Pinto-Tomás; Clifton E Foster; Markus Pauly; Paul J Weimer; Kerrie W Barry; Lynne A Goodwin; Pascal Bouffard; Lewyn Li; Jolene Osterberger; Timothy T Harkins; Steven C Slater; Timothy J Donohue; Cameron R Currie (September 2010). «An insect herbivore microbiome with high plant biomass-degrading capacity». En Sonnenburg, Justin, ed. PLoS Genetics 6 (9): e1001129. ISSN 1553-7404. PMC 2944797. PMID 20885794. doi:10.1371/journal.pgen.1001129.
- ↑ George I (2010). «Application of Metagenomics to Bioremediation». Metagenomics: Theory, Methods and Applications. Caister Academic Press. ISBN 978-1-904455-54-7.
- ↑ a b Committee on Metagenomics: Challenges and Functional Applications, National Research Council (2007). Understanding Our Microbial Planet: The New Science of Metagenomics. The National Academies Press. Archivado desde el original el 30 de octubre de 2012. Consultado el 16 de junio de 2016.
- ↑ Simon, C.; Daniel, R. (2009). «Achievements and new knowledge unraveled by metagenomic approaches». Applied Microbiology and Biotechnology 85 (2): 265-276. PMC 2773367. PMID 19760178. doi:10.1007/s00253-009-2233-z.
- ↑ Wong D (2010). «Applications of Metagenomics for Industrial Bioproducts». Metagenomics: Theory, Methods and Applications. Caister Academic Press. ISBN 978-1-904455-54-7.
- ↑ a b Schloss, Patrick D; Jo Handelsman (June 2003). «Biotechnological prospects from metagenomics». Current Opinion in Biotechnology 14 (3): 303-310. ISSN 0958-1669. PMID 12849784. doi:10.1016/S0958-1669(03)00067-3. Archivado desde el original el 4 de marzo de 2016. Consultado el 3 de enero de 2012.
- ↑ a b c Kakirde, Kavita S.; Larissa C. Parsley; Mark R. Liles (1 de noviembre de 2010). «Size Does Matter: Application-driven Approaches for Soil Metagenomics». Soil biology & biochemistry 42 (11): 1911-1923. ISSN 0038-0717. doi:10.1016/j.soilbio.2010.07.021.
- ↑ Parachin, Nádia Skorupa; Marie F Gorwa-Grauslund (2011). «Isolation of xylose isomerases by sequence- and function-based screening from a soil metagenomic library». Biotechnology for Biofuels 4 (1): 9. ISSN 1754-6834. doi:10.1186/1754-6834-4-9. Consultado el 3 de enero de 2012.
- ↑ Jansson, Janet (2011). «Towards "Tera-Terra": Terabase Sequencing of Terrestrial Metagenomes Print E-mail». Microbe 6 (7). p. 309. Archivado desde el original el 31 de marzo de 2012. Consultado el 16 de junio de 2016.
- ↑ Vogel, T. M.; Simonet, P.; Jansson, J. K.; Hirsch, P. R.; Tiedje, J. M.; Van Elsas, J. D.; Bailey, M. J.; Nalin, R. et al. (2009). «TerraGenome: A consortium for the sequencing of a soil metagenome». Nature Reviews Microbiology 7 (4): 252. doi:10.1038/nrmicro2119.
- ↑ «TerraGenome Homepage». TerraGenome international sequencing consortium. Consultado el 30 de diciembre de 2011.
- ↑ Charles T (2010). «The Potential for Investigation of Plant-microbe Interactions Using Metagenomics Methods». Metagenomics: Theory, Methods and Applications. Caister Academic Press. ISBN 978-1-904455-54-7.
- ↑ Raes, J.; Letunic, I.; Yamada, T.; Jensen, L. J.; Bork, P. (2011). «Toward molecular trait-based ecology through integration of biogeochemical, geographical and metagenomic data». Molecular Systems Biology 7: 473. PMC 3094067. PMID 21407210. doi:10.1038/msb.2011.6.
- ↑ Lavery, T. J.; Roudnew, B.; Seymour, J.; Mitchell, J. G.; Jeffries, T. (2012). «High Nutrient Transport and Cycling Potential Revealed in the Microbial Metagenome of Australian Sea Lion (Neophoca cinerea) Faeces». En Steinke, Dirk, ed. PLoS ONE 7 (5): e36478. PMC 3350522. PMID 22606263. doi:10.1371/journal.pone.0036478.
- ↑ «What's Swimming In The River? Just Look For DNA». NPR.org. 24 de julio de 2013. Consultado el 10 de octubre de 2014.
Error en la cita: La etiqueta <ref> definida en las <references> con nombre «Eisen2007» no se utiliza en el texto anterior.
Error en la cita: La etiqueta <ref> definida en las <references> con nombre «MarcoD2011» no se utiliza en el texto anterior.
Error en la cita: La etiqueta <ref> definida en las <references> con nombre «rodrigue2010» no se utiliza en el texto anterior.
Error en la cita: La etiqueta <ref> definida en las <references> con nombre «schuster2008» no se utiliza en el texto anterior.
Error en la cita: La etiqueta <ref> definida en las <references> con nombre «nmeth2009» no se utiliza en el texto anterior.
Error en la cita: La etiqueta <ref> definida en las <references> con nombre «Burton2014» no se utiliza en el texto anterior.
Error en la cita: La etiqueta <ref> definida en las <references> con nombre «qin2011» no se utiliza en el texto anterior.
<ref> definida en las <references> con nombre «segata2013» no se utiliza en el texto anterior.Enlaces externos
[editar]- Focus on Metagenomics at Nature Reviews Microbiology journal website
- The “Critical Assessment of Metagenome Interpretation” (CAMI) initiative to evaluate methods in metagenomics
- Metagenomics Sequencing for microscopic life Research Archivado el 24 de mayo de 2016 en Wayback Machine.