Ir al contenido

Diferencia entre revisiones de «Genoma de referencia»

De Wikipedia, la enciclopedia libre
Contenido eliminado Contenido añadido
Aarón Mayo (discusión · contribs.)
Añadir imagen
Aarón Mayo (discusión · contribs.)
Expandir subapartado limitaciones
Línea 57: Línea 57:


==== Limitaciones ====
==== Limitaciones ====
La versión de referencia proporciona una buena aproximación a una gran parte del genoma de un individuo. Sin embargo, en regiones con una alta [[Acervo génico|diversidad alélica]], como en el caso del [[Complejo mayor de histocompatibilidad|Complejo Mayor de Histocompatibilidad (CMH)]] en los humanos o las [[proteínas urinarias mayores]] de los ratones, el genoma de referencia puede diferir significativamente entre diferentes individuos.<ref>{{Cita publicación|url=https://www.nature.com/articles/44853|título=Complete sequence and gene map of a human major histocompatibility complex|apellidos=The MHC sequencing consortium|fecha=1999-10|publicación=Nature|volumen=401|número=6756|páginas=921–923|fechaacceso=2022-07-18|idioma=en|issn=1476-4687|doi=10.1038/44853}}</ref><ref>{{Cita publicación|url=https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0003280|título=Species Specificity in Major Urinary Proteins by Parallel Evolution|apellidos=Logan|nombre=Darren W.|apellidos2=Marton|nombre2=Tobias F.|fecha=2008-09-25|publicación=PLOS ONE|volumen=3|número=9|páginas=e3280|fechaacceso=2022-07-18|idioma=en|issn=1932-6203|doi=10.1371/journal.pone.0003280|pmc=2533699|pmid=18815613|apellidos3=Stowers|nombre3=Lisa}}</ref><ref>{{Cita libro|apellidos=Hurst J, Beynon RJ, Roberts SC, Wyatt TD|título=Urinary Lipocalins in Rodenta:is there a Generic Model?|fechaacceso=18 de Julio de 2022|editorial=Springer New York|isbn=978-0-387-73944-1|fecha=October 2007|serie=Chemical Signals in Vertebrates 11}}</ref> Debido al hecho de que el genoma de referencia se trata de una sola secuencia de ADN, lo cual le aporta su utilidad como índice o marcador de las características genómicas, esto implica limitaciones en términos de en qué grado representa fielmente el genoma humano y su [[Variación genética humana|variabilidad]]. Proyectos posteriores buscan abordar el estudio de esta variabilidad genética. El [[Proyecto 1000 genomas|Proyecto 1000 Genomas]] pretende crear una base de datos con información sobre las variaciones genéticas presentes a lo largo de diferentes genomas en poblaciones humanas, las cuales el genoma de referencia no es capaz de representar. <ref>{{Cita web|url=https://www.internationalgenome.org/home|título=IGSR: The International Genome Sample Resource|fechaacceso=18 de Julio de 2022}}</ref>
La versión de referencia proporciona una buena aproximación a una gran parte del genoma de un individuo. Sin embargo, en regiones con una alta [[Acervo génico|diversidad alélica]], como en el caso del [[Complejo mayor de histocompatibilidad|Complejo Mayor de Histocompatibilidad (CMH)]] en los humanos o las [[proteínas urinarias mayores]] de los ratones, el genoma de referencia puede diferir significativamente entre diferentes individuos.<ref>{{Cita publicación|url=https://www.nature.com/articles/44853|título=Complete sequence and gene map of a human major histocompatibility complex|apellidos=The MHC sequencing consortium|fecha=1999-10|publicación=Nature|volumen=401|número=6756|páginas=921–923|fechaacceso=2022-07-18|idioma=en|issn=1476-4687|doi=10.1038/44853}}</ref><ref>{{Cita publicación|url=https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0003280|título=Species Specificity in Major Urinary Proteins by Parallel Evolution|apellidos=Logan|nombre=Darren W.|apellidos2=Marton|nombre2=Tobias F.|fecha=2008-09-25|publicación=PLOS ONE|volumen=3|número=9|páginas=e3280|fechaacceso=2022-07-18|idioma=en|issn=1932-6203|doi=10.1371/journal.pone.0003280|pmc=2533699|pmid=18815613|apellidos3=Stowers|nombre3=Lisa}}</ref><ref>{{Cita libro|apellidos=Hurst J, Beynon RJ, Roberts SC, Wyatt TD|título=Urinary Lipocalins in Rodenta:is there a Generic Model?|fechaacceso=18 de Julio de 2022|editorial=Springer New York|isbn=978-0-387-73944-1|fecha=October 2007|serie=Chemical Signals in Vertebrates 11}}</ref> Debido al hecho de que el genoma de referencia se trata de una sola secuencia de ADN, lo cual le aporta su utilidad como índice o marcador de las características genómicas, esto implica limitaciones en términos de en qué grado representa fielmente el genoma humano y su [[Variación genética humana|variabilidad]]. Por otra parte, la mayoría de las muestras obtenidas para la secuenciación del genoma de referencia pertenecen a individuos de ascendencia europea, siendo estas poblaciones las mejor caracterizadas y estudiadas en detrimento de poblaciones no europeas. En 2010, se comprobó, mediante un ensamblado ''de novo'' de genomas extraídos de poblaciones africanas y asiáticas con el genoma de referencia del NCBI (versión NCBI36.3), que estos genomas tenían aproximadamente 5 Mb de secuencias que no alineaban contra ninguna región del genoma de referencia.<ref>{{Cita publicación|url=https://www.nature.com/articles/nbt.1596|título=Building the sequence map of the human pan-genome|apellidos=Li|nombre=Ruiqiang|apellidos2=Li|nombre2=Yingrui|fecha=2010-01|publicación=Nature Biotechnology|volumen=28|número=1|páginas=57–63|fechaacceso=2022-08-17|idioma=en|issn=1546-1696|doi=10.1038/nbt.1596|apellidos3=Zheng|nombre3=Hancheng|apellidos4=Luo|nombre4=Ruibang|apellidos5=Zhu|nombre5=Hongmei|apellidos6=Li|nombre6=Qibin|apellidos7=Qian|nombre7=Wubin|apellidos8=Ren|nombre8=Yuanyuan|apellidos9=Tian|nombre9=Geng}}</ref>

Proyectos posteriores al Proyecto Genoma Humano buscan abordar una caracterización más profunda y diversa de la variabilidad genética humana, que el genoma de referencia no es capaz de representar. El [[Proyecto HapMap]], en activo durante el periodo 2002 - 2010, con el propósito de crear un mapa de haplotipos y sus variaciones más comunes entre diferentes poblaciones humanas. Se estudiaron hasta 11 poblaciones de diferente ascendencia, por ejemplo, individuos de [[Etnia han|etnia Han]] de China, guyaratís de la [[India]], del [[pueblo yoruba]] de Nigeria o [[Pueblo japonés|japoneses]], entre otros.<ref>{{Cita publicación|url=https://pubmed.ncbi.nlm.nih.gov/16255080/|título=A haplotype map of the human genome|apellidos=International HapMap Consortium|fecha=2005-10-27|publicación=Nature|volumen=437|número=7063|páginas=1299–1320|fechaacceso=2022-08-17|issn=1476-4687|doi=10.1038/nature04226|pmc=1880871|pmid=16255080}}</ref><ref>{{Cita publicación|url=https://pubmed.ncbi.nlm.nih.gov/17943122/|título=A second generation human haplotype map of over 3.1 million SNPs|apellidos=International HapMap Consortium|apellidos2=Frazer|nombre2=Kelly A.|fecha=2007-10-18|publicación=Nature|volumen=449|número=7164|páginas=851–861|fechaacceso=2022-08-17|issn=1476-4687|doi=10.1038/nature06258|pmc=2689609|pmid=17943122|apellidos3=Ballinger|nombre3=Dennis G.|apellidos4=Cox|nombre4=David R.|apellidos5=Hinds|nombre5=David A.|apellidos6=Stuve|nombre6=Laura L.|apellidos7=Gibbs|nombre7=Richard A.|apellidos8=Belmont|nombre8=John W.|apellidos9=Boudreau|nombre9=Andrew}}</ref><ref>{{Cita publicación|url=https://pubmed.ncbi.nlm.nih.gov/20811451/|título=Integrating common and rare genetic variation in diverse human populations|apellidos=International HapMap 3 Consortium|apellidos2=Altshuler|nombre2=David M.|fecha=2010-09-02|publicación=Nature|volumen=467|número=7311|páginas=52–58|fechaacceso=2022-08-17|issn=1476-4687|doi=10.1038/nature09298|pmc=3173859|pmid=20811451|apellidos3=Gibbs|nombre3=Richard A.|apellidos4=Peltonen|nombre4=Leena|apellidos5=Altshuler|nombre5=David M.|apellidos6=Gibbs|nombre6=Richard A.|apellidos7=Peltonen|nombre7=Leena|apellidos8=Dermitzakis|nombre8=Emmanouil|apellidos9=Schaffner|nombre9=Stephen F.}}</ref><ref>{{Cita web|url=https://www.genome.gov/acerca-del-proyecto-internacional-hapmap|título=Acerca Del Proyecto Internacional Hapmap|fechaacceso=2022-08-17|sitioweb=Genome.gov|idioma=en}}</ref> El [[Proyecto 1000 genomas|Proyecto 1000 Genomas]], llevado a cabo en el periodo 2008 - 2015, con el objetivo de crear una base de datos que comprenda más del 95 % de las variaciones presentes en el genoma humano y cuyos resultados puedan ser utilizados en estudios de asociación con enfermedades como diabetes, enfermedades cardiovasculares o autoinmunes. Un total de 26 grupos étnicos diferentes fueron estudiados en este proyecto, ampliando el alcance del proyecto HapMap a nuevos grupos étnicos como el [[Mendé|pueblo mendé]] de Sierra Leona, el [[pueblo vietnamita]] o el [[pueblo bengalí]].<ref>{{Cita publicación|url=https://pubmed.ncbi.nlm.nih.gov/20981092/|título=A map of human genome variation from population-scale sequencing|apellidos=1000 Genomes Project Consortium|apellidos2=Abecasis|nombre2=Gonçalo R.|fecha=2010-10-28|publicación=Nature|volumen=467|número=7319|páginas=1061–1073|fechaacceso=2022-08-17|issn=1476-4687|doi=10.1038/nature09534|pmc=3042601|pmid=20981092|apellidos3=Altshuler|nombre3=David|apellidos4=Auton|nombre4=Adam|apellidos5=Brooks|nombre5=Lisa D.|apellidos6=Durbin|nombre6=Richard M.|apellidos7=Gibbs|nombre7=Richard A.|apellidos8=Hurles|nombre8=Matt E.|apellidos9=McVean|nombre9=Gil A.}}</ref><ref>{{Cita publicación|url=https://pubmed.ncbi.nlm.nih.gov/23128226/|título=An integrated map of genetic variation from 1,092 human genomes|apellidos=1000 Genomes Project Consortium|apellidos2=Abecasis|nombre2=Goncalo R.|fecha=2012-11-01|publicación=Nature|volumen=491|número=7422|páginas=56–65|fechaacceso=2022-08-17|issn=1476-4687|doi=10.1038/nature11632|pmc=3498066|pmid=23128226|apellidos3=Auton|nombre3=Adam|apellidos4=Brooks|nombre4=Lisa D.|apellidos5=DePristo|nombre5=Mark A.|apellidos6=Durbin|nombre6=Richard M.|apellidos7=Handsaker|nombre7=Robert E.|apellidos8=Kang|nombre8=Hyun Min|apellidos9=Marth|nombre9=Gabor T.}}</ref><ref>{{Cita publicación|url=https://pubmed.ncbi.nlm.nih.gov/26432245/|título=A global reference for human genetic variation|apellidos=1000 Genomes Project Consortium|apellidos2=Auton|nombre2=Adam|fecha=2015-10-01|publicación=Nature|volumen=526|número=7571|páginas=68–74|fechaacceso=2022-08-17|issn=1476-4687|doi=10.1038/nature15393|pmc=4750478|pmid=26432245|apellidos3=Brooks|nombre3=Lisa D.|apellidos4=Durbin|nombre4=Richard M.|apellidos5=Garrison|nombre5=Erik P.|apellidos6=Kang|nombre6=Hyun Min|apellidos7=Korbel|nombre7=Jan O.|apellidos8=Marchini|nombre8=Jonathan L.|apellidos9=McCarthy|nombre9=Shane}}</ref><ref>{{Cita publicación|url=https://pubmed.ncbi.nlm.nih.gov/26432246/|título=An integrated map of structural variation in 2,504 human genomes|apellidos=Sudmant|nombre=Peter H.|apellidos2=Rausch|nombre2=Tobias|fecha=2015-10-01|publicación=Nature|volumen=526|número=7571|páginas=75–81|fechaacceso=2022-08-17|issn=1476-4687|doi=10.1038/nature15394|pmc=4617611|pmid=26432246|apellidos3=Gardner|nombre3=Eugene J.|apellidos4=Handsaker|nombre4=Robert E.|apellidos5=Abyzov|nombre5=Alexej|apellidos6=Huddleston|nombre6=John|apellidos7=Zhang|nombre7=Yan|apellidos8=Ye|nombre8=Kai|apellidos9=Jun|nombre9=Goo}}</ref> El [https://humanpangenome.org/ Proyecto del Pangenoma Humano], el cual entró en su fase inicial en 2019 con la creación del Consorcio de Referencia del Pangenoma Humano, busca crear el mayor mapa de la variabilidad genética humana, tomando como punto de partida los resultados ya obtenidos en proyectos anteriores.<ref>{{Cita publicación|url=https://www.annualreviews.org/doi/10.1146/annurev-genom-120120-081921|título=The Need for a Human Pangenome Reference Sequence|apellidos=Miga|nombre=Karen H.|apellidos2=Wang|nombre2=Ting|fecha=2021-08-31|publicación=Annual Review of Genomics and Human Genetics|volumen=22|número=1|páginas=81–102|fechaacceso=2022-08-17|idioma=en|issn=1527-8204|doi=10.1146/annurev-genom-120120-081921|pmc=8410644|pmid=33929893}}</ref><ref>{{Cita publicación|url=https://www.nature.com/articles/s41586-022-04601-8|título=The Human Pangenome Project: a global resource to map genomic diversity|apellidos=Wang|nombre=Ting|apellidos2=Antonacci-Fulton|nombre2=Lucinda|fecha=2022-04|publicación=Nature|volumen=604|número=7906|páginas=437–446|fechaacceso=2022-08-17|idioma=en|issn=1476-4687|doi=10.1038/s41586-022-04601-8|apellidos3=Howe|nombre3=Kerstin|apellidos4=Lawson|nombre4=Heather A.|apellidos5=Lucas|nombre5=Julian K.|apellidos6=Phillippy|nombre6=Adam M.|apellidos7=Popejoy|nombre7=Alice B.|apellidos8=Asri|nombre8=Mobin|apellidos9=Carson|nombre9=Caryn}}</ref>


=== Genoma de referencia murino ===
=== Genoma de referencia murino ===

Revisión del 15:55 17 ago 2022

El primer genoma de referencia humano impreso en una serie de libros, expuesto en el museo Wellcome Collection (Londres).

Un genoma de referencia (o versión de referencia de un genoma) es una base de datos digital de secuencias de ácidos nucleicos, creado por científicos como ejemplo representativo del conjunto de genes de un organismo idealizado de una especie. Al ser resultado de un ensamblado de la secuenciación del ADN a partir de un número determinado de donantes, los genomas de referencia no representan con total exactitud el genoma de un organismo individual. En su lugar, un genoma de referencia representa un mosaico haploide de diferentes secuencias de ADN de cada donante. Por ejemplo, la versión de referencia más reciente para el genoma humano (versión GRCh38/hg38) proviene de >60 bibliotecas genómicas.[1]​ Existen genomas de referencia para múltiples especies de virus, bacterias, hongos, plantas y animales. Los genomas de referencia sirven como guía a partir de la cual se construyen los nuevos, permitiendo que estos se ensamblen de manera mucho más barata y rápida que en el primer Proyecto Genoma Humano. Es posible acceder a genomas de referencia a través de diferentes buscadores como Ensembl o UCSC Genome Browser.[2]

Propiedades

Medida de la longitud

La longitud de un genoma puede ser medida de múltiples maneras.

Una manera sencilla de medir la longitud de un genoma es contar el número de pares de bases.[3]

Se denomina golden path a una medida de longitud alternativa que omite las regiones redundantes, tales como los haplotipos y las regiones pseudoautosómicas.[4][5]​ Se suele combinar toda la información del ensamblado del genoma al superponer la información de la secuenciación sobre un mapa físico del genoma. Esta unidad de medida supone una mejor estimación del aspecto real del genoma, incluyendo los huecos redundantes y siendo un mapa más extenso que el típico ensamblado.[6]

Genomas de mamíferos

Los genomas de referencia humanos y murinos son continuamente mejorados por el Consorcio de Referencia del Genoma (GRC), un grupo de 20 investigadores de diferentes institutos de investigación, incluyendo el Instituto Europeo de Bioinformática, el NCBI, el Sanger Institute y el McDonnell Genome Institute de la Universidad de Washington en San Luis (EE.UU.). El GRC continua mejorando los genomas de referencia, reduciendo los huecos y las regiones infrarrepresentadas en la secuencia de los genomas de referencia.

Genoma de referencia humano

El primer genoma de referencia humano se extrajo de 13 voluntarios anónimos de Buffalo, New York, los cuales fueron reclutados el domingo 23 de marzo de 1997. Se invitó a los primeros diez hombres y mujeres voluntarios a una reunión con los consejeros genéticos del proyecto para la posterior extracción de sangre. Debido a la metodología de procesamiento de las muestras de ADN, aproximadamente el 80% del genoma de referencia provenía de 8 personas y un hombre, designado como RP11, que contribuyó con el 66% del total. El sistema de grupos sanguíneos ABO difieren entre humanos, pero el genoma de referencia humano solo contiene el alelo O, aunque los otros están anotados. [7][8][9][10][11]​ En 1999, se logró secuenciar y ensamblar la secuencia del cromosoma 22[12]​ y en 2001, se publicaron los resultados iniciales del primer ensamblado de referencia para el genoma humano.[13]

Evolución en el tiempo del coste aproximado de la secuenciación de un genoma humano (Periodo 2001 - 2021)

Conforme el coste de las tecnología de secuenciación del ADN ha descendido y han surgido otras nuevas para la secuenciación de genoma completo, el número de genomas secuenciado ha aumentado. En muchos casos, personas como James D. Watson, secuenciaron su genoma mediante el método de secuenciación masiva en paralelo (massive parallel sequencing, en inglés). [14][15]​ La comparativa entre la versión de referencia (versión NCBI36/hg18) y el genoma de Watson reveló diferencias en 3,3 millones de polimorfismos de un nucleótido único, mientras que aproximadamente el 1,4 % de su ADN no se podía alinear contra ninguna región del genoma de referencia. [11][14]​ En las regiones de un genoma donde se sabe que existe variabilidad a gran escala en la secuencia, una serie de loci alternativos se ensamblan a lo largo del locus de referencia.

La última versión de referencia publicada por el Consorcio de Referencia del Genoma fue GRCh38 en 2017.[16]​ Esta solo contiene 120 huecos en todo el genoma, lo que supuso un avance importante respecto a versiones anteriores; la primera versión tenía aproximadamente 150 000 huecos. [8]​ El número de bibliotecas genómicas que contribuyen al genoma de referencia ha aumentado de manera constante a lo largo de los años hasta más de 60. Sin embargo, el individuo RP11 sigue suponiendo el 70% del genoma de referencia. [1]​ Los análisis genómicos de este hombre anónimo sugieren que es de ascendencia afroeuropea. [1]​ En 2022, el Consorcio Telomere-to-Telomere (T2T)[17]​ publicó la primera versión del genoma humano totalmente completo (versión T2T-CHM13), sin huecos en el ensamblado de las secuencias.[18][19]​ Por otra parte, según el sitio web oficial del GRC, el lanzamiento de la siguiente versión del genoma de referencia humano (versión GRCh39) se encuentra actualmente indefinidamente pospuesto.[20]

Recientes versiones del genoma de referencia humano: [21]

Versión Fecha de publicación Equivalente versión UCSC
GRCh39 Pospuesto indefinidamente[20] -
T2T-CHM13 Enero 2022 -
GRCh38 Diciembre 2013 hg38
GRCh37 Febrero 2009 hg19
NCBI36.1 Marzo 2006 hg18
NCBI35 Mayo 2004 hg17
NCBI34 Julio 2003 hg16

Limitaciones

La versión de referencia proporciona una buena aproximación a una gran parte del genoma de un individuo. Sin embargo, en regiones con una alta diversidad alélica, como en el caso del Complejo Mayor de Histocompatibilidad (CMH) en los humanos o las proteínas urinarias mayores de los ratones, el genoma de referencia puede diferir significativamente entre diferentes individuos.[22][23][24]​ Debido al hecho de que el genoma de referencia se trata de una sola secuencia de ADN, lo cual le aporta su utilidad como índice o marcador de las características genómicas, esto implica limitaciones en términos de en qué grado representa fielmente el genoma humano y su variabilidad. Por otra parte, la mayoría de las muestras obtenidas para la secuenciación del genoma de referencia pertenecen a individuos de ascendencia europea, siendo estas poblaciones las mejor caracterizadas y estudiadas en detrimento de poblaciones no europeas. En 2010, se comprobó, mediante un ensamblado de novo de genomas extraídos de poblaciones africanas y asiáticas con el genoma de referencia del NCBI (versión NCBI36.3), que estos genomas tenían aproximadamente 5 Mb de secuencias que no alineaban contra ninguna región del genoma de referencia.[25]

Proyectos posteriores al Proyecto Genoma Humano buscan abordar una caracterización más profunda y diversa de la variabilidad genética humana, que el genoma de referencia no es capaz de representar. El Proyecto HapMap, en activo durante el periodo 2002 - 2010, con el propósito de crear un mapa de haplotipos y sus variaciones más comunes entre diferentes poblaciones humanas. Se estudiaron hasta 11 poblaciones de diferente ascendencia, por ejemplo, individuos de etnia Han de China, guyaratís de la India, del pueblo yoruba de Nigeria o japoneses, entre otros.[26][27][28][29]​ El Proyecto 1000 Genomas, llevado a cabo en el periodo 2008 - 2015, con el objetivo de crear una base de datos que comprenda más del 95 % de las variaciones presentes en el genoma humano y cuyos resultados puedan ser utilizados en estudios de asociación con enfermedades como diabetes, enfermedades cardiovasculares o autoinmunes. Un total de 26 grupos étnicos diferentes fueron estudiados en este proyecto, ampliando el alcance del proyecto HapMap a nuevos grupos étnicos como el pueblo mendé de Sierra Leona, el pueblo vietnamita o el pueblo bengalí.[30][31][32][33]​ El Proyecto del Pangenoma Humano, el cual entró en su fase inicial en 2019 con la creación del Consorcio de Referencia del Pangenoma Humano, busca crear el mayor mapa de la variabilidad genética humana, tomando como punto de partida los resultados ya obtenidos en proyectos anteriores.[34][35]

Genoma de referencia murino

Recientes versiones del genoma de referencia de ratón: [21]

Versión Fecha de publicación Equivalente versión UCSC
GRCm39 Junio 2020 mm39
GRCm38 Diciembre 2011 mm10
NCBI37 Julio 2007 mm9
NCBI36 Febrero 2006 mm8
NCBI35 Agosto 2005 mm7
NCBI34 Marzo 2005 mm6

Otros genomas

Desde la finalización del Proyecto Genoma Humano, han surgido múltiples proyectos a escala internacional centrados en generar genomas de referencia para multitud de organismos, tanto organismos modelo (ej.: pez cebra (Danio rerio), pollo (Gallus gallus), Escherichia coli etc.) como otros organismos de interés para la comunidad científica, por ejemplo, especies en peligro de extinción (ej.: arowana asiática (Scleropages formosus) o el bisonte americano (Bison bison)). A fecha de agosto de 2022, de acuerdo con la base de datos del NCBI, hay registrados 71 886 genomas parcial o completa secuenciados y ensamblados de diferentes especies, entre los que se encuentran 676 mamíferos, 590 aves y 865 peces. También son destacables las cifras de 1796 genomas de insectos, 3747 hongos, 1025 plantas, 33 724 bacterias, 26 004 virus y 2040 arqueas.[36]​ Muchas de estas especies tienen anotación genómica asociada a sus genomas de referencia, que puede ser consultada y visualizada públicamente en navegadores genómicos como los de Ensembl y el UCSC Genome Browser.[37][38]

Algunos ejemplos de estos proyectos son: el Proyecto Genoma del Chimpancé, llevado a cabo en el periodo 2005 - 2013 conjuntamente por el Instituto Broad el Instituto del Genoma McDonnell de la Universidad de Washington en San Luis y que generó los primeros genomas de referencia para 4 subespecies de Pan troglodytes;[39][40]​ el Proyecto 100K Genomas de Patógenos, iniciado en 2012 con el objetivo de generar una base de datos de genomas de referencia para 100 000 microorganismos patógenos para su uso en la salud pública, detección de brotes infecciosos, agricultura y medioambiente;[41]​ el Proyecto Earth BioGenome, iniciado en 2018 y que pretende secuenciar y catalogar los genomas de todos los organismos eucariotas de la Tierra para promover proyectos de conservación de la biodiversidad, en conjunto con 50 proyectos afiliados de menor escala como el Proyecto Africa BioGenome o el Proyecto 1000 Genomas de hongos.[42][43][44]

Referencias

  1. a b c «How many individuals were sequenced for the human reference genome assembly?». NCBI. Consultado el 18 de julio de 2022. 
  2. Flicek, P.; Aken, B. L.; Beal, K.; Ballester, B.; Caccamo, M.; Chen, Y.; Clarke, L.; Coates, G. et al. (2008-01). «Ensembl 2008». Nucleic Acids Research 36 (Database issue): D707-714. ISSN 1362-4962. PMC 2238821. PMID 18000006. doi:10.1093/nar/gkm988. Consultado el 18 de julio de 2022. 
  3. «Help - Glossary - Homo_sapiens - Ensembl genome browser 107». www.ensembl.org. Consultado el 18 de julio de 2022. 
  4. «Golden path length | VectorBase». web.archive.org. 7 de agosto de 2020. Consultado el 18 de julio de 2022. 
  5. «Help - Glossary - Homo_sapiens - Ensembl genome browser 107». www.ensembl.org. Consultado el 18 de julio de 2022. 
  6. «Whole assembly vs Golden path length in Ensembl?». SEQanswers (en inglés). Consultado el 18 de julio de 2022. 
  7. Scherer, Stewart (2008). A short guide to the human genome. CSHL Press. p. 135. ISBN 978-0-87969-791-4. 
  8. a b «E pluribus unum». Nature Methods (en inglés) 7 (5): 331-331. 2010-05. ISSN 1548-7105. doi:10.1038/nmeth0510-331. Consultado el 18 de julio de 2022. 
  9. Ballouz, Sara; Dobin, Alexander; Gillis, Jesse A. (9 de agosto de 2019). «Is it time to change the reference genome?». Genome Biology 20 (1): 159. ISSN 1474-760X. PMC 6688217. PMID 31399121. doi:10.1186/s13059-019-1774-4. Consultado el 18 de julio de 2022. 
  10. Rosenfeld, Jeffrey A.; Mason, Christopher E.; Smith, Todd M. (2012). «Limitations of the human reference genome for personalized genomics». PloS One 7 (7): e40294. ISSN 1932-6203. PMC 3394790. PMID 22811759. doi:10.1371/journal.pone.0040294. Consultado el 18 de julio de 2022. 
  11. a b Wade, Nicholas (31 de mayo de 2007). «Genome of DNA Pioneer Is Deciphered». The New York Times (en inglés estadounidense). ISSN 0362-4331. Consultado el 18 de julio de 2022. 
  12. Dunham, I.; Hunt, A. R.; Collins, J. E.; Bruskiewich, R.; Beare, D. M.; Clamp, M.; Smink, L. J.; Ainscough, R. et al. (1999-12). «The DNA sequence of human chromosome 22». Nature (en inglés) 402 (6761): 489-495. ISSN 1476-4687. doi:10.1038/990031. Consultado el 17 de agosto de 2022. 
  13. Lander, Eric S.; Linton, Lauren M.; Birren, Bruce; Nusbaum, Chad; Zody, Michael C.; Baldwin, Jennifer; Devon, Keri; Dewar, Ken et al. (2001-02). «Initial sequencing and analysis of the human genome». Nature (en inglés) 409 (6822): 860-921. ISSN 1476-4687. doi:10.1038/35057062. Consultado el 17 de agosto de 2022. 
  14. a b Wheeler, David A.; Srinivasan, Maithreyan; Egholm, Michael; Shen, Yufeng; Chen, Lei; McGuire, Amy; He, Wen; Chen, Yi-Ju et al. (2008-04). «The complete genome of an individual by massively parallel DNA sequencing». Nature (en inglés) 452 (7189): 872-876. ISSN 1476-4687. doi:10.1038/nature06884. Consultado el 18 de julio de 2022. 
  15. Una excepción a esto es J. Craig Venter, cuyo ADN fue secuenciado y ensamblado mediante métodos de secuenciación de escopeta o "shot gun sequencing"
  16. Schneider, Valerie A.; Graves-Lindsay, Tina; Howe, Kerstin; Bouk, Nathan; Chen, Hsiu-Chuan; Kitts, Paul A.; Murphy, Terence D.; Pruitt, Kim D. et al. (May 2017). «Evaluation of GRCh38 and de novo haploid genome assemblies demonstrates the enduring quality of the reference assembly». Genome Research (en inglés) 27 (5): 849-864. ISSN 1549-5469. PMC 5411779. PMID 28396521. doi:10.1101/gr.213611.116. Consultado el 16 de agosto de 2022. 
  17. «Telomere-to-Telomere». Instituto Nacional de Investigación del Genoma Humano (Estados Unidos) (NHGRI) (en inglés). Consultado el 16 de agosto de 2022. 
  18. Nurk, Sergey; Koren, Sergey; Rhie, Arang; Rautiainen, Mikko; Bzikadze, Andrey V.; Mikheenko, Alla; Vollger, Mitchell R.; Altemose, Nicolas et al. (2022-04). «The complete sequence of a human genome». Science (en inglés) 376 (6588): 44-53. ISSN 0036-8075. PMC 9186530. PMID 35357919. doi:10.1126/science.abj6987. Consultado el 18 de julio de 2022. 
  19. «T2T-CHM13v2.0 - Genome - Assembly - NCBI». www.ncbi.nlm.nih.gov. Consultado el 16 de agosto de 2022. 
  20. a b «Genome Reference Consortium». www.ncbi.nlm.nih.gov. Consultado el 17 de agosto de 2022. 
  21. a b «Genome Browser FAQ». genome.ucsc.edu. Consultado el 18 de julio de 2022. 
  22. The MHC sequencing consortium (1999-10). «Complete sequence and gene map of a human major histocompatibility complex». Nature (en inglés) 401 (6756): 921-923. ISSN 1476-4687. doi:10.1038/44853. Consultado el 18 de julio de 2022. 
  23. Logan, Darren W.; Marton, Tobias F.; Stowers, Lisa (25 de septiembre de 2008). «Species Specificity in Major Urinary Proteins by Parallel Evolution». PLOS ONE (en inglés) 3 (9): e3280. ISSN 1932-6203. PMC 2533699. PMID 18815613. doi:10.1371/journal.pone.0003280. Consultado el 18 de julio de 2022. 
  24. Hurst J, Beynon RJ, Roberts SC, Wyatt TD (October 2007). Urinary Lipocalins in Rodenta:is there a Generic Model?. Chemical Signals in Vertebrates 11. Springer New York. ISBN 978-0-387-73944-1. 
  25. Li, Ruiqiang; Li, Yingrui; Zheng, Hancheng; Luo, Ruibang; Zhu, Hongmei; Li, Qibin; Qian, Wubin; Ren, Yuanyuan et al. (2010-01). «Building the sequence map of the human pan-genome». Nature Biotechnology (en inglés) 28 (1): 57-63. ISSN 1546-1696. doi:10.1038/nbt.1596. Consultado el 17 de agosto de 2022. 
  26. International HapMap Consortium (27 de octubre de 2005). «A haplotype map of the human genome». Nature 437 (7063): 1299-1320. ISSN 1476-4687. PMC 1880871. PMID 16255080. doi:10.1038/nature04226. Consultado el 17 de agosto de 2022. 
  27. International HapMap Consortium; Frazer, Kelly A.; Ballinger, Dennis G.; Cox, David R.; Hinds, David A.; Stuve, Laura L.; Gibbs, Richard A.; Belmont, John W. et al. (18 de octubre de 2007). «A second generation human haplotype map of over 3.1 million SNPs». Nature 449 (7164): 851-861. ISSN 1476-4687. PMC 2689609. PMID 17943122. doi:10.1038/nature06258. Consultado el 17 de agosto de 2022. 
  28. International HapMap 3 Consortium; Altshuler, David M.; Gibbs, Richard A.; Peltonen, Leena; Altshuler, David M.; Gibbs, Richard A.; Peltonen, Leena; Dermitzakis, Emmanouil et al. (2 de septiembre de 2010). «Integrating common and rare genetic variation in diverse human populations». Nature 467 (7311): 52-58. ISSN 1476-4687. PMC 3173859. PMID 20811451. doi:10.1038/nature09298. Consultado el 17 de agosto de 2022. 
  29. «Acerca Del Proyecto Internacional Hapmap». Genome.gov (en inglés). Consultado el 17 de agosto de 2022. 
  30. 1000 Genomes Project Consortium; Abecasis, Gonçalo R.; Altshuler, David; Auton, Adam; Brooks, Lisa D.; Durbin, Richard M.; Gibbs, Richard A.; Hurles, Matt E. et al. (28 de octubre de 2010). «A map of human genome variation from population-scale sequencing». Nature 467 (7319): 1061-1073. ISSN 1476-4687. PMC 3042601. PMID 20981092. doi:10.1038/nature09534. Consultado el 17 de agosto de 2022. 
  31. 1000 Genomes Project Consortium; Abecasis, Goncalo R.; Auton, Adam; Brooks, Lisa D.; DePristo, Mark A.; Durbin, Richard M.; Handsaker, Robert E.; Kang, Hyun Min et al. (1 de noviembre de 2012). «An integrated map of genetic variation from 1,092 human genomes». Nature 491 (7422): 56-65. ISSN 1476-4687. PMC 3498066. PMID 23128226. doi:10.1038/nature11632. Consultado el 17 de agosto de 2022. 
  32. 1000 Genomes Project Consortium; Auton, Adam; Brooks, Lisa D.; Durbin, Richard M.; Garrison, Erik P.; Kang, Hyun Min; Korbel, Jan O.; Marchini, Jonathan L. et al. (1 de octubre de 2015). «A global reference for human genetic variation». Nature 526 (7571): 68-74. ISSN 1476-4687. PMC 4750478. PMID 26432245. doi:10.1038/nature15393. Consultado el 17 de agosto de 2022. 
  33. Sudmant, Peter H.; Rausch, Tobias; Gardner, Eugene J.; Handsaker, Robert E.; Abyzov, Alexej; Huddleston, John; Zhang, Yan; Ye, Kai et al. (1 de octubre de 2015). «An integrated map of structural variation in 2,504 human genomes». Nature 526 (7571): 75-81. ISSN 1476-4687. PMC 4617611. PMID 26432246. doi:10.1038/nature15394. Consultado el 17 de agosto de 2022. 
  34. Miga, Karen H.; Wang, Ting (31 de agosto de 2021). «The Need for a Human Pangenome Reference Sequence». Annual Review of Genomics and Human Genetics (en inglés) 22 (1): 81-102. ISSN 1527-8204. PMC 8410644. PMID 33929893. doi:10.1146/annurev-genom-120120-081921. Consultado el 17 de agosto de 2022. 
  35. Wang, Ting; Antonacci-Fulton, Lucinda; Howe, Kerstin; Lawson, Heather A.; Lucas, Julian K.; Phillippy, Adam M.; Popejoy, Alice B.; Asri, Mobin et al. (2022-04). «The Human Pangenome Project: a global resource to map genomic diversity». Nature (en inglés) 604 (7906): 437-446. ISSN 1476-4687. doi:10.1038/s41586-022-04601-8. Consultado el 17 de agosto de 2022. 
  36. «Genome List - Genome - NCBI». www.ncbi.nlm.nih.gov. Consultado el 16 de agosto de 2022. 
  37. «Species List». uswest.ensembl.org. Consultado el 17 de agosto de 2022. 
  38. «GenArk: UCSC Genome Archive». hgdownload.soe.ucsc.edu. Consultado el 17 de agosto de 2022. 
  39. «Chimpanzee Genome Project». BCM-HGSC (en inglés). 4 de marzo de 2016. Consultado el 17 de agosto de 2022. 
  40. Prado-Martinez, Javier; Sudmant, Peter H.; Kidd, Jeffrey M.; Li, Heng; Kelley, Joanna L.; Lorente-Galdos, Belen; Veeramah, Krishna R.; Woerner, August E. et al. (25 de julio de 2013). «Great ape genetic diversity and population history». Nature 499 (7459): 471-475. ISSN 1476-4687. PMC 3822165. PMID 23823723. doi:10.1038/nature12228. Consultado el 17 de agosto de 2022. 
  41. «100K Pathogen Genome Project – Genomes for Public Health & Food Safety» (en inglés estadounidense). Consultado el 17 de agosto de 2022. 
  42. Lewin, Harris A.; Robinson, Gene E.; Kress, W. John; Baker, William J.; Coddington, Jonathan; Crandall, Keith A.; Durbin, Richard; Edwards, Scott V. et al. (24 de abril de 2018). «Earth BioGenome Project: Sequencing life for the future of life». Proceedings of the National Academy of Sciences of the United States of America 115 (17): 4325-4333. ISSN 1091-6490. PMC 5924910. PMID 29686065. doi:10.1073/pnas.1720115115. Consultado el 17 de agosto de 2022. 
  43. «African BioGenome Project – Genomics in the service of conservation and improvement of African biological diversity» (en inglés estadounidense). Consultado el 17 de agosto de 2022. 
  44. «1000 Fungal Genomes Project». mycocosm.jgi.doe.gov. Consultado el 17 de agosto de 2022.