Genoma de referencia

De Wikipedia, la enciclopedia libre
El primer genoma de referencia humano impreso en una serie de libros, expuesto en el museo Wellcome Collection (Londres).

Un genoma de referencia (o versión de referencia de un genoma) es una base de datos digital de secuencias de ácidos nucleicos, creado por científicos como ejemplo representativo del conjunto de genes de un organismo idealizado de una especie. Al ser resultado de un ensamblado de la secuenciación del ADN a partir de un número determinado de donantes, los genomas de referencia no representan con total exactitud el genoma de un organismo individual. En su lugar, un genoma de referencia representa un mosaico haploide de diferentes secuencias de ADN de cada donante. Por ejemplo, la versión de referencia más reciente para el genoma humano (versión GRCh38/hg38) proviene de >60 bibliotecas genómicas.[1]​ Existen genomas de referencia para múltiples especies de virus, bacterias, hongos, plantas y animales. Los genomas de referencia sirven como guía a partir de la cual se construyen los nuevos, permitiendo que estos se ensamblen de manera mucho más barata y rápida que en el primer Proyecto Genoma Humano. Es posible acceder a genomas de referencia a través de diferentes buscadores como Ensembl o UCSC Genome Browser.[2]

Propiedades[editar]

Medida de la longitud[editar]

La longitud de un genoma puede ser medida de múltiples maneras.

Una manera sencilla de medir la longitud de un genoma es contar el número de pares de bases.[3]

Se denomina golden path a una medida de longitud alternativa que omite las regiones redundantes, tales como los haplotipos y las regiones pseudoautosómicas.[4][5]​ Se suele combinar toda la información del ensamblado del genoma al superponer la información de la secuenciación sobre un mapa físico del genoma. Esta unidad de medida supone una mejor estimación del aspecto real del genoma, incluyendo los huecos redundantes y siendo un mapa más extenso que el típico ensamblado.[6]

Cóntigos y scaffolds[editar]

Diagrama de la disposición de las lecturas, que forman cóntigos, y estos a su vez pueden ensamblarse en scaffolds en el proceso completo de secuenciación y ensamblado de un genoma de referencia. En esta imagen, se indica secuenciado el hueco entre los cóntigos 1 y 2, conformando un scaffold, mientras que el otro hueco no se ha secuenciado y separa los scaffolds 1 y 2.

El ensamblado de un genoma de referencia requiere el solapamiento de las lecturas, las cuales se alinean formando cóntigos, regiones contiguas de secuencias consenso.[7]​ Si existen huecos entre cóntigos, estos pueden ser completados creando scaffolds (en inglés, andamios), mediante una amplificación de los cóntigos por PCR y posterior secuenciación o mediante clonación de cromosomas artificiales bacterianos (BAC).[8][7]​ Sin embargo, esto no siempre es posible, existiendo múltiples scaffolds en un genoma de referencia.[9]​ Los scaffolds se pueden clasificar en tres tipos: 1) Posicionados, de los cuales se conoce el cromosoma en el que se encuentran, coordenadas dentro de este y orientación; 2) No localizados, de los que solo se conoce el cromosoma, pero no las coordenadas ni la orientación; 3) No posicionados, cuyo cromosoma tampoco se conoce.[10]

El número de cóntigos y de scaffolds, así como sus longitudes medias son parámetros relevantes, junto con muchos otros parámetros, para la evaluación de la calidad de un genoma de referencia ya que informan sobre la continuidad del mapeado final a partir del genoma original. Cuanto menor sea el número de scaffolds por cromosoma hasta que uno solo ocupe un cromosoma entero, mayor será la continuidad del ensamblado.[11][12][13]​ Otros parámetros relacionados son N50 y L50. El primero se define como la longitud de los cóntigos/scaffolds en la que el 50% del ensamblado se encuentra en fragmentos de esta longitud o mayor, mientras que el segundo es el número de cóntigo/scaffold cuya longitud es N50. Cuanto mayor sea el valor de N50, menor será el de L50, y viceversa, informando de una alta continuidad en el ensamblado.[14][15][16]

Genomas de mamíferos[editar]

Los genomas de referencia humanos y murinos son continuamente mejorados por el Consorcio de Referencia del Genoma (GRC), un grupo de 20 investigadores de diferentes institutos de investigación, incluyendo el Instituto Europeo de Bioinformática, el NCBI, el Sanger Institute y el McDonnell Genome Institute de la Universidad de Washington en San Luis (EE.UU.). El GRC continua mejorando los genomas de referencia, reduciendo los huecos y las regiones infrarrepresentadas en la secuencia de los genomas de referencia.

Genoma de referencia humano[editar]

El primer genoma de referencia humano se extrajo de 13 voluntarios anónimos de Búfalo, Nueva York, los cuales fueron reclutados el domingo 23 de marzo de 1997. Se invitó a los primeros diez hombres y mujeres voluntarios a una reunión con los consejeros genéticos del proyecto para la posterior extracción de sangre. Debido a la metodología de procesamiento de las muestras de ADN, aproximadamente el 80% del genoma de referencia provenía de 8 personas y un hombre, designado como RP11, que contribuyó con el 66% del total. El sistema de grupos sanguíneos ABO difieren entre humanos, pero el genoma de referencia humano solo contiene el alelo O, aunque los otros están anotados.[17][18][19][20][21]​ En 1999, se logró secuenciar y ensamblar la secuencia del cromosoma 22[22]​ y en 2001, se publicaron los resultados iniciales del primer ensamblado de referencia para el genoma humano.[23]

Evolución en el tiempo del coste aproximado de la secuenciación de un genoma humano (Periodo 2001 - 2021)

Conforme el coste de las tecnología de secuenciación del ADN ha descendido y han surgido otras nuevas para la secuenciación de genoma completo, el número de genomas secuenciado ha aumentado. En muchos casos, personas como James D. Watson, secuenciaron su genoma mediante el método de secuenciación masiva en paralelo (massive parallel sequencing, en inglés).[24][25]​ La comparativa entre la versión de referencia (versión NCBI36/hg18) y el genoma de Watson reveló diferencias en 3,3 millones de polimorfismos de un nucleótido único, mientras que aproximadamente el 1,4 % de su ADN no se podía alinear contra ninguna región del genoma de referencia.[21][24]​ En las regiones de un genoma donde se sabe que existe variabilidad a gran escala en la secuencia, una serie de loci alternativos se ensamblan a lo largo del locus de referencia.

Ideograma de los cromosomas del genoma de referencia humano (versión GRCh38/hg38). Los patrones característicos de bandas se muestran de color negro, gris y blanco, mientras que los huecos y regiones parcialmente ensambladas se encuentran en color azul y rosa, respectivamente. Referencia: Genome Data Viewer de la base de datos NCBI[26]

La última versión del genoma de referencia humano, publicada por el Consorcio de Referencia del Genoma, fue GRCh38 en 2017.[27]​ Esta versión ha recibido varios parches para actualizarla, siendo el último parche GRCh38.p14, publicada en marzo de 2022.[28][29]​ Esta solo contiene 349 huecos en todo el genoma, lo que supuso un avance importante respecto a la primera versión, la cual tenía aproximadamente 150 000 huecos.[18]​ Esta versión presenta huecos principalmente en regiones correspondientes a telómeros, centrómeros y secuencias largas y repetitivas, estando el mayor hueco situado a lo largo del brazo largo del cromosoma Y, una región de aproximadamente 30 Mb de longitud (~52% de la longitud total del cromosoma Y).[30]
El número de bibliotecas genómicas que contribuyen al genoma de referencia ha aumentado de manera constante a lo largo de los años hasta más de 60. Sin embargo, el individuo RP11 sigue suponiendo el 70% del genoma de referencia.[1]​ Los análisis genómicos de este hombre anónimo sugieren que es de ascendencia afroeuropea.[1]​ En 2022, el Consorcio Telomere-to-Telomere (T2T)[31]​ publicó la primera versión del genoma humano totalmente completo (versión T2T-CHM13), sin huecos en el ensamblado de las secuencias.[32][33]​ Por otra parte, según el sitio web oficial del GRC, el lanzamiento de la siguiente versión del genoma de referencia humano (versión GRCh39) se encuentra actualmente "indefinidamente pospuesto".[34]

Recientes versiones del genoma de referencia humano:[35]

Versión Fecha de publicación Versión equivalente de UCSC
GRCh39 Pospuesto indefinidamente[34] -
T2T-CHM13 Enero 2022 -
GRCh38 Diciembre 2013 hg38
GRCh37 Febrero 2009 hg19
NCBI36.1 Marzo 2006 hg18
NCBI35 Mayo 2004 hg17
NCBI34 Julio 2003 hg16

Versión T2T-CHM13[editar]

El genoma T2T-CHM13 presenta un aumento de 225Mpb comparado con otras versiones de genoma de referencia humano, como es el caso de GRCh38.  Gracias a ello, se ha permitido reconocer genes, funciones, perfiles de metilación, entre otros. Como nuevos avances que ha generado el genoma T2T-CHM13, tenemos lo siguiente casos:

T2T-CHM13 y su relación con loci relevantes para enfermedades[editar]
Ideograma de picos únicos de T2T-CHM13 encontrados en ENCODE, de cromosomas 5,6,15,16,17 y 19 para genes relacionadas con enfermedades de interés. Autor: León, R Modificado de Gershman et al, 2022 [36]​ Realizado en: Biorender

Gracias al aumento de lecturas genómicas dadas por T2T-CHM13, actualmente se conoce la relación que tiene ciertos genes previamente desconocidos y cual es su efecto en enfermedades de interés. Un ejemplo de esto es LINC0666, un gen relacionado con el cáncer gástrico,[37]​ FRG1 relacionada con la distrofia muscular facioescapulohumeral[38]​, BOLBA2B con el autismo [39]​o HLA un gen previamente no reconocido el cual está relacionado con enfermedades de inmunidad hasta enfermedades neurodegenerativas.[cita requerida]

Uso de lectura larga en T2T-CHM13 para derivar regiones de metilación[editar]

El uso de lecturas largas para este nuevo genoma de referencia ha permitido estudiar hasta un 10% (3,18M) de regiones CpG. Un ejemplo practico es el estudio de líneas celulares como CHM13 y HG002 en donde se establece alta correlación con datos de secuenciación de bisulfito y se identificaron regiones altamente no mapeables en ADN repetitivo, lo que previamente no era posible. [40][36]​ Estos perfiles de metilación amplían el campo epigenético ya que permite comprender estados de metilación y su funcionalidad en distintas etapas como es el caso de CHM13 que gracias a los nuevos perfiles de metilación se conocen que están estrechamente relacionadas con embriones en etapa de escisión y blastocisto, así como con tejido de trofectodermo.[36]

Regulación epigenética para la compresión de genes parálogos.[editar]

Bajo el estudio de T2T-CHM13 se destaca el caso de la familia de genes NBPF, relacionada con la expansión cortical humana. El uso de la nueva línea celular permite identificar y ampliar nuevos elementos reguladores asociados a estos genes. Un ejemplo de esto es el descubrimiento de NBPF26 y NBPF10, copias de genes que son parálogos dentro del gen NBPF.[41]​ Estas copias presentan cambios epigenéticos pasando de marcas activas en tejido cerebral a marcas represivas en neuroblastoma.

Estudio de moléculas individuales y sus patrones de metilación[editar]

La incorporación de T2T-CHM13, permite comprender patrones de metilación de moléculas individuales. Un ejemplo de esto es el estudio del cromosoma X femenino de la nueva línea celular. El cromosoma X femenino se encuentra en distintos estados de hipometilación o hipermetilación. Se encuentran relacionados con la activación (XCa) o inactivación (XCi) de uno de los pares de cromosomas X. Al momento de sufrir estos cambios de metilación para obtener XCi, la línea T2T-CHM13 permite no solo observar todos los patrones de metilación, también permite agruparlas por sus distintos estados de metilación. Dicha información es relevante ya que se puede estudiar enfermedades relacionadas con la desregularización de los satélites.[36]

Limitaciones[editar]

La versión de referencia proporciona una buena aproximación a una gran parte del genoma de un individuo. Sin embargo, en regiones con una alta diversidad alélica, como en el caso del Complejo Mayor de Histocompatibilidad (CMH) en los humanos o las proteínas urinarias mayores de los ratones, el genoma de referencia puede diferir significativamente entre diferentes individuos.[42][43][44]​ Debido al hecho de que el genoma de referencia se trata de una sola secuencia de ADN, lo cual le aporta su utilidad como índice o marcador de las características genómicas, esto implica limitaciones en términos de en qué grado representa fielmente el genoma humano y su variabilidad. Por otra parte, la mayoría de las muestras obtenidas para la secuenciación del genoma de referencia pertenecen a individuos de ascendencia europea, siendo estas poblaciones las mejor caracterizadas y estudiadas en detrimento de poblaciones no europeas. En 2010, se comprobó, mediante un ensamblado de novo de genomas extraídos de poblaciones africanas y asiáticas con el genoma de referencia del NCBI (versión NCBI36.3), que estos genomas tenían aproximadamente 5 Mb de secuencias que no alineaban contra ninguna región del genoma de referencia.[45]

Proyectos posteriores al Proyecto Genoma Humano buscan abordar una caracterización más profunda y diversa de la variabilidad genética humana, que el genoma de referencia no es capaz de representar. El Proyecto HapMap, en activo durante el periodo 2002 - 2010, con el propósito de crear un mapa de haplotipos y sus variaciones más comunes entre diferentes poblaciones humanas. Se estudiaron hasta 11 poblaciones de diferente ascendencia, por ejemplo, individuos de etnia Han de China, guyaratís de la India, del pueblo yoruba de Nigeria o japoneses, entre otros.[46][47][48][49]​ El Proyecto 1000 Genomas, llevado a cabo en el periodo 2008 - 2015, con el objetivo de crear una base de datos que comprenda más del 95 % de las variaciones presentes en el genoma humano y cuyos resultados puedan ser utilizados en estudios de asociación con enfermedades (GWAS) como diabetes, enfermedades cardiovasculares o autoinmunes. Un total de 26 grupos étnicos diferentes fueron estudiados en este proyecto, ampliando el alcance del proyecto HapMap a nuevos grupos étnicos como el pueblo mendé de Sierra Leona, el pueblo vietnamita o el pueblo bengalí.[50][51][52][53]​ El Proyecto del Pangenoma Humano, el cual entró en su fase inicial en 2019 con la creación del Consorcio de Referencia del Pangenoma Humano, busca crear el mayor mapa de la variabilidad genética humana, tomando como punto de partida los resultados ya obtenidos en proyectos anteriores.[54][55]

Genoma de referencia murino[editar]

Recientes versiones del genoma de referencia de ratón:[35]

Versión Fecha de publicación Equivalente versión UCSC
GRCm39 Junio 2020 mm39
GRCm38 Diciembre 2011 mm10
NCBI37 Julio 2007 mm9
NCBI36 Febrero 2006 mm8
NCBI35 Agosto 2005 mm7
NCBI34 Marzo 2005 mm6

Otros genomas[editar]

Desde la finalización del Proyecto Genoma Humano, han surgido múltiples proyectos a escala internacional centrados en generar genomas de referencia para multitud de organismos, tanto organismos modelo (ej.: pez cebra (Danio rerio), pollo (Gallus gallus), Escherichia coli etc.) como otros organismos de interés para la comunidad científica, por ejemplo, especies en peligro de extinción (ej.: arowana asiática (Scleropages formosus) o el bisonte americano (Bison bison)). A fecha de agosto de 2022, de acuerdo con la base de datos del NCBI, hay registrados 71 886 genomas parcial o completa secuenciados y ensamblados de diferentes especies, entre los que se encuentran 676 mamíferos, 590 aves y 865 peces. También son destacables las cifras de 1796 genomas de insectos, 3747 hongos, 1025 plantas, 33 724 bacterias, 26 004 virus y 2040 arqueas.[56]​ Muchas de estas especies tienen anotación genómica asociada a sus genomas de referencia, que puede ser consultada y visualizada públicamente en navegadores genómicos como los de Ensembl y el UCSC Genome Browser.[57][58]

Algunos ejemplos de estos proyectos son: el Proyecto Genoma del Chimpancé, llevado a cabo en el periodo 2005 - 2013 conjuntamente por el Instituto Broad el Instituto del Genoma McDonnell de la Universidad de Washington en San Luis y que generó los primeros genomas de referencia para 4 subespecies de Pan troglodytes;[59][60]​ el Proyecto 100K Genomas de Patógenos, iniciado en 2012 con el objetivo de generar una base de datos de genomas de referencia para 100 000 microorganismos patógenos para su uso en la salud pública, detección de brotes infecciosos, agricultura y medioambiente;[61]​ el Proyecto Earth BioGenome, iniciado en 2018 y que pretende secuenciar y catalogar los genomas de todos los organismos eucariotas de la Tierra para promover proyectos de conservación de la biodiversidad, en conjunto con 50 proyectos afiliados de menor escala como el Proyecto Africa BioGenome o el Proyecto 1000 Genomas de hongos.[62][63][64]

Referencias[editar]

  1. a b c «How many individuals were sequenced for the human reference genome assembly?». NCBI. Consultado el 18 de julio de 2022. 
  2. Flicek, P.; Aken, B. L.; Beal, K.; Ballester, B.; Caccamo, M.; Chen, Y.; Clarke, L.; Coates, G. et al. (2008-01). «Ensembl 2008». Nucleic Acids Research 36 (Database issue): D707-714. ISSN 1362-4962. PMC 2238821. PMID 18000006. doi:10.1093/nar/gkm988. Consultado el 18 de julio de 2022. 
  3. «Help - Glossary - Homo_sapiens - Ensembl genome browser 107». www.ensembl.org. Consultado el 18 de julio de 2022. 
  4. «Golden path length | VectorBase». web.archive.org. 7 de agosto de 2020. Archivado desde el original el 7 de agosto de 2020. Consultado el 18 de julio de 2022. 
  5. «Help - Glossary - Homo_sapiens - Ensembl genome browser 107». www.ensembl.org. Consultado el 18 de julio de 2022. 
  6. «Whole assembly vs Golden path length in Ensembl?». SEQanswers (en inglés). Consultado el 18 de julio de 2022. 
  7. a b Gibson, Greg; Muse, Spencer V. (2009). A Primer of Genome Science (3rd edición). Sinauer Associates. p. 84. ISBN 978-0-878-93236-8. 
  8. «Help - Glossary - Homo_sapiens - Ensembl genome browser 107». www.ensembl.org. Consultado el 23 de septiembre de 2022. 
  9. Luo, Junwei; Wei, Yawei; Lyu, Mengna; Wu, Zhengjiang; Liu, Xiaoyan; Luo, Huimin; Yan, Chaokun (2 de septiembre de 2021). «A comprehensive review of scaffolding methods in genome assembly». Briefings in Bioinformatics 22 (5): bbab033. ISSN 1477-4054. PMID 33634311. doi:10.1093/bib/bbab033. Consultado el 23 de septiembre de 2022. 
  10. «Chromosomes, scaffolds and contigs». www.ensembl.org. Consultado el 23 de septiembre de 2022. 
  11. Meader, Stephen; Hillier, LaDeana W.; Locke, Devin; Ponting, Chris P.; Lunter, Gerton (2010-5). «Genome assembly quality: Assessment and improvement using the neutral indel model». Genome Research 20 (5): 675-684. ISSN 1088-9051. PMC 2860169. PMID 20305016. doi:10.1101/gr.096966.109. Consultado el 23 de septiembre de 2022. 
  12. Rice, Edward S.; Green, Richard E. (15 de febrero de 2019). «New Approaches for Genome Assembly and Scaffolding». Annual Review of Animal Biosciences (en inglés) 7 (1): 17-40. ISSN 2165-8102. doi:10.1146/annurev-animal-020518-115344. Consultado el 23 de septiembre de 2022. 
  13. Cao, Minh Duc; Nguyen, Son Hoang; Ganesamoorthy, Devika; Elliott, Alysha G.; Cooper, Matthew A.; Coin, Lachlan J. M. (20 de febrero de 2017). «Scaffolding and completing genome assemblies in real-time with nanopore sequencing». Nature Communications (en inglés) 8 (1): 14515. ISSN 2041-1723. doi:10.1038/ncomms14515. Consultado el 23 de septiembre de 2022. 
  14. Mende, Daniel R.; Waller, Alison S.; Sunagawa, Shinichi; Järvelin, Aino I.; Chan, Michelle M.; Arumugam, Manimozhiyan; Raes, Jeroen; Bork, Peer (23 de febrero de 2012). «Assessment of Metagenomic Assembly Using Simulated Next Generation Sequencing Data». PLoS ONE 7 (2): e31386. ISSN 1932-6203. PMC 3285633. PMID 22384016. doi:10.1371/journal.pone.0031386. Consultado el 23 de septiembre de 2022. 
  15. Alhakami, Hind; Mirebrahim, Hamid; Lonardi, Stefano (18 de mayo de 2017). «A comparative evaluation of genome assembly reconciliation tools». Genome Biology 18: 93. ISSN 1474-7596. PMC 5436433. PMID 28521789. doi:10.1186/s13059-017-1213-3. Consultado el 23 de septiembre de 2022. 
  16. Castro, Christina J.; Ng, Terry Fei Fan (1 de noviembre de 2017). «U50: A New Metric for Measuring Assembly Output Based on Non-Overlapping, Target-Specific Contigs». Journal of Computational Biology 24 (11): 1071-1080. PMC 5783553. PMID 28418726. doi:10.1089/cmb.2017.0013. Consultado el 23 de septiembre de 2022. 
  17. Scherer, Stewart (2008). A short guide to the human genome. CSHL Press. p. 135. ISBN 978-0-87969-791-4. 
  18. a b «E pluribus unum». Nature Methods (en inglés) 7 (5): 331-331. 2010-05. ISSN 1548-7105. doi:10.1038/nmeth0510-331. Consultado el 18 de julio de 2022. 
  19. Ballouz, Sara; Dobin, Alexander; Gillis, Jesse A. (9 de agosto de 2019). «Is it time to change the reference genome?». Genome Biology 20 (1): 159. ISSN 1474-760X. PMC 6688217. PMID 31399121. doi:10.1186/s13059-019-1774-4. Consultado el 18 de julio de 2022. 
  20. Rosenfeld, Jeffrey A.; Mason, Christopher E.; Smith, Todd M. (2012). «Limitations of the human reference genome for personalized genomics». PloS One 7 (7): e40294. ISSN 1932-6203. PMC 3394790. PMID 22811759. doi:10.1371/journal.pone.0040294. Consultado el 18 de julio de 2022. 
  21. a b Wade, Nicholas (31 de mayo de 2007). «Genome of DNA Pioneer Is Deciphered». The New York Times (en inglés estadounidense). ISSN 0362-4331. Consultado el 18 de julio de 2022. 
  22. Dunham, I.; Hunt, A. R.; Collins, J. E.; Bruskiewich, R.; Beare, D. M.; Clamp, M.; Smink, L. J.; Ainscough, R. et al. (1999-12). «The DNA sequence of human chromosome 22». Nature (en inglés) 402 (6761): 489-495. ISSN 1476-4687. doi:10.1038/990031. Consultado el 17 de agosto de 2022. 
  23. Lander, Eric S.; Linton, Lauren M.; Birren, Bruce; Nusbaum, Chad; Zody, Michael C.; Baldwin, Jennifer; Devon, Keri; Dewar, Ken et al. (2001-02). «Initial sequencing and analysis of the human genome». Nature (en inglés) 409 (6822): 860-921. ISSN 1476-4687. doi:10.1038/35057062. Consultado el 17 de agosto de 2022. 
  24. a b Wheeler, David A.; Srinivasan, Maithreyan; Egholm, Michael; Shen, Yufeng; Chen, Lei; McGuire, Amy; He, Wen; Chen, Yi-Ju et al. (2008-04). «The complete genome of an individual by massively parallel DNA sequencing». Nature (en inglés) 452 (7189): 872-876. ISSN 1476-4687. doi:10.1038/nature06884. Consultado el 18 de julio de 2022. 
  25. Una excepción a esto es J. Craig Venter, cuyo ADN fue secuenciado y ensamblado mediante métodos de secuenciación de escopeta o "shot gun sequencing"
  26. «Genome Data Viewer - NCBI». www.ncbi.nlm.nih.gov. Consultado el 18 de agosto de 2022. 
  27. Schneider, Valerie A.; Graves-Lindsay, Tina; Howe, Kerstin; Bouk, Nathan; Chen, Hsiu-Chuan; Kitts, Paul A.; Murphy, Terence D.; Pruitt, Kim D. et al. (May 2017). «Evaluation of GRCh38 and de novo haploid genome assemblies demonstrates the enduring quality of the reference assembly». Genome Research (en inglés) 27 (5): 849-864. ISSN 1549-5469. PMC 5411779. PMID 28396521. doi:10.1101/gr.213611.116. Consultado el 16 de agosto de 2022. 
  28. «GRCh38.p14 - hg38 - Genome - Assembly - NCBI». www.ncbi.nlm.nih.gov (en inglés). Consultado el 20 de agosto de 2022. 
  29. Grc (9 de mayo de 2022). «GenomeRef: GRCh38.p14 is now released!». GRC Blog (GenomeRef) (en inglés). Consultado el 20 de agosto de 2022. 
  30. «GRCh38.p14 - hg38 - Genome - Assembly - NCBI - Statistics Report». www.ncbi.nlm.nih.gov. Consultado el 18 de agosto de 2022. 
  31. «Telomere-to-Telomere». Instituto Nacional de Investigación del Genoma Humano (Estados Unidos) (NHGRI) (en inglés). Consultado el 16 de agosto de 2022. 
  32. Nurk, Sergey; Koren, Sergey; Rhie, Arang; Rautiainen, Mikko; Bzikadze, Andrey V.; Mikheenko, Allá; Vollger, Mitchell R.; Altemose, Nicolas et al. (2022-04). «The complete sequence of a human genome». Science (en inglés) 376 (6588): 44-53. ISSN 0036-8075. PMC 9186530. PMID 35357919. doi:10.1126/science.abj6987. Consultado el 18 de julio de 2022. 
  33. «T2T-CHM13v2.0 - Genome - Assembly - NCBI». www.ncbi.nlm.nih.gov. Consultado el 16 de agosto de 2022. 
  34. a b «Genome Reference Consortium». www.ncbi.nlm.nih.gov. Consultado el 17 de agosto de 2022. 
  35. a b «Genome Browser FAQ». genome.ucsc.edu. Consultado el 18 de julio de 2022. 
  36. a b c d Gershman, Ariel; Sauria, Michael E. G.; Guitart, Xavi; Vollger, Mitchell R.; Hook, Paul W.; Hoyt, Savannah J.; Jain, Miten; Shumate, Alaina et al. (2022-04). «Epigenetic patterns in a complete human genome». Science (en inglés) 376 (6588). ISSN 0036-8075. PMC 9170183. PMID 35357915. doi:10.1126/science.abj5089. Consultado el 29 de diciembre de 2023. 
  37. Chen, J.; Yuan, Z.-H.; Hou, X.-H.; Shi, M.-H.; Jiang, R. (2020-02). «LINC01116 promotes the proliferation and inhibits the apoptosis of gastric cancer cells». European Review for Medical and Pharmacological Sciences 24 (4): 1807-1814. ISSN 2284-0729. PMID 32141549. doi:10.26355/eurrev_202002_20358. Consultado el 24 de enero de 2024. 
  38. Gabellini, Davide; D'Antona, Giuseppe; Moggio, Maurizio; Prelle, Alessandro; Zecca, Chiara; Adami, Raffaella; Angeletti, Barbara; Ciscato, Patrizia et al. (23 de febrero de 2006). «Facioscapulohumeral muscular dystrophy in mice overexpressing FRG1». Nature 439 (7079): 973-977. ISSN 1476-4687. PMID 16341202. doi:10.1038/nature04422. Consultado el 24 de enero de 2024. 
  39. Giannuzzi, Giuliana; Schmidt, Paul J.; Porcu, Eleonora; Willemin, Gilles; Munson, Katherine M.; Nuttle, Xander; Earl, Rachel; Chrast, Jacqueline et al. (7 de noviembre de 2019). «The Human-Specific BOLA2 Duplication Modifies Iron Homeostasis and Anemia Predisposition in Chromosome 16p11.2 Autism Individuals». American Journal of Human Genetics 105 (5): 947-958. ISSN 1537-6605. PMC 6849090. PMID 31668704. doi:10.1016/j.ajhg.2019.09.023. Consultado el 24 de enero de 2024. 
  40. Karimzadeh, Mehran; Ernst, Carl; Kundaje, Anshul; Hoffman, Michael M. (16 de noviembre de 2018). «Umap and Bismap: quantifying genome and methylome mappability». Nucleic Acids Research 46 (20): e120. ISSN 1362-4962. PMC 6237805. PMID 30169659. doi:10.1093/nar/gky677. Consultado el 24 de enero de 2024. 
  41. Suzuki, Ikuo K.; Gacquer, David; Van Heurck, Roxane; Kumar, Devesh; Wojno, Marta; Bilheu, Angéline; Herpoel, Adèle; Lambert, Nelle et al. (31 de mayo de 2018). «Human-Specific NOTCH2NL Genes Expand Cortical Neurogenesis through Delta/Notch Regulation». Cell 173 (6): 1370-1384.e16. ISSN 1097-4172. PMC 6092419. PMID 29856955. doi:10.1016/j.cell.2018.03.067. Consultado el 24 de enero de 2024. 
  42. The MHC sequencing consortium (1999-10). «Complete sequence and gene map of a human major histocompatibility complex». Nature (en inglés) 401 (6756): 921-923. ISSN 1476-4687. doi:10.1038/44853. Consultado el 18 de julio de 2022. 
  43. Logan, Darren W.; Marton, Tobias F.; Stowers, Lisa (25 de septiembre de 2008). «Species Specificity in Major Urinary Proteins by Parallel Evolution». PLOS ONE (en inglés) 3 (9): e3280. ISSN 1932-6203. PMC 2533699. PMID 18815613. doi:10.1371/journal.pone.0003280. Consultado el 18 de julio de 2022. 
  44. Hurst J, Beynon RJ, Roberts SC, Wyatt TD (October 2007). Urinary Lipocalins in Rodenta:is there a Generic Model?. Chemical Signals in Vertebrates 11. Springer New York. ISBN 978-0-387-73944-1. 
  45. Li, Ruiqiang; Li, Yingrui; Zheng, Hancheng; Luo, Ruibang; Zhu, Hongmei; Li, Qibin; Qian, Wubin; Ren, Yuanyuan et al. (2010-01). «Building the sequence map of the human pan-genome». Nature Biotechnology (en inglés) 28 (1): 57-63. ISSN 1546-1696. doi:10.1038/nbt.1596. Consultado el 17 de agosto de 2022. 
  46. International HapMap Consortium (27 de octubre de 2005). «A haplotype map of the human genome». Nature 437 (7063): 1299-1320. ISSN 1476-4687. PMC 1880871. PMID 16255080. doi:10.1038/nature04226. Consultado el 17 de agosto de 2022. 
  47. International HapMap Consortium; Frazer, Kelly A.; Ballinger, Dennis G.; Cox, David R.; Hinds, David A.; Stuve, Laura L.; Gibbs, Richard A.; Belmont, John W. et al. (18 de octubre de 2007). «A second generation human haplotype map of over 3.1 million SNPs». Nature 449 (7164): 851-861. ISSN 1476-4687. PMC 2689609. PMID 17943122. doi:10.1038/nature06258. Consultado el 17 de agosto de 2022. 
  48. International HapMap 3 Consortium; Altshuler, David M.; Gibbs, Richard A.; Peltonen, Leena; Altshuler, David M.; Gibbs, Richard A.; Peltonen, Leena; Dermitzakis, Emmanouil et al. (2 de septiembre de 2010). «Integrating common and rare genetic variation in diverse human populations». Nature 467 (7311): 52-58. ISSN 1476-4687. PMC 3173859. PMID 20811451. doi:10.1038/nature09298. Consultado el 17 de agosto de 2022. 
  49. «Acerca Del Proyecto Internacional Hapmap». Genome.gov (en inglés). Consultado el 17 de agosto de 2022. 
  50. 1000 Genomes Project Consortium; Abecasis, Gonçalo R.; Altshuler, David; Auton, Adam; Brooks, Lisa D.; Durbin, Richard M.; Gibbs, Richard A.; Hurles, Matt E. et al. (28 de octubre de 2010). «A map of human genome variation from population-scale sequencing». Nature 467 (7319): 1061-1073. ISSN 1476-4687. PMC 3042601. PMID 20981092. doi:10.1038/nature09534. Consultado el 17 de agosto de 2022. 
  51. 1000 Genomes Project Consortium; Abecasis, Goncalo R.; Auton, Adam; Brooks, Lisa D.; DePristo, Mark A.; Durbin, Richard M.; Handsaker, Robert E.; Kang, Hyun Min et al. (1 de noviembre de 2012). «An integrated map of genetic variation from 1,092 human genomes». Nature 491 (7422): 56-65. ISSN 1476-4687. PMC 3498066. PMID 23128226. doi:10.1038/nature11632. Consultado el 17 de agosto de 2022. 
  52. 1000 Genomes Project Consortium; Auton, Adam; Brooks, Lisa D.; Durbin, Richard M.; Garrison, Erik P.; Kang, Hyun Min; Korbel, Jan O.; Marchini, Jonathan L. et al. (1 de octubre de 2015). «A global reference for human genetic variation». Nature 526 (7571): 68-74. ISSN 1476-4687. PMC 4750478. PMID 26432245. doi:10.1038/nature15393. Consultado el 17 de agosto de 2022. 
  53. Sudmant, Peter H.; Rausch, Tobias; Gardner, Eugene J.; Handsaker, Robert E.; Abyzov, Alexej; Huddleston, John; Zhang, Yan; Ye, Kai et al. (1 de octubre de 2015). «An integrated map of structural variation in 2,504 human genomes». Nature 526 (7571): 75-81. ISSN 1476-4687. PMC 4617611. PMID 26432246. doi:10.1038/nature15394. Consultado el 17 de agosto de 2022. 
  54. Miga, Karen H.; Wang, Ting (31 de agosto de 2021). «The Need for a Human Pangenome Reference Sequence». Annual Review of Genomics and Human Genetics (en inglés) 22 (1): 81-102. ISSN 1527-8204. PMC 8410644. PMID 33929893. doi:10.1146/annurev-genom-120120-081921. Consultado el 17 de agosto de 2022. 
  55. Wang, Ting; Antonacci-Fulton, Lucinda; Howe, Kerstin; Lawson, Heather A.; Lucas, Julian K.; Phillippy, Adam M.; Popejoy, Alice B.; Asri, Mobin et al. (2022-04). «The Human Pangenome Project: a global resource to map genomic diversity». Nature (en inglés) 604 (7906): 437-446. ISSN 1476-4687. doi:10.1038/s41586-022-04601-8. Consultado el 17 de agosto de 2022. 
  56. «Genome List - Genome - NCBI». www.ncbi.nlm.nih.gov. Consultado el 16 de agosto de 2022. 
  57. «Species List». uswest.ensembl.org. Consultado el 17 de agosto de 2022. 
  58. «GenArk: UCSC Genome Archive». hgdownload.soe.ucsc.edu. Consultado el 17 de agosto de 2022. 
  59. «Chimpanzee Genome Project». BCM-HGSC (en inglés). 4 de marzo de 2016. Consultado el 17 de agosto de 2022. 
  60. Prado-Martinez, Javier; Sudmant, Peter H.; Kidd, Jeffrey M.; Li, Heng; Kelley, Joanna L.; Lorente-Galdos, Belen; Veeramah, Krishna R.; Woerner, August E. et al. (25 de julio de 2013). «Great ape genetic diversity and population history». Nature 499 (7459): 471-475. ISSN 1476-4687. PMC 3822165. PMID 23823723. doi:10.1038/nature12228. Consultado el 17 de agosto de 2022. 
  61. «100K Pathogen Genome Project – Genomes for Public Health & Food Safety» (en inglés estadounidense). Consultado el 17 de agosto de 2022. 
  62. Lewin, Harris A.; Robinson, Gene E.; Kress, W. John; Baker, William J.; Coddington, Jonathan; Crandall, Keith A.; Durbin, Richard; Edwards, Scott V. et al. (24 de abril de 2018). «Earth BioGenome Project: Sequencing life for the future of life». Proceedings of the National Academy of Sciences of the United States of America 115 (17): 4325-4333. ISSN 1091-6490. PMC 5924910. PMID 29686065. doi:10.1073/pnas.1720115115. Consultado el 17 de agosto de 2022. 
  63. «African BioGenome Project – Genomics in the service of conservation and improvement of African biological diversity» (en inglés estadounidense). Consultado el 17 de agosto de 2022. 
  64. «1000 Fungal Genomes Project». mycocosm.jgi.doe.gov. Consultado el 17 de agosto de 2022.