Ir al contenido

Estudio de asociación del genoma completo

De Wikipedia, la enciclopedia libre
Esta es una versión antigua de esta página, editada a las 20:15 3 jun 2014 por Grillitus (discusión · contribs.). La dirección URL es un enlace permanente a esta versión, que puede ser diferente de la versión actual.

En genética, un estudio de asociación del genoma completo (en inglés, GWAS ( Genome-wide association study) o WGAS (Whole genome association study) es un análisis de una variación genética a lo largo de todo el genoma humano con el objetivo de identificar su asociación a un rasgo observable. Los GWAS suelen centrarse en asociaciones entre los polimorfismos de un solo nucleótido (SNPs) y rasgos como las principales enfermedades.

Introducción

Para ello se deben estudiar una gran cantidad de individuos, de modo que se puedan comparar datos genéticos entre ellos. De este modo, al comparar los datos genéticos obtenidos de las secuenciaciones de los genomas de diferentes individuos, podemos hallar genes ligados a enfermedades o caracteres. Por ejemplo, podemos contrastar cómo quizá se produce la aparición de uno o varios SNPs (variación de un sólo par de bases) o una deleción, repetición, etc. en una secuencia del genoma siempre que aparece el mismo fenotipo, pudiendo así concluir que este cambio a nivel genético se corresponde con un rasgo.

Estas variaciones son asociadas a distintos rasgos, por ejemplo, a enfermedades. En humanos, esta técnica ha permitido descubrir que ciertos genes están asociados a enfermedades como la degeneración macular asociada a la edad y la diabetes. En el caso de la especie humana, se estudian miles de individuos para hallar polimorfismos de nucleótido simple o SNPs (single-nucleotide polymorphisms, en inglés). Alrededor de 600 estudios de asociación del genoma completo llevados a cabo en humanos han examinado 150 rasgos y enfermedades, y han encontrado unos 800 SNPs asociados a ellas.[1][2][3][4]

Si ciertas variaciones genéticas son más frecuentes en personas con la enfermedad, se dice que estas variaciones están "asociadas" con esa enfermedad. Estas variaciones son entonces consideradas como señalizadores de la región del genoma humano donde probablemente esté el problema causante de la enfermedad. Se emplean dos estrategias para buscar mutaciones asociadas a la enfermedad: desde la hipótesis o sin hipótesis previa. La estrategia desde la hipótesis comienza con la formulación de la hipótesis de que un determinado gen puede estar asociado con una determinada enfermedad, y trata de buscar esa asociación. La estrategia sin hipótesis previa emplea métodos de "fuerza bruta" para escanear todo el genoma y posteriormente comprobar si algunos genes muestran esa asociación. Los estudios de asociación del genoma completo emplean generalmente la estrategia sin hipótesis previa.[5]

Sorprendentemente, la mayoría de las variaciones de SNPs asociadas con enfermedades no se presentan en las regiones codificantes del ADN, sino que normalmente están en las amplias regiones no codificantes intergénicas o en los intrones que se extraen de la secuencia de ADN cuando las proteínas son procesadas. Estas son presumiblemente secuencias de ADN que controlan otros genes, pero normalmente su función proteica no se conoce.

Metodología

Estos estudios suelen basarse en la comparación de dos grandes grupos de individuos, uno formado por personas sanas que se tomará como control, y otro compuesto por personas afectadas por la enfermedad en cuestión que será el grupo de casos Se estudian la mayoría de las SNPs conocidas y más comunes en todos los individuos, el número de SNPs dependerá de la tecnología que se emplee para el estudio, pero normalmente su número oscila alrededor del millón.[6]​ Para cada SNPs, se analiza si su frecuencia alélica varía de forma significativa entre el grupo control y el grupo de casos, cuando se da esta situación, se determina que la SNP está probablemente relacionada con la enfermedad.[7]

Todo el análisis estadístico se realiza con la ayuda de software bioinformático, pudiendo aplicarse también para diversas variaciones del enfoque anterior, como es el análisis de rasgos fenotípicos cuantitativos como la altura o la concentración de biomarcadores.[7]

Además, hay que tener en cuenta varias variables a la hora de interpretar los resultados. Entre ellas se encuentran el sexo y la edad, así como la el origen geográfica y étnico de los individuos, ya que muchas variaciones genéticos están asociadas con la localización geográfica y/o la historia de las poblaciones.

Existen también alternativas al planteamiento del estudio, la selección de grupos de casos y controles es sencilla y proporciona resultados relativamente rápidos para estudiar fácilmente las enfermedades raras, sin embargo, pueden presentarse sesgos de casos extremos, se dejan de incluir muchos casos en el estudio y se tiende a sobreestimar el riesgo en ellos. Por este motivo existen al menos dos alternativas más, la selección de cohortes y la selección de tríos. Para la selección de cohortes, se estudia la aparición de la enfermedad en un grupo elegido a partir de una población, de esta forma se estima directamente el riesgo y se obtienen menos sesgos, pero se requiere de grupos muy grandes, mucho presupuesto, un tiempo muy largo y no es adecuado para el estudio de enfermedades raras. En cuanto a la selección de tríos, se eligen padres e hijo afecto y se buscan alelos que se hereden en más de la mitad de los hijos afectos, de esta forma, no se requiere el control de las características de la población, es más sencillo es estudio estadístico de los datos y se puede comprobar la herencia mendeliana; sin embargo, es difícil buscar casos para enfermedades de edad adulta.[8]

Limitaciones

Los GWA Tienen diversos problemas y limitaciones que pueden subsanarse mediante un control de calidad y un diseño adecuado del estudio. Entre los problemas más comunes se encuentran la selección dificultosa de los pacientes con respecto al fenotipo de la enfermedad que se quiere estudiar, que la muestra tenga un tamaño insuficiente ya que se requiere el análisis de miles de casos y controles; y el control de la estratificación de la población. A tal efecto se ha determinado que el enfoque WGA puede ser problemático debido a la enorme cantidad de pruebas estadísticas que requiere, ya que presentan un potencial sin precedentes para dar falsos positivos,[9]​ por lo que se requiere un sistema informático capaz de manejar correctamente esta gran cantidad de información.

Además de estos por problemas que pueden prevenirse, los GWA han sido objeto de críticas relacionadas con su fundamento, principalmente debido a su suposición de que las variaciones genéticas comunes juegan un papel importante a la hora de explicar la variación hereditaria de las enfermedad más frecuentes.Estos estudios tienen en cuenta los SNPs de forma individual y dejan de lado sus efectos combinatorios. Estos aspectos han llevado a muchos a pensar que los GWA tradicionales no valen la pena por la gran cantidad de dinero que es necesario invertir en ellos.

Se ha sugerido como estrategia alternativa los análisis de ligamiento pero, en la actualidad, con la rápida disminución del precio de la secuenciación completa del genoma,ésta se está convirtiendo en una alternativa realista a los de los estudios de GWA basadas en arrays, aunque muchos lo considerarían una técnica distinta. De cualquier forma, la secuenciación de alto rendimiento tiene el potencial para esquivar algunas de las limitaciones de los GWA tradicionales.[10]

GWAS y eQTLs

Existe millones de variantes genéticas en humanos y la interpretación de sus efectos funcionales en los caracteres humanos es uno de los mayores retos en la genómica.

Los eQTLS son loci en el DNA que actúan como elementos regulatorios de la expresión génica, la variación de estos eQTLs y sus consecuencias a nivel de expresión añade una dimensión funcional a nuestros conocimientos, la cual puede ser usada en estudios de enfermedades.

Una proporción de las variantes descritas en los GWAS son eQTLs o trQTLs, por lo que, la integración del genoma secuenciado, eQTLs y el fenotipo celular ayuda a comprender los genes causales de la enfermedad, las variantes genéticas causales que subyacen a los GWAS y los procesos biológicos que intervienen en estos.[11]

Aplicaciones

Una aplicación clara de este tipo de estudios es la asociación de un síntoma patológico o patología con un determinado locus. Un ejemplo de ellos son los estudios de asociación de la alergia a determinados alérgenos con la susceptibilidad a loci.

Referencias

  1. Roberts, Paul (15 de marzo de 2005). «WebTV Virus Writer Sentenced to Prison» (en inglés). IDG News. Consultado el 15 de julio de 2010. 
  2. Manolio TA (2010). «Genomewide association studies and assessment of the risk of disease». N Engl J Med 363: 166. 
  3. Manolio TA; Pearson TA (2008). «How to interpret a genome-wide association study». JAMA 299 (11): 1335–1344. PMID 18349094. doi:10.1001/jama.299.11.1335. 
  4. Genome.gov (ed.). «Genome-Wide Association Studies». National Human Genome Research Institute, National Institutes of Health.  (Explicación más simple)
  5. Hunter DJ, Altshuler D, Rader DJ (June de 2008). «From Darwin's Finches to Canaries in the Coal Mine — Mining the Genome for New Biology». N Engl J Med 358: 2760-2763. 
  6. Plantilla:6. Jump Bush WS, Moore JH (2012). "Chapter 11: genome-wide association studies". In Lewitter, Fran; Kann, Maricel. PLoS Comput Biol 8 (12): e1002822.doi:10.1371/journal.pcbi.1002822. PMC 3531285. PMID 23300413Bush WS, Moore JH (2012). <a href="https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3531285" rel="nofollow" class="external text" style="color: rgb(102, 51, 102); background-image: url(); padding-right: 13px; background-position: 100% 50%; background-repeat: no-repeat no-repeat;">"Chapter 11: genome-wide association studies"</a>. In Lewitter, Fran; Kann, Maricel. PLoS Comput Biol 8 (12): e1002822.<a href="https://en.wikipedia.org/wiki/Digital_object_identifier" title="Digital object identifier">doi</a>:<a href="http://dx.doi.org/10.1371%2Fjournal.pcbi.1002822" rel="nofollow" class="external text" style="color: rgb(102, 51, 102); background-image: url(); padding-right: 13px; background-position: 100% 50%; background-repeat: no-repeat no-repeat;">10.1371/journal.pcbi.1002822</a>. <a href="https://en.wikipedia.org/wiki/PubMed_Central" title="PubMed Central">PMC</a> <a href="https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3531285" rel="nofollow" class="external text" style="color: rgb(102, 51, 102); background-image: url(); padding-right: 13px; background-position: 100% 50%; background-repeat: no-repeat no-repeat;">3531285</a>. <a href="https://en.wikipedia.org/wiki/PubMed_Identifier" title="PubMed Identifier" class="mw-redirect">PMID</a> <a href="https://www.ncbi.nlm.nih.gov/pubmed/23300413" rel="nofollow" class="external text" style="color: rgb(102, 51, 102); background-image: url(); padding-right: 13px; background-position: 100% 50%; background-repeat: no-repeat no-repeat;">23300413</a>
  7. a b  Purcell S, Neale B, Todd-Brown K, Thomas L, Ferreira MA, Bender D, Maller J, Sklar P, de Bakker PI, Daly MJ, Sham PC (September 2007). <a href="https://www.ncbi.nlm.nih.gov/pmc/articles/PMC1950838" rel="nofollow" class="external text" style="color: rgb(102, 51, 102); background-image: url(); padding-right: 13px; background-position: 100% 50%; background-repeat: no-repeat no-repeat;">"PLINK: A Tool Set for Whole-Genome Association and Population-Based Linkage Analyses"</a>. Am. J. Hum. Genet. 81 (3): 559–75.<a href="https://en.wikipedia.org/wiki/Digital_object_identifier" title="Digital object identifier">doi</a>:<a href="http://dx.doi.org/10.1086%2F519795" rel="nofollow" class="external text" style="color: rgb(102, 51, 102); background-image: url(); padding-right: 13px; background-position: 100% 50%; background-repeat: no-repeat no-repeat;">10.1086/519795</a>. <a href="https://en.wikipedia.org/wiki/PubMed_Central" title="PubMed Central">PMC</a> <a href="https://www.ncbi.nlm.nih.gov/pmc/articles/PMC1950838" rel="nofollow" class="external text" style="color: rgb(102, 51, 102); background-image: url(); padding-right: 13px; background-position: 100% 50%; background-repeat: no-repeat no-repeat;">1950838</a>. <a href="https://en.wikipedia.org/wiki/PubMed_Identifier" title="PubMed Identifier" class="mw-redirect">PMID</a> <a href="https://www.ncbi.nlm.nih.gov/pubmed/17701901" rel="nofollow" class="external text" style="color: rgb(102, 51, 102); background-image: url(); padding-right: 13px; background-position: 100% 50%; background-repeat: no-repeat no-repeat;">17701901</a>.
  8. Apuntes de la asignatura de Diagnóstico Molecular y Genético de 3º del Grado en Biotecnología de la Universidad Pablo de Olavide.
  9. Pearson TA, Manolio TA (March 2008). "How to interpret a genome-wide association study". JAMA 299 (11): 1335–44. <a href="https://en.wikipedia.org/wiki/Digital_object_identifier" title="Digital object identifier">doi</a>:<a href="http://dx.doi.org/10.1001%2Fjama.299.11.1335" rel="nofollow" class="external text" style="color: rgb(102, 51, 102); background-image: url(); padding-right: 13px; background-position: 100% 50%; background-repeat: no-repeat no-repeat;">10.1001/jama.299.11.1335</a>. <a href="https://en.wikipedia.org/wiki/PubMed_Identifier" title="PubMed Identifier" class="mw-redirect">PMID</a> <a href="https://www.ncbi.nlm.nih.gov/pubmed/18349094" rel="nofollow" class="external text" style="color: rgb(102, 51, 102); background-image: url(); padding-right: 13px; background-position: 100% 50%; background-repeat: no-repeat no-repeat;">18349094</a>
  10. Visscher PM, Goddard ME, Derks EM, Wray NR (June 2011). "Evidence-based psychiatric genetics, AKA the false dichotomy between common and rare variant hypotheses". Mol Psychiatry 17 (5): 474–85. <a href="https://en.wikipedia.org/wiki/Digital_object_identifier" title="Digital object identifier">doi</a>:<a href="http://dx.doi.org/10.1038%2Fmp.2011.65" rel="nofollow" class="external text" style="color: rgb(102, 51, 102); background-image: url(); padding-right: 13px; background-position: 100% 50%; background-repeat: no-repeat no-repeat;">10.1038/mp.2011.65</a>. <a href="https://en.wikipedia.org/wiki/PubMed_Identifier" title="PubMed Identifier" class="mw-redirect">PMID</a> <a href="https://www.ncbi.nlm.nih.gov/pubmed/21670730" rel="nofollow" class="external text" style="color: rgb(102, 51, 102); background-image: url(); padding-right: 13px; background-position: 100% 50%; background-repeat: no-repeat no-repeat;">21670730</a>. 
  11. Lappalainen T. et all. (2013). “Transcriptome and genome sequencing uncovers functional variation in humans”. Nature (501): 506-511.

Enlaces externos

  • [1] Un catálogo de los estudios de asociación del genoma completo publicados.