Polimorfismo de nucleótido simple

De Wikipedia, la enciclopedia libre
Saltar a: navegación, búsqueda
La cadena de ADN en 1 difiere de la del ADN en 2 en un sólo par de bases

Un polimorfismo de un solo nucleótido o SNP (Single Nucleotide Polymorphism, pronunciado snip) es una variación en la secuencia de ADN que afecta a una sola base (adenina (A), timina (T), citosina (C) o guanina (G)) de una secuencia del genoma. Sin embargo, algunos autores consideran que cambios de unos pocos nucleótidos, como también pequeñas inserciones y deleciones (indels) pueden ser consideradas como SNP, siendo entonces más adecuado el término Polimorfismo de nucleótido simple.[1] Una de estas variaciones debe darse al menos en un 1% de la población para ser considerada como un SNP. Si no se llega al 1% no se considera SNP y sí una mutación puntual.

Los SNP constituyen hasta el 90% de todas las variaciones genómicas humanas, y aparecen cada 1,300 bases en promedio, a lo largo del genoma humano. Dos tercios de los SNP corresponden a la sustitución de una citosina (C) por una timina (T). Estas variaciones en la secuencia del ADN pueden afectar a la respuesta de los individuos a enfermedades, bacterias, virus, productos químicos, fármacos, etc..

Los SNP que se localicen dentro de una secuencia codificante pueden modificar o no la cadena de aminoácidos que producen; se llama SNP no-sinónimos a los primeros y SNP sinónimos (o mutaciones silenciosas) a los segundos. Los SNP que se encuentren en regiones no codificantes pueden tener consecuencias en el proceso de traducción, sobre todo en procesos como el splicing, la unión de factores de transcripción o modificar la secuencia de ARN no codificante. En cualquier caso, los SNP que alteren de algún modo la expresión génica reciben el nombre de SNPe (SNP de expresión) y pueden encontrarse tanto aguas arriba como aguas abajo de la secuencia codificante. Por otra parte, aunque pueden estar tanto en regiones codificantes como en regiones intrónicas o intergénicas, los SNP que afectan a las regiones codificantes son los que más impacto tienen sobre la función de una proteína (si bien podrían no alterar la secuencia aminoacídica como consecuencia de la degeneración del código genético). Por otra parte, cualquier tipo de SNP puede estar relacionado con una enfermedad o tener asociado un fenotipo observable, de forma que:

  • Ciertos SNP en las regiones no codificantes de algunos genes correlacionan con un aumento en la probabilidad de desarrollar cáncer.[2]
  • Algunos SNP en regiones codificantes consistentes en sustituciones sinónimas, pese a no modificar la secuencia aminoacídica de la proteína, podrían alterar su función. Esto ocurre, por ejemplo, en el caso del receptor de resistencia múltiple a drogas 1 (MDR1), donde un SNP de mutación silenciosa ralentiza la traducción del péptido naciente, haciendo que se pliegue adoptando una conformación alternativa menos funcional que la estructura tridimensional nativa.[3]
  • Los SNP que implican una sustitución con cambio de sentido alteran la secuencia aminoacídica y son los que más frecuentemente están asociados a la aparición de enfermedades. Un ejemplo de esto es el SNP 1580G>T en el gen LMNA, que provoca el cambio de arginina por leucina en la proteína, fenotipo relacionado con enfermedades como la progeria o la displasia mandibuloacral.[4]
  • Los SNP sin sentido provocan la aparición de un codón de stop prematuro que trunca la proteína resultante, haciéndola incompleta y normalmente no funcional. Esto se refleja en la mutación G542X en el gen CTFR, causante de la fibrosis quística.[5]

Debido a que los SNP no cambian mucho de una generación a otra (se heredan de forma muy estable), es sencillo seguir su evolución en estudios de poblaciones. También se utilizan en algunos tipos de pruebas genéticas y su estudio es de gran utilidad para la investigación médica en el desarrollo de fármacos. De esta manera, los SNP permitirán un gran desarrollo de la medicina personalizada, así como avances en el estudio de la farmacocinética y la farmacodinamia, puesto que determinan en buena parte el desarrollo de enfermedades como la fibrosis quística o la β-talasemia, la afinidad por dianas farmacológicas o la forma en que se metaboliza una determinada droga. Por todo ello, empresas como 23andMe ofrecen análisis genéticos basados en el análisis de SNPs, que puedan revelar información acerca del riesgo de padecer ciertas enfermedades, como Parkinson, diabetes, trastorno bipolar, etc.

Los SNP se consideran una forma de mutación puntual que ha sido lo suficientemente exitosa evolutivamente para fijarse en una parte significativa de la población de una especie y existen marcadores SNP que detectan el cambio de ese único nucleótido.

Detección[editar]

Existen una gran variedad de métodos analíticos que permiten descubrir nuevos SNP e identificar SNP conocidos en las secuencias de ADN. Entre los más destacados, podemos encontrar los siguientes:

  • Polimorfismo en la longitud de fragmentos de restricción (SNP-RFLP). Si un alelo contiene un sitio de reconocimiento para una enzima de restricción mientras que otro no, la digestión de los dos alelos genera fragmentos de diferente longitud. Si no existe este punto discriminatorio para la enzima de restricción, a menudo puede introducirse mediante una reacción en cadena de la polimerasa (PCR).
  • Técnicas de secuenciación del ADN.[6] Permiten determinar la secuencia de nucleótidos del ADN y han evolucionado en gran medida desde los métodos desarrollados inicialmente por Sanger o Maxam-Gilbert hasta las nuevas técnicas de alto rendimiento (next generation), como Illumina o Ion Torrent, que aúnan una elevada fiabilidad y un menor coste económico.
  • Espectrometría de masas.[7] En concreto, la espectrometría de masas MALDI-TOF (Matrix-Assisted Laser Desorption Ionization Time-Of-Flight), se está desarrollando como alternativa a la electroforesis en gel para visualizar fragmentos de ADN generados de forma análoga al procedimiento seguido en el método de secuenciación Sanger y que pueden ser diferenciados en función de su masa, de manera que los SNP pueden ser detectados por la diferente masa de los distintos nucleótidos que formen la secuencia de ADN en cada caso.
  • Electroforesis capilar.[8] Esta técnica de separación se basa en la distinta velocidad de migración a través de un fino capilar de las moléculas de ADN en función de su longitud. Si se emplean fragmentos marcados con fluorocromos es posible detectar diferencias de un solo nucleótido entre distintos fragmentos.
  • Cromatografía Líquida Desnaturalizante de Alto Rendimiento (HPLC). Se basa en la distinta capacidad de elución de moléculas de ADN bicatenarias a través de una columna. Así, el gen de interés es amplificado por PCR y, a continuación, desnaturalizado y renaturalizado en presencia de moléculas de ADN silvestre. De este modo, si hay alguna mutación presente, se formarán heterodúplex menos resistentes a las condiciones de elución (lo que implica que abandonarán la columna antes que los homodúplex), dando lugar a tantos picos en el cromatograma como SNP haya en la secuencia analizada.
  • Polimorfismo de conformación de cadena simple.[9] Esta técnica se basa en la conformación tridimensional única que adopta una hebra simple de ADN, la cual depende enteramente de su secuencia de nucleótidos. Así, tras desnaturalizar las dobles hebras de ADN (con una movilidad electroforética prácticamente idéntica), se obtienen hebras simples que, aunque difieran en un único nucleótido, podrán diferenciarse mediante electroforesis en función de la movilidad que presenten dada su conformación tridimensional.

Se nombran otros métodos de detección de SNP en el artículo publicado en octubre de 2005 en Nature por el Proyecto HapMap. El proyecto HapMap tuvo la finalidad de desarrollar un mapa de haplotipos del genoma humano. Pretendían ver como se distribuyen los SNPs y así identificar trozos de cromosomas comunes en la población. Estos SNPs se llaman tagging SNPs, que tienen alto desequilibrio de ligamiento, razón por la cual son los marcadores. Sirve para acotar alelos relacionados con enfermedades.[cita requerida]

Estudios con SNPs[editar]

Para el estudio de enfermedades complejas se pueden estudiar los polimorfismos de un sólo nucleótido. Hay que mencionar que los análisis de ligamiento están abriendo paso a los análisis de asociación (GWAS), donde estudiamos SNPs que no varían de generación en generación. En este caso, no se parte de la hipótesis de que la enfermedad sea heredable, se parte de la pregunta de si en la población en general existe una asociación positiva (o lo que es lo mismo, una predisposición) o, por el contrario, una asociación negativa (protección) de determinado haplotipo con la enfermedad. Los SNPs tienen el mismo origen, lo que no se puede afirmar de los microsatélites. Los SNPs pueden estar en regiones codificantes o intergénicas. Se dice que tienen más impacto aquellas que se encuentran en las regiones codificantes aunque todas pueden tener relación con la enfermedad. Si una enfermedad multifactorial es heredable, muchas de sus variantes estarán asociados a SNPs específicos. La ventaja con estos estudios es que como existe una media de 1 SNP cada 200 pb, podemos mapear muy estrechamente dónde se encuentra nuestra mutación.

En estudios de metilación del ADN humano, se ha observado un enriquecimiento significativo en SNPs en regiones diferencialmente metiladas (DMRs) en comparación con el fondo genético. Además es específico para cada tipo celular, demostrando una distribución no aleatoria de los SNPs.[10]

Bases de datos[editar]

Existen bases de datos bioinformáticas de SNPs al igual que la hay de genes o proteínas. Las más importantes son:

  • dbSNP: base de datos global de todos los SNPs. Está contenida en NCBI (del inglés, National Center for Biotechnology Information).
  • HapMap: mapa de SNPs marcadores, también conocidos como tagging-SNPs.
  • SNP500: base de datos de SNPs relacionados con cáncer. Se pretende conocer el suficiente número de SNPs implicados en esta enfermedad para diseñar un microarray que permita estudiar la predisposición al cáncer de forma más económica.
  • EGP (del inglés, Environmental Genome Project): esta base de datos contiene SNPs que se saben relacionados con la interacción con estímulos ambientales.
  • Seattle SNPs: relacionados con la inflamación, coagulación y enfermedades cardiopulmonares.
  • HGMD (del inglés, Human Gene Mutation Database): recoge SNPs asociados a enfermedades en general.
  • SNPedia: es una base de datos de estilo similar a la wikipedia que aporta información, interpretación y análisis sobre los SNPs.

Predicción del efecto de los SNP[editar]

Un importante grupo de SNP son aquellos que corresponden a mutaciones con cambio de sentido que modifican la secuencia aminoacídica. Las mutaciones puntuales con cambio de residuo pueden tener distinto efecto en la función proteica (desde ninguna alteración hasta pérdida total de función). De esta manera, lo más habitual es que la sustitución de un aminoácido por otro de similar tamaño y propiedades fisicoquímicas (como el cambio de leucina por valina) tenga un efecto atenuado sobre la funcionalidad proteica, mientras que si el SNP afecta a los aminoácidos clave en el mantenimiento de la estructura secundaria (como el cambio de una prolina en una α-hélice), suele tener graves consecuencias. En base a ello, resulta interesante predecir los efectos que un determinado SNP tendrá sobre la correspondiente proteína a la hora de diseñar experimentos de ingeniería genética o técnicas de diagnóstico molecular. De esta forma, se han desarrollado con dicho objetivo una serie de programas y aplicaciones informáticas entre los que destacan los siguientes:

  • SIFT
  • PolyPhen-2
  • PredictSNP
  • MutationTaster

Nomenclatura[editar]

Debido a la gran cantidad de posibles variantes que pueden existir de un único SNP, su nomenclatura es bastante confusa. Una aproximación es escribir el SNP con un prefijo seguido de un punto y de un signo "mayor que" separando la versión silvestre del nucleótido o aminoácido mutado; por ejemplo, c.76A>T. De todos modos, en la mayoría de los casos cuando se hace referencia a un SNP es en base a su número rs de la base de datos dbSNP rs number.

Ejemplos[editar]

Entre la gran variedad de SNP que existen, mostraremos algunos a modo de ejemplo para luego mostrar la asociación entre una patología y numerosos SNPs lo cual nos indica que puede haber multitud de SNPs asociados a una misma enfermedad:

  • rs6311 y rs6313, SNP en el gen HTR2A (receptor de serotonina) del cromosoma 13 humano.[11]
  • Un SNP en el gen F5 es responsable de un tipo de trombosis debido a la presencia del factor V Leiden.[12]
  • rs3091244 es un ejemplo de SNP trialélico en el gen CRP (relacionado con procesos de inflamación) del cromosoma 1 en humanos.[13]
  • El gen TAS2R38 determina la percepción del sabor de la feniltiocarbamida y tiene descritos hasta seis SNP.[14]

Dentro de diversas patologías ,como es el Cáncer de páncreas, pueden existir numerosos SNPs que se consideran factores de riesgo para padecer la enfermedad, a modo de ejemplo vamos a nombrar algunos SNPs implicados en el riesgo cáncer de páncreas y los genes relacionados: [15]

  • Rs6971499 situado en un intrón de LINC-PINT(long intergenicnon-protein coding RNA, p53 induced transcript).
  • Rs9581943 en PDX1 , el cual tiene un rol importane en el desarrollo embrionario del páncreas, en la diferenciación del páncreas exocrino y la regulación de la función de las células beta del páncreas endocrino
  • Rs16986825 en ZNRF3 codificando una proteína ligasa de un regulador negativo de WNT.
  • Rs1561927 en una región no génica entre PVT1 and LINC00977. Pero su desequilibrio de ligamiento esta asociado con otro SNPs implicado en cáncer ovárico
  • Rs2736098 en el segundo exón de TERT, encargado de la subunidad catalítica de la telomerasa transcriptasa reversa y por tanto participa en el mantenimiento de la integridad cromosómica.
  • Rs7190458 en el ultimo exón de BCAR1. La proteina adaptadora BCAR1 coordina el ciclo celular, organización del citoesqueleto y migración celular.

La presencia de estos SNPs incrementa considerablemente el riesgo a padecer cáncer de páncreas.

Referencias[editar]

  1. Gibson & Muse. A Primer of Genome Science, 2nd Edition. Sinauer Associates. 2004
  2. Li, G.; Pan, T.; Guo, D.; Li, LC. (2014). «Regulatory Variants and Disease: The E-Cadherin -160C/A SNP as an Example». Mol Biol Int 2014: 967565. doi:10.1155/2014/967565. PMC 4167656. PMID 25276428. 
  3. Kimchi-Sarfaty, C.; Oh, JM.; Kim, IW.; Sauna, ZE.; Calcagno, AM.; Ambudkar, SV.; Gottesman, MM. (Jan 2007). «A "silent" polymorphism in the MDR1 gene changes substrate specificity». Science 315 (5811): 525–8. doi:10.1126/science.1135308. PMID 17185560. 
  4. Al-Haggar M, Madej-Pilarczyk A, Kozlowski L, Bujnicki JM, Yahia S, Abdel-Hadi D, Shams A, Ahmad N, Hamed S, Puzianowska-Kuznicka M; Madej-Pilarczyk; Kozlowski; Bujnicki; Yahia; Abdel-Hadi; Shams; Ahmad; Hamed; Puzianowska-Kuznicka (2012). «A novel homozygous p.Arg527Leu LMNA mutation in two unrelated Egyptian families causes overlapping mandibuloacral dysplasia and progeria syndrome». Eur J Hum Genet. 20 (11): 1134–40. doi:10.1038/ejhg.2012.77. PMC 3476705. PMID 22549407. 
  5. Cordovado, SK.; Hendrix, M.; Greene, CN.; Mochal, S.; Earley, MC.; Farrell, PM.; Kharrazi, M.; Hannon, WH.; Mueller, PW. (Feb 2012). «CFTR mutation analysis and haplotype associations in CF patients». Mol Genet Metab 105 (2): 249–54. doi:10.1016/j.ymgme.2011.10.013. PMC 3551260. PMID 22137130. 
  6. Altshuler, D; Pollara, V J; Cowles, C R; Van Etten, W J; Baldwin, J; Linton, L; Lander, E S (2000). «An SNP map of the human genome generated by reduced representation shotgun sequencing». Nature 407 (6803): 513–6. doi:10.1038/35035083. PMID 11029002. 
  7. Griffin, T J; Smith, L M (2000). «Genetic identification by mass spectrometric analysis of single-nucleotide polymorphisms: ternary encoding of genotypes». Analytical chemistry 72 (14): 3298–302. doi:10.1021/ac991390e. PMID 10939403. 
  8. Drabovich, A.P.; Krylov, S.N. (2006). «Identification of base pairs in single-nucleotide polymorphisms by MutS protein-mediated capillary electrophoresis». Analytical chemistry 78 (6): 2035–8. doi:10.1021/ac0520386. PMID 16536443. 
  9. Tahira, T.; Kukita, Y.; Higasa, K.; Okazaki, Y.; Yoshinaga, A.; Hayashi, K. (2009). «Estimation of SNP allele frequencies by SSCP analysis of pooled DNA». Methods Mol Biol. Methods in Molecular Biology 578: 193–207. doi:10.1007/978-1-60327-411-1_12. ISBN 978-1-60327-410-4. PMID 19768595. 
  10. Ziller, MJ; Gu H, Müller F, Donaghey J, Tsai LT, Kohlbacher O, De Jager PL, Rosen ED, Bennett DA, Bernstein BE, Gnirke A, Meissner A. (2013). «Charting a dynamic DNA methylation landscape of the human genome». Nature 500 (7463): 477–81. doi:10.1038/nature12433. 
  11. Giegling I, Hartmann AM, Möller HJ, Rujescu D (November 2006). «Anger- and aggression-related traits are associated with polymorphisms in the 5-HT-2A gene». Journal of Affective Disorders 96 (1–2): 75–81. doi:10.1016/j.jad.2006.05.016. PMID 16814396. 
  12. Kujovich, JL. (Jan 2011). «Factor V Leiden thrombophilia.». Genet Med 13 (1): 1–16. doi:10.1097/GIM.0b013e3181faa0f2. PMID 21116184. 
  13. Morita, Akihiko; Nakayama, Tomohiro; Doba, Nobutaka; Hinohara, Shigeaki; Mizutani, Tomohiko; Soma, Masayoshi (2007). «Genotyping of triallelic SNPs using TaqMan PCR». Molecular and Cellular Probes 21 (3): 171–6. doi:10.1016/j.mcp.2006.10.005. PMID 17161935. 
  14. Prodi, D.A.; Drayna, D; Forabosco, P; Palmas, MA; Maestrale, GB; Piras, D; Pirastu, M; Angius, A (2004). «Bitter Taste Study in a Sardinian Genetic Isolate Supports the Association of Phenylthiocarbamide Sensitivity to the TAS2R38 Bitter Receptor Gene». Chemical Senses 29 (8): 697–702. doi:10.1093/chemse/bjh074. PMID 15466815. 
  15. M Wolpin, Brian; Rizzato, Cosmeri (2014). «Genome-wide association study identifies multiple susceptibility loci for pancreatic cancer». Nature genetics 46: 994–1000. PMID 25086665. 

Enlaces externos[editar]