Usuario:Ericbf10/Taller

De Wikipedia, la enciclopedia libre
Motivo de secuencia
etiqueta1 padre datos1 padre
etiqueta2 padre datos2 padre
título hija
etiqueta hija datos1 hija
Motivo Objeto de estudio Ejemplos
Motivo de secuencia
  • Secuencias lineales cortas de nucleótidos adyacentes.
  • Más independdientes del contexo estructural.
  • Caja TATA
  • N-glicosilación
Motivo estructural
  • Estructuras tridimensionales conservadas.
  • Dependientes del contexto molecular.

Ejemplos[editar]

Caja TATA

Caja TATA[editar]

La caja TATA (o TATA box en inglés) es una secuencia de ADN que se sitúa en la región promotora de los genes, e indica el lugar de inicio de transcripción. El nombre de esta secuencia fue asignado en reconocimiento a sus descubridores, David Pribnow y Heinz Schaller, en 1978.[1]

Se encuentra casi inalterada en los 3 dominios de la biología (arqueas, bacterias y eucariotas), siendo una de las secuencias de ADN más conservadas en la historia de la evolución.[2]​ Es precisamente debido a su conservación evolutiva que se puede establecer un logo de secuencia para describir los nucleótidos más frecuentes que la conforman, siendo su secuencia canónica: 5'-TATAAA-3'.[3]

Este motivo de secuencia se encuentra entre 25 y 35 pares de bases antes del lugar del inicio de la transcripción. Sirve como sitio de unión tanto a factores de transcripción como a histonas, y requiere de la unión a ARN Polimerasa II para empezar a transcribir.

En lo que respecta al humano, la caja TATA se encuentra presente en un 35% de los genes transcritos con ARN Pol II, es decir, un tercio de los genes humanos requieren de este motivo de secuencia para ser transcritos.[4]

Splicing

Sitios de splicing[editar]

El splicing es un proceso que ocurre después de la transcripción del ADN y forma parte de un conjunto de modificaciones que se dan de forma secuencial conocidas como maduración del ARN mensajero, que consisten en la eliminación de ciertos fragmentos para dar lugar al ARN mensajero definitivo que se va a traducir.

Este proceso es muy común en eucariotas, pudiéndose dar en cualquier tipo de ARN (ARNt, ARNr, etc.) aunque es más típico en el ARNm, y también se ha descrito en procariotas y bacteriófagos. [5]

Normalmente, el splicing consiste en descartar los intrones (regiones no codificantes) del ARN inmaduro y unir los exones (regiones codificantes), pero también existe un proceso mediante el cual se pueden descartar exones (splicing alternativo).[6]​ Estos procesos de descarte y unión son posibles gracias a reacciones catalizadas por un complejo molecular llamado espliceosoma, que realiza dos reacciones de transesterificación secuenciales.[7]​ Para que sucedan estas reacciones, es necesario que los intrones empiecen y acaben con unos nucleótidos concretos, con lo cual se han podido describir 2 secuencias consenso: 5'-GT-3' y 5'-AG-3' para el extremo 5' (sitio dador de splicing 5')[8]​ y 3' (sitio aceptor de splicing 3')[9]​ respectivamente.

Esta representación muestra los nucleótidos más frecuentes en el sitio de unión del ribosoma: el codón ATG

Motivo de inicio de la traducción[editar]

AUG

N-glicosilación[editar]

Un ejemplo de motivo es el de la N-glicosilación:

Asn, seguida por cualquier aminoácido excepto Pro, seguida por Ser o Thr, seguida por cualquier aminoácido excepto Pro

donde las abreviaturas de las letras son las nomenclaturas convencionales y establecidas para los aminoácidos (ver código genético). Considerando el motivo del sitio de N -glicosilación mencionado anteriormente:

Asn, seguida por cualquier aminoácido excepto Pro, seguida por Ser o Thr, seguida por cualquier aminoácido excepto Pro

Este patrón puede escribirse como:

N{P}[ST]{P}

Donde:

N = Asn, P = Pro, S = Ser, T = Thr; {X} 

{X} significa cualquier aminoácido excepto x; y [XY] significa cualquiera X o Y

La notación [XY] no da indicación sobre las probabilidades de X o Y ocurriendo en el patrón. Las probabilidades observadas pueden ser representadas gráficamente utilizando logos de secuencias. A veces los patrones están definidos en plazos de un modelo probabilista como un Modelo oculto de Márkov.





El descubrimiento de motivos de secuencia fue posible en la década de 1970 debido al desarrollo en técnicas de secuenciación de ácidos nucleicos. En el año 1975, David Pribnow realizó experimentos aislando un fragmento protegido de la RNA polimerasa del bacteriófago T7[10]​.​ Este fragmento contenía el punto de iniciación de una molécula de ARN mensajero de T7.  Con estos experimentos, Pribnow descubrió una secuencia específica dentro de los promotores que participaba en la unión de la ADN polimerasa y que estaba conservada entre especies. El descubrimiento de esta secuencia fue un hito en la biología molecular del momento. Los descubrimientos de Pribnow siguen teniendo validez en la actualidad. La secuencia descrita en un principio fue bautizada como caja de Pribnow, y luego pasaría a ser conocida como caja TATA.

A partir de entonces, el descubrimiento de motivos de secuencia ha estado en ascenso, en especial a desde la década de 1990. En particular, la mayoría de las investigaciones de descubrimiento de motivos existentes se centran en motivos de ADN. Con los avances en la secuenciación de alto rendimiento, estos problemas de descubrimiento de los motivos se ven desafiados tanto por los problemas de degeneración del patrón de secuencia como por los problemas de escalabilidad computacional de uso intensivo de datos.


El codón de inicio de la traducción hace referencia a una secuencia de ácido nucleico formada por tres nucleótidos (también denominado codón), que sirve como punto de partida para la formación de proteínas. Esto constituye un motivo de secuencia que en el ADN se compone de 5'-ATG-3', aunque es más frecuente verlo escrito en forma de ARN como 5'-AUG-3'. [11]

Este codón no sólo es usado por la célula como señal para empezar la traducción, sino que además es el primer codón traducido, por lo que formará parte del extremo amino terminal de las proteínas eucariotas hasta su procesamiento proteolítico como el aminoácido metionina. En cambio, los procariotas tienen N-formilmetionina en su lugar, consitituyendo una diferencia fundamental entre los códigos genéticos de ambos dominios biológicos. Si bien es cierto que los organismos procariotas suelen contar con más variabilidad en cuanto a los motivos de secuencia del inicio de la traducción, en el caso concreto de Escherichia coli (bacteria de la familia Enterobacteriaceae) se usa en un 83% de los casos el codón 5'-ATG-3', en un 14% el codón 5'-GTG-3' y en un 3% el codón 5'-TTG-3', siendo el primero el más usado con diferencia.[12]

  1. Lifton, R. P.; Goldberg, M. L.; Karp, R. W.; Hogness, D. S. (1 de enero de 1978). «The Organization of the Histone Genes in Drosophila melanogaster: Functional and Evolutionary Implications». Cold Spring Harbor Symposia on Quantitative Biology (en inglés) 42 (0): 1047-1051. ISSN 0091-7451. doi:10.1101/SQB.1978.042.01.105. Consultado el 20 de diciembre de 2020. 
  2. Patikoglou, Georgia A.; Kim, Joseph L.; Sun, Liping; Yang, Sang-Hwa; Kodadek, Thomas; Burley, Stephen K. (15 de diciembre de 1999). «TATA element recognition by the TATA box-binding protein has been conserved throughout evolution». Genes & Development 13 (24): 3217-3230. ISSN 0890-9369. PMID 10617571. Consultado el 20 de diciembre de 2020. 
  3. Stewart, J. J.; Stargell, L. A. (10 de agosto de 2001). «The stability of the TFIIA-TBP-DNA complex is dependent on the sequence of the TATAAA element». The Journal of Biological Chemistry 276 (32): 30078-30084. ISSN 0021-9258. PMID 11402056. doi:10.1074/jbc.M105276200. Consultado el 20 de diciembre de 2020. 
  4. Granados-Riveron, Javier T.; Aquino-Jarquin, Guillermo (1 de abril de 2015). «The TATA-box motif and its impact on transcriptional gene regulation by miRNAs». Biomolecular Concepts (en inglés) 6 (2): 157-161. ISSN 1868-5021. doi:10.1515/bmc-2015-0004. Consultado el 20 de diciembre de 2020. 
  5. Apirion, D.; Miczak, A. (1993-02). «RNA processing in prokaryotic cells». BioEssays: News and Reviews in Molecular, Cellular and Developmental Biology 15 (2): 113-120. ISSN 0265-9247. PMID 7682412. doi:10.1002/bies.950150207. Consultado el 20 de diciembre de 2020. 
  6. Bush, Stephen J.; Chen, Lu; Tovar-Corona, Jaime M.; Urrutia, Araxi O. (02 05, 2017). «Alternative splicing and the evolution of phenotypic novelty». Philosophical Transactions of the Royal Society of London. Series B, Biological Sciences 372 (1713). ISSN 1471-2970. PMC 5182408. PMID 27994117. doi:10.1098/rstb.2015.0474. Consultado el 20 de diciembre de 2020. 
  7. Fica, Sebastian M.; Tuttle, Nicole; Novak, Thaddeus; Li, Nan-Sheng; Lu, Jun; Koodathingal, Prakash; Dai, Qing; Staley, Jonathan P. et al. (2013-11). «RNA catalyses nuclear pre-mRNA splicing». Nature (en inglés) 503 (7475): 229-234. ISSN 1476-4687. doi:10.1038/nature12734. Consultado el 20 de diciembre de 2020. 
  8. Erkelenz, Steffen; Theiss, Stephan; Kaisers, Wolfgang; Ptok, Johannes; Walotka, Lara; Müller, Lisa; Hillebrand, Frank; Brillen, Anna-Lena et al. (12 2018). «Ranking noncanonical 5' splice site usage by genome-wide RNA-seq analysis and splicing reporter assays». Genome Research 28 (12): 1826-1840. ISSN 1549-5469. PMC 6280755. PMID 30355602. doi:10.1101/gr.235861.118. Consultado el 20 de diciembre de 2020. 
  9. Hujová, Pavla; Grodecká, Lucie; Souček, Přemysl; Freiberger, Tomáš (2019-06). «Impact of acceptor splice site NAGTAG motif on exon recognition». Molecular Biology Reports 46 (3): 2877-2884. ISSN 1573-4978. PMID 30840204. doi:10.1007/s11033-019-04734-6. Consultado el 20 de diciembre de 2020. 
  10. Pribnow, D. (1 de marzo de 1975). «Nucleotide sequence of an RNA polymerase binding site at an early T7 promoter.». Proceedings of the National Academy of Sciences 72 (3): 784-788. ISSN 0027-8424. doi:10.1073/pnas.72.3.784. Consultado el 20 de diciembre de 2020. 
  11. Hinnebusch, Alan G. (08 2017). «Structural Insights into the Mechanism of Scanning and Start Codon Recognition in Eukaryotic Translation Initiation». Trends in Biochemical Sciences 42 (8): 589-611. ISSN 0968-0004. PMID 28442192. doi:10.1016/j.tibs.2017.03.004. Consultado el 20 de diciembre de 2020. 
  12. Blattner, F. R.; Plunkett, G.; Bloch, C. A.; Perna, N. T.; Burland, V.; Riley, M.; Collado-Vides, J.; Glasner, J. D. et al. (5 de septiembre de 1997). «The complete genome sequence of Escherichia coli K-12». Science (New York, N.Y.) 277 (5331): 1453-1462. ISSN 0036-8075. PMID 9278503. doi:10.1126/science.277.5331.1453. Consultado el 20 de diciembre de 2020.