Marcador de secuencia expresada

De Wikipedia, la enciclopedia libre
Saltar a: navegación, búsqueda

Un marcador de secuencia expresada o EST (acrónimo del inglés expressed sequence tag) es una pequeña subsecuencia de una secuencia nucleotídica transcrita (codificante de una proteína o no). Se pueden usar para identificar genes que se transcriben y en el descubrimiento de genes, y para determinación de secuencias.[1] La identificación de los EST ha progresado rápidamente, con aproximadamente 52 millones de ESTs disponibles en las bases públicas (por ejemplo GenBank mayo de 2008, todas las especies).

Los EST son producidos por una ejecución de secuenciación sobre un ARNm clonado (por ejemplo secuenciando varios cientos de pares de bases de un extremo de un clon de ADNc tomado de una biblioteca de ADNc). La secuencia resultante es un fragmento de baja calidad, generalmente de 500 a 800 nucleótidos, que es la longitud de secuenciación de los secuenciadores automáticos más habituales. Como esos clones consisten en ADN, que es complementario al ARNm, los EST representan porciones de genes expresados. Se puede presentar en las bases de datos tanto como secuencia de ADNc/ARNm o complemento reverso de ARNm, la cadena molde.

Los EST pueden asignarse a ubicaciones específicas del cromosoma utilizando técnicas de mapeo físico, tales como el mapeo híbrido por radiación o la hibridación fluorescente in situ (FISH). Por otra parte, si el genoma del organismo del cual se obtuvo la EST se ha secuenciado se pueden alinear las secuencias EST con este genoma. El entendimiento actual de los genes del genoma humano (2006) incluye la existencia de miles de genes basados solamente en evidencia de EST.

En este sentido, los EST se convierten en un instrumento para afinar la transcripciones predichas de esos genes, lo que lleva a la predicción de sus productos proteicos, y finalmente, de su función. Además, la situación en la que se obtienen los EST (tejido, órgano, estado de enfermedad —por ejemplo, cáncer—) proporciona información sobre las condiciones en las que el gen correspondiente está actuando. Los EST contienen suficiente información para permitir el diseño de sondas precisas para chips de ADN que luego se pueden utilizar para determinar la expresión de genes.

Algunos autores usan el término «EST» para describir genes de los que no se tiene mucha información.[2]

Una revisión de la importancia de EST, sus propiedades, métodos para analizarlos y sus aplicaciones en distintas áreas de la biología están analizados en este artículo.[3]

Fuentes de los datos y anotaciones[editar]

dbEST[editar]

dbEST es una división de GenBank creada en 1992. Como GenBank, los datos en la dbEST son enviados por lo laborarios del mundo y no está curada (corregida).

Uno de los objetivos de la bases de datos de EST es organizar y consolidar los datos de EST en gran medida redundantes, para mejorar la calidad de la información de secuencias y que los datos puedan ser utilizados para extraer el ADNc de longitud completa.

Es uno de los enfoques de alto rendimiento es la secuenciación de etiquetas de secuencias expresadas. Son secuencias cortas obtenidas a partir de clones de ADN complementario y sirven como identificadores cortos de genes, típicamente estan en el rango de 200 a 400 nucleótidos de longitud obtenidos a partir de ya sea el extremo 5’ o 3’ de los insertos de ADNc.

Los datos de EST son capaces de proporcionar una estimación aproximada de los genes que se expresan de forma activa en un genoma bajo una condición fisiológica en particular. Las secuencias EST suelen ser de baja calidad, ya que se generan de forma automática y sin verificación; y por lo tanto contienen altos porcentajes de errores. Muchas bases son determinadas como ambiguas y representadas por N. Otro problema de las EST es la presencia de clones quiméricos debido a artefactos de clonación en la construcción de la biblioteca, en la que más de una transcripción se liga a un clon resultante del extremo 5’ de un gen y el extremo 3’ de otro gen. Se ha estimado que hasta el 11 % de los clones de ADNc pueden ser quiméricos.



Referencias[editar]

  1. Adams MD, Kelley JM, Gocayne JD, Dubnick M, Polymeropoulos MH, Xiao H, Merril CR, Wu A, Olde B, Moreno RF, et al. Complementary DNA sequencing: expressed sequence tags and human genome project. Science. 1991 Jun 21;252(5013):1651-6. PMID:2047873
  2. dbEST
  3. Nagaraj, Shivashankar H, Gasser, Robin B, and Ranganathan, Shoba. A hitchhiker's guide to expressed sequence tag (EST) analysis. Brief Bioinform 8 (2007 Jan): 6-21. article

Enlaces externos[editar]