Secuencia de ADN

De Wikipedia, la enciclopedia libre
Saltar a: navegación, búsqueda
Electroferograma de un secuenciador automatizado mostrando parte de una secuencia de ADN.

Una secuencia de ADN o secuencia genética es una sucesión de letras representando la estructura primaria de una molécula real o hipotética de ADN o banda, con la capacidad de transportar información.

Las posibles letras son A, C, G, y T, que simbolizan las cuatro subunidades de nucleótidos de una banda ADN - adenina, citosina, guanina, timina, que son bases covalentemente ligadas a cadenas fosfóricas. En el típico caso, las secuencias se presentan pegadas unas a las otras, sin espacios, como en la secuencia AAAGTCTGAC, yendo de 5' a 3' de izq. a derecha.

Una sucesión de cualquier número de nucleótidos mayor a cuatro es pasible de llamarse una secuencia. En relación a su función biológica, que puede depender del contexto, una secuencia puede tener sentido o antisentido, y ser tanto codificante o no codificante. Las secuencias de ADN pueden contener "ADN no codificante."

Las secuencias pueden derivarse de material biológico de descarte a través del proceso de secuenciación del ADN.

En algunos casos especiales, las letras seguidas de A, T, C, y G se presentan en una secuencia. Esas letras representan ambigüedad. De todas las moléculas muestreadas, hay más de una clase de nucleótidos en esa posición. Las reglas de la Unión Internacional de Química Pura y Aplicada (IUPAC) son las que siguen:

A = adenina
C = citosina
G = guanina
T = timina
R = G A (purina)
Y = T C (pirimidina, en inglés pyrimidine)
K = G T (ceto, en inglés keto)
M = A C (amino)
S = G C (enlaces fuertes, en inglés strong)
W = A T (enlaces débiles, en inglés weak)
B = G T C (cualquiera excepto A)
D = G A T (cualquiera excepto C)
H = A C T (cualquiera excepto G)
V = G C A (cualquiera excepto T)
N = A G C T (cualquiera)

Véase también[editar]

Enlaces externos[editar]