Transformada de coseno discreta

De Wikipedia, la enciclopedia libre
Saltar a: navegación, búsqueda

La transformada de coseno discreta (DCT del inglés Discrete Cosine Transform) es una transformada basada en la Transformada de Fourier discreta, pero utilizando únicamente números reales.

Introducción[editar]

La Transformada de coseno discreta expresa una secuencia finita de varios puntos como resultado de la suma de distintas señales sinusoidales (con distintas frecuencias y amplitudes). Como la transformada discreta de Fourier (abreviada, DFT) la DCT trabaja con una serie de números finitos, pero mientras la DCT solo trabaja con cosenos la DFT lo hace con exponenciales complejos.

Concentración de energía de una DCT-II bidimensional comparada con una DFT.

Formalmente, la transformada de coseno discreta es una función lineal e invertible del dominio real RN al dominio real RN, que también se puede entender de forma equivalente a una matriz de NxN posiciones.

También existe la DCT multidimensional, que se puede considerar como la multiplicación separable de varias DCT. Por ejemplo la DCT de dos dimensiones es una transformada normal calculada por cada fila y columna.

Características útiles para la compresión de imágenes[editar]

  • La DCT tiene una buena capacidad de compactación de la energía al dominio transformado, es decir, que la transformada de coseno discreta consigue concentrar la mayor parte de la información en pocos coeficientes transformados tal y como muestra la imagen.
  • La transformación es independiente de los datos. El algoritmo aplicado no varia con los datos que recibe, como si sucede en otros algoritmos de compresión.
  • Hay fórmulas para el cálculo rápido del algoritmo, como podría ser la FFT para la DFT.
  • Produce pocos errores en los límites de los bloques imagen. La minimización de los errores a los bloques imagen permite reducir el efecto de bloque en la imágenes reconstruidas.
  • Tiene una interpretación frecuencial de los componentes transformados. La capacidad de interpretar los coeficientes en el punto de vista frecuencial permite aprovechar al máximo la capacidad de compresión.

Definición formal[editar]

Formalmente, la transformada de coseno discreta es una función lineal invertible f: \mathbb{R}^{N} \to \mathbb{R}^{N}, (donde \mathbb{R} denota el conjunto de los números reales), o en forma equivalente a una matriz cuadrada de N X N. Las variantes más usadas son la DCT-I y la DCT-II. La DCT-III se conoce popularmente como la IDCT (transformada inversa). Cada una de estas posibles variaciones es debida a la periodicidad y el tipo de simetría aplicada a las muestras originales.

DCT-I[editar]

f_j = \frac{1}{2} (x_0 + (-1)^j x_{n-1}) 
     + \sum_{k=1}^{n-2} x_k \cos \left[\frac{\pi}{n-1} nj  \right]

DCT-II[editar]

f_j =
   \sum_{k=0}^{n-1} x_k \cos \left[\frac{\pi}{n} j \left(k+\frac{1}{2}\right) \right]

Es la forma más típicamente utilizada

DCT-III[editar]

f_j = \frac{1}{2} x_0 +
   \sum_{k=1}^{n-1} x_k \cos \left[\frac{\pi}{n} \left(j+\frac{1}{2}\right) k \right]

DCT-IV[editar]

f_j =
   \sum_{k=0}^{n-1} x_k \cos \left[\frac{\pi}{n} \left(j+\frac{1}{2}\right) \left(k+\frac{1}{2}\right) \right]

DCT-V - VIII[editar]

También existen las DCT de la V a la VIII.

Aplicaciones[editar]

Algunas de las aplicaciones encima mencionadas utilizan una variante de la DCT que es la MDCT

Enlaces externos[editar]