Teorema de muestreo de Nyquist-Shannon

De Wikipedia, la enciclopedia libre
Saltar a: navegación, búsqueda
Función de interpolación g(t) para Fs=44100 muestras por segundo (estándar CD-Audio). Excepto para t=0, el intervalo entre pasos por cero (líneas verticales verdes) representa el intervalo entre muestras (~22,68 µs para este ejemplo).

El teorema de muestreo de Nyquist-Shannon, también conocido como teorema de muestreo de Whittaker-Nyquist-Kotelnikov-Shannon, teorema de Nyquist, es un teorema fundamental de la teoría de la información, de especial interés en las telecomunicaciones.

Este teorema fue formulado en forma de conjetura por primera vez por Harry Nyquist en 1928 (Certain topics in telegraph transmission theory), y fue demostrado formalmente por Claude E. Shannon en 1949 (Communication in the presence of noise).

El teorema trata del muestreo, que no debe ser confundido o asociado con la cuantificación, proceso que sigue al de muestreo en la digitalización de una señal y que, al contrario del muestreo, no es reversible (se produce una pérdida de información en el proceso de cuantificación, incluso en el caso ideal teórico, que se traduce en una distorsión conocida como error o ruido de cuantificación y que establece un límite teórico superior a la relación señal-ruido). Dicho de otro modo, desde el punto de vista del teorema, las muestras discretas de una señal son valores exactos que aún no han sufrido redondeo o truncamiento alguno sobre una precisión determinada, es decir, aún no han sido cuantificadas.

El teorema demuestra que la reconstrucción exacta de una señal periódica continua en banda base a partir de sus muestras, es matemáticamente posible si la señal está limitada en banda y la tasa de muestreo es superior al doble de su ancho de banda.

Dicho de otro modo, la información completa de la señal analógica original que cumple el criterio anterior está descrita por la serie total de muestras que resultaron del proceso de muestreo. No hay nada, por tanto, de la evolución de la señal entre muestras que no esté perfectamente definido por la serie total de muestras.

Si la frecuencia más alta contenida en una señal analógica x_a(t) \,\! es F_{max}=B \,\! y la señal se muestrea a una tasa F_s>2F_{max} \equiv 2B \,\!, entonces x_a(t) \,\! se puede recuperar totalmente a partir de sus muestras mediante la siguiente función de interpolación:

g(t) = \frac{\sin 2 \pi B t}{2 \pi B t}  \,\!

Ejemplo de reconstrucción de una señal de 14,7 kHz (línea gris discontinua) con sólo cinco muestras. Cada ciclo se compone de sólo 3 muestras a 44100 muestras por segundo. La reconstrucción teórica resulta de la suma ponderada de la función de interpolación g(t) y sus versiones correspondientes desplazadas en el tiempo g(t-nT) con -\infty < n < \infty \,\!, donde los coeficientes de ponderación son las muestras x(n). En esta imagen cada función de interpolación está representada con un color (en total, cinco) y están ponderadas al valor de su correspondiente muestra (el máximo de cada función pasa por un punto azul que representa la muestra).

Así, x_a(t) \,\! se puede expresar como:

x_a(t) = \sum_{n=-\infty}^{\infty} x_a \left(\frac{n}{F_s}\right) g \left(t-\frac{n}{F_s}\right)

donde x_a \left(\frac{n}{F_s}\right)= x_a \left(nT\right) \equiv x \left(n\right) son las muestras de x_a \left(t\right).

Hay que notar que el concepto de ancho de banda no necesariamente es sinónimo del valor de la frecuencia más alta en la señal de interés. A las señales para las cuales esto sí es cierto se les llama señales de banda base, y no todas las señales comparten tal característica (por ejemplo, las ondas de radio en frecuencia modulada).

Si el criterio no es satisfecho, existirán frecuencias cuyo muestreo coincide con otras (el llamado aliasing).

Errores de interpretación frecuentes en relación con el teorema y el proceso de muestreo[editar]

Es un error frecuente y extendido creer que, una vez satisfechos los criterios del teorema (criterios de Nyquist), la calidad de la reconstrucción de una señal en toda su banda es función de la tasa de muestreo empleada en el proceso de muestreo (lo que excluye el uso de técnicas de Noise Shaping para alterar selectivamente la distorsión consecuencia del proceso de cuantificación en señales completamente digitalizadas, esto es, muestreadas y cuantificadas). Esto es totalmente falso desde la perspectiva matemática del teorema y un error, una vez consideradas las limitaciones prácticas, en el ámbito práctico de la física o la ingeniería.[1] El proceso de muestreo (que no debe ser confundido con el de cuantificación) es, desde el punto de vista matemático perfectamente reversible, esto es, su reconstrucción es exacta, no aproximada. Dicho de otro modo, desde el punto de vista matemático al que se refiere el teorema de muestreo de Nyquist-Shannon, la reconstrucción de una señal periódica con componentes de hasta 10 kHz es idéntica tanto si se obtiene de una tasa de muestreo de 25000 muestras por segundo como de una de 50000 muestras por segundo. Matemáticamente, no aporta nada incrementar la tasa de muestreo una vez que esta cumple el criterio de Nyquist: la información necesaria para su reconstrucción total existe desde que la tasa cumple el criterio. También son errores frecuentes y extendidos, relacionados directamente con lo expuesto en este párrafo, creer que los puntos que resultan del proceso de muestreo se unen en la reconstrucción mediante rectas (interpolación lineal) formando dientes de sierra en las frecuencias representadas por pocas muestras o que existe un proceso de cálculo que realiza la interpolación de manera predictiva. En resumen, el teorema de muestreo demuestra que toda la información de una señal contenida en el intervalo temporal entre dos muestras cualesquiera está descrita por la serie total de muestras siempre que la señal registrada sea de naturaleza periódica (como lo es el sonido) y no tenga componentes de frecuencia igual o superior a la mitad de la tasa de muestreo; no es necesario inventar o predecir la evolución de la señal entre muestras.

En la práctica y dado que no existen los filtros analógicos pasa-bajo ideales, se debe dejar un margen entre la frecuencia máxima que se desea registrar y la frecuencia de Nyquist (frecuencia crítica) que resulta de la tasa de muestreo elegida (por ejemplo, para CD-Audio la frecuencia máxima de los componentes a registrar y reproducir es de 20 kHz y la frecuencia crítica de la tasa de 44100 muestras por segundo empleada es de 22,05 kHz; un margen del 10% aproximadamente para esta aplicación). Pero este margen es una necesidad que resulta de las limitaciones físicas de un filtro de reconstrucción (o filtro antialiasing) real, y no una consideración que contemple (o deba contemplar) el teorema, que pretende establecer el marco teórico (matemático) en el que se deben fundamentar los profesionales que tratan con el procesamiento digital de señales. En ocasiones se emplean técnicas de sobremuestreo para la reconstrucción de una señal con objeto de aumentar artificialmente este margen y permitir el uso de filtros de fase lineal (retardo de grupo constante) en la banda pasante y, en general, más sencillos y económicos con pendientes de atenuación más suaves. En todo caso, tanto el margen como el uso de técnicas de sobremuestreo son recursos de ingeniería para tratar restricciones prácticas que en nada invalidan la demostración y el contenido del teorema. El teorema es, de hecho, el marco analítico sobre el que las restricciones reales (no ideales) deben ser estudiadas.

Nuevos formatos y su relación con las interpretaciones erróneas sobre el teorema y su utilidad práctica[editar]

La aparición reciente de nuevos formatos de audio (denominados frecuentemente formatos de alta resolución) para usuario final que contienen señales muestreadas con tasas más elevadas a la empleada en CD-Audio han contribuido a extender la idea errónea de que la calidad en la reconstrucción de una señal en toda su banda (hasta la frecuencia crítica) es función directa de la tasa de muestreo empleada. En todo caso, parece evidente que el potencial para registrar y reproducir ultrasonidos no forma parte de los mensajes de mercadotecnia que pretenden promocionar estos en el mercado. Un argumento que suele tener la forma general de "si los nuevos formatos de alta resolución registran señales con tasas de muestreo más elevadas para la reconstrucción de señales con el mismo ancho de banda es porque el teorema de muestreo no aplica/no es válido/es erróneo y esta mayor tasa contribuye a una mejora en la calidad".

Los nuevos formatos de audio que recientemente han aparecido (aunque con escaso éxito comercial) que emplean Modulación por impulsos codificados (PCM) sin pérdida por compresión con tasas de muestreo más altas a las empleadas en el CD-Audio, (DVD-Audio, por ejemplo) para registrar y reproducir señales de idéntico ancho de banda se justifican porque permiten el empleo de filtros de reconstrucción más benignos, sencillos y económicos sacrificando un recurso cada vez más económico y de menor trascendencia (la capacidad de almacenamiento, un recurso crítico en el pasado) y porque, además, satisfacen simultáneamente las expectativas de un mercado como el audiófilo, caracterizado por dogmas[2] entre los que se encuentra muy extendida la falsa creencia de que esto representa una mejora en la calidad de la señal reconstruida (en particular, de sus componentes de alta frecuencia). Este error es sólo una consecuencia de una clara incomprensión del alcance y significado del teorema de muestreo y de establecer comparaciones falaces como, por ejemplo, con la digitalización de imágenes (donde no se realiza la reconstrucción de una señal periódica), etc.

La elevada tasa de muestreo de otro formato de audio de reciente aparición, el SACD o Super Audio CD, es una consecuencia del uso de una tecnología denominada comercialmente Direct Stream Digital™ (DSD) basada en un tipo de codificación digital denominado Modulación por densidad de impulsos (PDM). Si bien la tasa de muestreo es 64 veces la del CD-Audio, es necesario tener presente que se trata de una cuantificación de 1 bit (en lugar de los 16 empleados en el CD-Audio) y basado en técnicas de Noise Shaping (modelado de ruido). No es posible, por tanto, establecer comparaciones superficiales con el PCM de CD-Audio o DVD-Audio (ambos PCM), ya que en este caso la relación señal-ruido no es constante respecto de la frecuencia[3] (en CD-Audio el ruido de cuantificación es independiente de la frecuencia y sólo depende de los intervalos de amplitud empleados en el proceso de cuantificación, es decir, es de unos 98,09 dB[4] constantes para los 16 bits de este estándar CD-Audio en todo el espectro útil). Un SACD puede registrar y reproducir señales con componentes de hasta 33 kHz con una relación señal-ruido equivalente al de un CD-Audio (aunque 33 kHz está casi una octava por encima del máximo audible y, por tanto, una ventaja sobre el CD-Audio de dudosa utilidad práctica) y mantener una relación señal-ruido de aproximadamente 122 dB para el espectro audible (un potencial, el equivalente aproximado a 20 bits, también de dudosa utilidad práctica como formato final de usuario considerando los medios y entornos de reproducción de este formato).

Entre las ventajas objetivas de estos formatos (DVD-Audio y SACD) se encuentra el potencial multicanal (registro de más de dos canales) y la capacidad para el empleo de técnicas de protección de copia (algo de extraordinario interés para las compañías discográficas y, probablemente, la auténtica justificación industrial y comercial de estos productos junto con el evidente beneficio resultante de la sustitución de todos los equipos reproductores y grabadores del mundo).

Se han publicado trabajos experimentales rigurosos[5] que concluyen que no existen diferencias audibles entre los formatos denominados de alta resolución y el tradicional soporte de audio digital CD-Audio (PCM 16 bits;44100 muestras/s).

Asimismo, también se han probado indistinguibles entre sí los formatos de alta resolución SACD y DVD-Audio.[6] [7]

Bibliografía[editar]

  • H. Nyquist, "Certain topics in telegraph transmission theory," Trans. AIEE, volumen 47, páginas 617-644, abril de 1928.
  • C. E. Shannon, "Communication in the presence of noise," Proc. Institute of Radio Engineers, volumen 37, no.1, páginas 10-21, enero de 1949.

Referencias[editar]

  1. Teoría de muestreo (Dan Lavry de Lavry Engineering, Inc.): Por qué más no es mejor. (inglés)
  2. Embedded Signal Processing Laboratory (University of Texas at Austin): Debunking Audio Myths Desenmascarando los mitos del audio (inglés). Véase "Mito 4: Necesitamos 96 kHz, no, mejor 192 kHz".
  3. «Super Audio Compact Disc: A Technical Proposal». Philips/Sony (1997).
  4. Cálculo de la relación señal-ruido.
  5. Meyer, Brad (2007). «Audibility of a CD-Standard A/D/A Loop Inserted into High-Resolution Audio Playback». Journal of the Audio Engineering Society (Engineering Reports).
  6. Blech, Dominik (2004). «DVD-Audio versus SACD: Perceptual Discrimination of Digital Audio Coding Formats». Audio Engineering Society Electronic Library.
  7. Blech, Dominik (2004). «DVD-Audio versus SACD: Perceptual Discrimination of Digital Audio Coding Formats». Audio Engineering Society Electronic Library.

Bibliografía[editar]

Sampling Theory.

Véase también[editar]

Enlaces externos[editar]