Ley Mu

De Wikipedia, la enciclopedia libre
Saltar a: navegación, búsqueda
Comparación de la compansión (compresión-expansión) de los algoritmos Ley-μ (Ley Mu) y Ley-A

El algoritmo Ley μ o Ley Mu es un sistema de cuantificación logarítmica de una señal de audio. Es utilizado principalmente para audio de voz humana dado que explota las características de ésta. El nombre de Ley μ proviene del término original inglés "µ-law", que usa la letra griega µ (Mu). Su aplicación cubre el campo de comunicaciones telefónicas. Este sistema de codificación es usado en Estados Unidos y Japón, mientras que en Europa se utiliza un sistema muy parecido llamado ley A.

Tipos de algoritmos[editar]

Existen dos tipos de algoritmos de Ley-Mu: una versión analógica y otra digital cuantizada.

Versión analógica[editar]

Para una entrada determinada, la ecuación para la codificación según la Ley Mu es: [1]

en la cual:

: (8 bits) es el estándar usado en Norteamérica y Japón.
: es la función signo.

En el receptor, la expansión analógica viene dada por la inversa de la ecuación anterior:

Versión digital[editar]

La Ley Mu en su forma cuantizada digital está definida en la Recomendación G.711 de la UIT-T[2] . Sin embargo, esta recomendación es poco clara acerca de cómo codificar los valores en el límite de un rango (por ejemplo, si a +31 le corresponde el número hexadecimal 0xEF o el 0xF0). Sin embargo, la Recomendación G.191[3] ofrece un ejemplo de código en lenguaje C para un codificador de Ley Mu lo que proporciona la codificación de la tabla adjunta a esta sección, en la cual los valores del código comprimido se expresan en forma hexadecimal. Se debe tener en cuenta la diferencia entre los rangos positivos y negativos, por ejemplo, el rango negativo correspondiente a +30 a +1 es -31 a -2. Esto se explica por el uso de complemento a 1 (simple inversión de bits) en lugar de complemento a 2 para convertir un valor negativo a un valor positivo durante la codificación.

Algoritmo Cuantizado de Ley Mu
Código de entrada lineal binario de 14 bits Código Comprimido de 8 bits
+8158 to +4063 en 16 intervalos de 256 0x80 + número de intervalo
+4062 to +2015 en 16 intervalos de 128 0x90 + número de intervalo
+2014 to +991 en 16 intervalos de 64 0xA0 + número de intervalo
+990 to +479 en 16 intervalos de 32 0xB0 + número de intervalo
+478 to +223 en 16 intervalos de 16 0xC0 + número de intervalo
+222 to +95 en 16 intervalos de 8 0xD0 + número de intervalo
+94 to +31 en 16 intervalos de 4 0xE0 + número de intervalo
+30 to +1 en 15 intervalos de 2 0xF0 + número de intervalo
0 0xFF
−1 0x7F
−31 to −2 en 15 intervalos de 2 0x70 + número de intervalo
−95 to −32 en 16 intervalos de 4 0x60 + número de intervalo
−223 to −96 en 16 intervalos de 8 0x50 + número de intervalo
−479 to −224 en 16 intervalos de 16 0x40 + número de intervalo
−991 to −480 en 16 intervalos de 32 0x30 + número de intervalo
−2015 to −992 en 16 intervalos de 64 0x20 + número de intervalo
−4063 to −2016 en 16 intervalos de 128 0x10 + número de intervalo
−8159 to −4064 en 16 intervalos de 256 0x00 + número de intervalo

Características básicas de la Ley μ[editar]

  • Es un algoritmo estandarizado, definido en el estándar ITU-T G.711
  • Tiene una complejidad muy baja
  • Utilizado en aplicaciones de voz humana
  • No introduce prácticamente retardo algorítmico (dada su baja complejidad)
  • Es adecuado para sistemas de transmisión TDM
  • No es adecuado para la transmisión por paquetes
  • Factor de compresión aproximadamente de 2:1

Digitalmente, el algoritmo ley μ es un sistema de compresión con pérdida en comparación con la codificación lineal normal. Esto significa que al recuperar la señal, ésta no será exactamente igual a la original.

Planteamiento del algoritmo[editar]

Este algoritmo se utiliza principalmente para la codificación de voz humana, ya que su funcionamiento explota las características de esta. Las señales de voz están formadas en gran parte por amplitudes pequeñas, ya que son las más importantes para la percepción del habla, por lo tanto estas son muy probables. En cambio, las amplitudes grandes no aparecen tanto, por lo tanto tienen una probabilidad de aparición muy baja.

En el caso de que una señal de audio tuviera una probabilidad de aparición de todos los niveles de amplitud por igual, la cuantificación ideal sería la uniforme, pero en el caso de la voz humana esto no ocurre, estadísticamente aparecen con mucha más frecuencia niveles bajos de amplitud.

El algoritmo de Ley Mu explota el factor de que los altos niveles de amplitud no necesitan tanta resolución como los bajos. Por lo tanto, si se suministran más niveles de cuantificación a las bajas amplitudes y menos a las altas se consigue más resolución, un error de cuantificación inferior y por lo tanto una relación señal/ruido (SNR) superior que si se hiciera directamente una cuantificación uniforme para todos los niveles de la señal.

Esto provoca que si para una determinada SNR se necesitan, por ejemplo, 16 bits usando una cuantificación uniforme, para la misma SNR usando la codificación Ley μ se requieren 8 bits, dado que el error de cuantificación es menor.

Implementación[editar]

Existen tres formas de implementar el algoritmo de la Ley Mu:

  1. Analógica: Usa un amplificador de ganancia no-lineal para lograr la compansión completamente en el dominio analógico.
  2. Conversión de Analógico a Digital No lineal: En este caso, la amplificación es lineal y se usaría un convertidor analógico-digital con niveles desiguales de cuantificación que se ajustan a la tabla descrita. Sin embargo, construir tal convertidor es difícil. [4]
  3. Digital: La señal de entrada es muestreada y cuantificada de modo lineal, y el código lineal es comprimido convirtiendo el código de 12 o 14 bits en 8 bits como se indica en la tabla de este artículo. En el extremo receptor se lleva a cabo la expansión digital respectiva.[4]

Funcionamiento[editar]

El algoritmo de Ley Mu basa su funcionamiento en un proceso de compresión y expansión llamado compansión. Se aplica una compresión/expansión de las amplitudes y posteriormente una cuantificación uniforme. Las amplitudes de la señal de audio pequeñas son expandidas y las amplitudes más elevadas son comprimidas.

El funcionamiento se basa en que cuando una señal pasa a través de un compansor, el intervalo de las amplitudes pequeñas de entrada es representado por un intervalo de cuantificación más grande en la salida, y el intervalo de las amplitudes más elevadas pasa a ser representado en un intervalo de cuantificación más pequeño en la salida, tal como se muestra en la figura anexa:

Representación de intervalos de cuantificación con el algoritmo de Ley Mu

Esta figura muestra que los valores de entrada (línea horizontal) contenidos en el intervalo [-0.2,+0.2] (amplitudes pequeñas) están representados en la salida (línea vertical) en el intervalo [-0.6,0.6], por lo que se constata que hay una expansión digital. Por otra parte, los valores de entrada contenidos en los intervalos [-1,-0,6] y [+0.6,+1] son representados en la salida en los intervalos [-0.9,-1] y [+0.9,+1], lo que representa una compresión digital.

Digitalmente, este esquema es equivalente a aplicar una cuantificación no uniforme (logarítmica) a la señal original, en la cual existen pequeños pasos de cuantificación para los valores pequeños de amplitud y pasos de cuantificación grandes para los valores grandes de amplitud. Para recuperar la señal en el destino, se aplica la función inversa.

Por lo tanto, la implementación del sistema consiste en aplicar a la señal de entrada una función logarítmica y una vez procesada, realizar una cuantificación uniforme. Es lo mismo que decir que el paso de cuantificación sigue una función del tipo logarítmico.

Véase también[editar]

Referencias[editar]

  1. «Waveform Coding Techniques» (en inglés). Cisco Systems. Consultado el 17 de agosto de 2016. 
  2. «Recomendación UIT-T G.711: Modulación por impulsos codificados (MIC) de frecuencias vocales». Unión Internacional de Telecomunicaciones. Consultado el 17 de agosto de 2016. 
  3. «G.711: The ITU-T 64 kbit/s log-PCM algorithm». ITU-T Software Tool Library 2009 User’s Manual (en inglés). Ginebra, Suiza: Unión Internacional de Telecomunicaciones. 30 de noviembre de 2009. p. 21. Consultado el 17 de agosto de 2016. 
  4. a b Tomasi, Wayne (2003). «Capítulo 15: Transmisión digital». En Guillermo Trujano Mendoza. Sistemas de Comunicaciones Electronicas. Pearson Educación. ISBN 970-26-0316-1.