Bandas críticas

De Wikipedia, la enciclopedia libre
Saltar a: navegación, búsqueda

En audiología y psicoacústica, el concepto de las bandas críticas, introducido por Harvey Fletcher en 1933[1] y refinado en 1940,[2] describe el ancho de banda de frecuencia del "filtro auditivo " creado por la cóclea, el órgano del sentido de la audición dentro del oído interno. Aproximadamente, la banda crítica es la banda de frecuencias audibles dentro de la cual un segundo tono interferirá con la percepción del primero por medio del enmascaramiento sonoro.

De manera psicofisiológica, las sensaciones de batimiento y aspereza sonora pueden ser relacionadas con la inhabilidad del mecanismo de análisis de frecuencia auditivo para descifrar las señales de entrada cuya diferencia de frecuencia es más pequeña que el ancho de banda crítico y el "cosquilleo" irregular resultante[3] del sistema mecánico (membrana basilar) que resuene en respuesta a tales entradas. Las bandas críticas también están íntimamente relacionadas con el fenómeno del enmascaramiento sonoro, la audibilidad reducida de una señal de sonido cuando está en presencia de una segunda de intensidad más alta dentro de la misma banda crítica. El fenómeno de enmascaramiento tiene implicaciones amplias, abarcando desde una relación compleja entre la volumen (marco de referencia perceptivo) hasta los algoritmos de compresión del sonido.

Filtros auditivos[editar]

Los filtros son usados en muchos aspectos de la audiología y la psicoacústica, incluyendo al sistema auditivo periférico. Un filtro es un dispositivo que aumenta ciertas frecuencias y atenúa otras. En particular, un filtro paso banda permite que un un rango de frecuencias dentro del ancho de banda pase a través de éste, mientras que excluye aquellas fuera de las frecuencias de corte.[4]

Un filtro paso banda mostrando la frecuencia central (Fc), las frecuencias de corte baja(F1) y alta(F2), así como el ancho de banda. Las frecuncias de corte baja y alta se definen como el punto donde la amplitud decae 3dBs debajo de la amplitud pico. El ancho de banda es la distancia entre las frecuencias de corte baja y alta, y es el rango de frecuencias pasadas por el filtro.

La forma y organización de la membrana basilar implica que las diferentes frecuencias resuenan particularmente fuerte en puntos diferentes a lo largo de la misma. Esto lleva a una organización tonotópica de la sensibilidad de los rangos de frecuencia a lo largo de la membrana, los cuales pueden ser modelados como un arreglo de filtros paso banda superpuestos conocidos como "filtros auditivos".[5] Los filtros auditivos se asocian con puntos a lo largo de la membrana basilar y determinan la selectividad de frecuencias en la cóclea, por lo tanto, la discriminación del oyente entre los diferentes sonidos.[4] [6] Éstos son no lineales, dependientes del nivel y disminuyen de la base al ápice de la cóclea a medida que la afinación de membrana basilar cambia de frecuencia alta a baja.[4] [6] [7] El ancho de banda del filtro auditivo se llama banda crítica, como sugirió por primera vez Fletcher (1940). Si una señal y enmascaramiento se presentan de manera simultánea, entonces sólo las frecuencias enmascaradas, caen dentro de la banda crítica y contribuyen a enmascarar la señal. Entre más grande sea la banda crítica, más baja es la relación señal/ruido (SNR por sus siglas de inglés) y más grande el enmascaramiento de la señal.

Figura 2: El ERB relacionado con la frecuencia central. El diagrama muestra al ERB contra frecuencia central, de acuerdo con la fórmula de Glasberg y Moore.[6]

Otro concepto asociado con el filtro auditivo es el ancho de banda rectangular equivalente (ERB por sus siglas en inglés). El ERB muestra la relación entre el filtro auditivo, la frecuencia y el ancho de banda crítico. Un ERB pasa la misma cantidad de energía que el filtro auditivo que le corresponde y muestra como cambia en relación a la frecuencia de entrada.[4] [6] A niveles bajos de sonido. De acuerdo con Glasberg y Moore, el ERB es aproximado por la siguiente ecuación:[6]

ERB(f) = 24.7 * (4.37 f / 1000 + 1)

Donde el ERB es en Hz y f es la frecuencia central en Hz.

Se cree que cada valor del ERB es el equivalente de alrededor de 0.9mm en la membrana basilar.[6] [7] El ERB puede ser convertido en una escala que se relaciona con la frecuencia y muestra la posición del filtro auditivo a lo largo de la membrana basilar. Por ejemplo, un número ERB de 3.36 corresponde a una frecuencia en el extremo apical de la membrana basilar, mientras que un número ERB de 38.9 corresponde a la base y un valor de 19.5 cae a la mitad de los dos.[6]

Un tipo de filtro usado para modelar los filtros auditivos es el filtro gammatone. Este proporciona un filtro lineal simple, el cual es, por tanto, fácil de implementar, pero no puede considerar por sí mismo aspectos no lineales del sistema auditivo; sin embargo, es usado en una variedad de modelos del sistema auditivo. Las variaciones y mejoramientos del modelo gammatone de filtro auditivo incluyen al filtro gammachirp, los filtros gammatone "all-pole" y "one-zero", el filtro gammatone de dos lados, los modelos de filtros en cascada y varias versiones dinamicamente no lineales de estos.[8]

Curvas de afinación psicoacústica[editar]

Las forms de los filtros auditivos se encuentran por el análisis de la afinación psicoacústica, las cuales son gráficas que muestran el umbral para la detención de un tono como función de los parámetros del enmascarador.[9]

Las curvas de afinación psicoacústica pueden ser medidas usando el método de corte-ruido. Esta forma de medición puede tomar considerable cantidad de tiempo, durando alrededor de 30 minutos para encontrar cada umbral de emascaramiento.[10] En el método de corte-ruido al sujeto se le presenta un ruido cortado como el enmascarador de una onda sinusoidal (tono puro) como la señal. El ruido cortado es usado como un enmascarador para prevenir que el sujeto escuche pulsaciones que ocurren si una onda sinusoidal es usada para enmascarar.[7] El ruido cortado es aquel con un hueco alrededor de la frecuencia de la señal que el sujeto intenta detectar, y contiene ruido con cierto ancho de cierto ancho de banda. El ancho de banda del ruido cambia y los umbrales enmascarados para la sinusoidal se miden. Los umbrales enmascarados se calculan a través de enmascaramiento simultaneo cuando la señal es ejecutada al sujeto al mismo tiempo que enmascarador y no después.

Para obtener una representación real de los filtros auditivos en un sujeto, muchas curvas de afinación psicoacústica necesitan ser calculadas con la señal a diferentes frecuencias. Para cada curva en medición, por lo menos cinco (aunque de preferencia entre trece y quince umbrales deben ser calculados, con diferentes anchos de corte.[10] Ademàs, un gran número de umbrales necesitan ser calculados debido a la asimetría de los filtros auditivos, y por tanto, los umbrales tambièn deberían ser medidos con el corte asimétrico a la frecuencia de la señal.[9] Debido a la variedad de mediciones necesarias, la cantidad de tiempo necesario para encontrar la forma de los filtros auditivos de la persona es muy largo. Para reducir la cantidad de tiempo necesario, el método ascendiente puede ser usado cuando se encuentran los umbrales enmascarados. Si el método ascendiente es usado para calcular el umbral, el tiempo necesario para calcular la forma del filtro es reducido dramaticamente, dado que toma alrededor de dos minutos para calcular el mismo.[10] Esto es porque el umbral es registrado cuando el sujeto escucha por primera vez el tono, en vez de cuando ellos responden a cierto nivel de estímulo en un ciero porcentaje de las veces.

Anatomía y fisiología de la membrana basilar[editar]

El oído humano está conformado de tres áreas: la externa, la media y el oído interno. Dentro del oído interno se sitúa la cóclea. La cóclea es una formación en forma de caracol que permite la transmisión de sonido a través de una ruta neurosensorial, en vez de un camino conductivo.[11] La cóclea es una estructura compleja, la cual consiste de tres capas de fluído. La rampa vestibular y la rampa media están separadas por la Membrana de Reissner, mientras que la rampa media y la rampa del tímpano se encuentran divididas por la membrana basilar .[11] El diagrama debajo ilustra el complejo diseño de los compartimientos y sus divisiones:[4]

La membrana basilar se abre conforme progresa de la base al ápice. Por tanto, la base (la parte más delgada) tiene una rigidez más grande que el ápice.[4] Esto significa que la amplitud de una onda viajando a través de una membrana basilar varía cuando viaja a través de la cóclea.[11] Cuando una vibración se transporta a través de la cóclea, el fluido dentro de los tres compartimentos causa que la membrana basilar responda de forma ondular. Esta vibración se conoce como "onda de viaje"; este término significa que la membrana basilar no vibra simplemente como una unidad de la base hacia el ápice.

Cuando un sonido se presenta al oído humano, el tiempo que toma a la onda viajar a través de la cóclea es de solo cinco milisegundos.[11]

Cuando las ondas de viaje de frecuencia baja viajan a través de la cóclea, la onda incrementa en amplitud gradualmente, y después decae casi instantaneamente. El lugar de la vibración en la cóclea depende de la frecuencia del estímulo presente. Por ejemplo, las frecuencias bajas estimulan principalmente el ápice, en comparación con las frecuencias más altas, las cuales estimulan la base de la cóclea. Éste atributo de la fisiología de la membrana basilar puede ser ilustrado en forma de un mapa de posición-frecuencia:[12]

Esquema simplificado de la membrana basilar, mostrando el cambio en la frecuencia característica de la base al ápice.

La membrana basilar soporta el Órgano de Corti, el cual se sienta dentro de la rampa media.[4] El Órgano de Corti comprime tanto las células ciliadas externas como las internas. Existen aproximadamente entre 15,000 y 16,000 de éstas en un oído.[11] Las células externas tienen estereocilios projectados hacia la membrana tectorial, la cual se sienta sobre el órgano de Corti. Los estereocilios responden al movimiento de la membrana tectorial cuando un sonido causa vibración a través de la cóclea. Cuando esto ocurre, lo estereocilios se separan y un canal es formado para permitir los procesos químicos que toman parte. Eventualmente, la señal alcanza el octavo nervio, seguida por el procesamiento en el cerebro.[11]

Relación con el enmascaramiento[editar]

Los filtros auditivos se encuentran íntimamente relacionados con el enmascaramiento en la forma en que son medidos y también en la forma en que funcionan en el sistema auditivo. Como se describió previamente, la banda crítica del filtro incrementa en tamaño con el el aumento de la frecuencia, y junto con esto el filtro se hace más asimétrico cuando el nivel aumenta.

Se cree que estas dos propiedades del filtro auditivo contribuyen a la propagación asecendente del enmascaramiento, lo cual significa que las frecuencias bajas enmascaran a las frecuencias altas mejor que lo contrario. Dado que incrementar el nivel hace que la pendiente en frecuencias bajas sea menor, por medio del aumento en amplitud, las frecuencias bajas enmascaran a las altas más que cuando el nivel de entrada es menor.

El filtro auditivo puede reducir los efectos de un enmascarador cuando se escucha una señal en ruido de fondo usando la "escucha fuera de frecuencia". Esto es posible cuando la frecuencia central del enmascarador es diferente que la de la señal. En la mayoría de las situaciones el oyente elige hacerlo "a través" del filtro auditivo que está centrado en la señal; sin embargo, si hay un enmascarador presente esto podría no ser apropiado. El filtro auditivo centrado en la señal podría también concener una larga cantidad del enmascarador, causando que el SNR del filtro sea bajo y disminuya la habillidad de la persona para detectar la señal. No obstante, si el oyente escucha por medio de un filtro ligeramente diferente que contuviera una cantidad substancial de la señal pero menos enmascarador, el SNR aumenta, permitiendo a la persona detectar la señal.[4]

El primer diagrama arriba muestra el filtro auditivo centrado en la señal y como algo del enmascarador cae dentro de dicho filtro. Esto resulta en una relación señal/ruido baja. El segundo diagrama muestra el siguiente filtro a lo largo de la membrana basilar, el cual no está centrado en la señal pero contiene una cantidad sustancial de señal y menos enmascarador. Esto reducir el efecto del enmascarador, al incrementar el SNR.

Lo anterior aplica para el modelo de espectro-potencia del enmascaramiento. En general, este modelo confía en el sistema auditivo como contenedor del arreglo de filtros auditivos y elector del filtro con la señal en su centro o con el mejor SNR. Solo el enmascardor que cae dentro del filtro auditivo contribuye al fenómeno y el umbral de la persona para escuchar la señal es determinada por ese enmascarador.[6]

Filtros auditivos normales y dañados[editar]

En un oído normal el filtro auditivo tiene una forma similar a la que se muestra abajo. Esta gráfica refleja la selectividad de frecuencia y la afinación de la membrana basilar.

La afinación de la membrana se debe a su estructura mecánica. En la base de la membrana basilar es estrecha y es más sensible a las frecuencias altas. Sin embargo, el ápice de la membrana es amplio y flexible, por lo cual es más sensible a las frecuencias bajas. Por lo tanto, diferentes secciones de la membrana basilar vibran dependiendo de la frecuencia del sonido y otorgan una respuesta máxima en esa frecuencia en particular.

Sin embargo, en un oído dañado el filtro auditivo tiene una forma diferente comparada con la de un oído normal.[13]

El filtro auditivo de un oído dañado es más plano y ancho, comparado con un oído normal. Esto es así porque la selectividad de frecuencias y la afinación de la membrana basilar son reducidas cuando las células ciliadas externas sufren daño. Cuando solo las células ciliadas externas se perjudican, el filtro es más ancho en el lado de las frecuencias bajas. Cuando tanto las células ciliadas externas e internas se dañan, el filtro es más amplio en ambos lados. Esto es menos común. El ensanchamiento del filtro auditivo se da principalmente en el lado de las frecuencias bajas del filtro. Esto incrementa la susceptibilidad del enmascaramiento en frecuencias bajas, ó sea, la extensión ascendente del enmascaramiento como se describió anteriormente.[6]

Véase también[editar]

Referencias[editar]

  1. https://archive.org/details/bstj12-4-377%7C Bell System Technical Journal, October 1933, "Loudness, its Definition, Measurement and Calculation"
  2. http://journals.aps.org/rmp/abstract/10.1103/RevModPhys.12.47#fulltext#fulltext%7C"Rev. Mod. Phys. 12, 47 (1940) - Auditory Patterns"
  3. Campbell, M.; Greated, C. (1987). The Musician's Guide to Acoustics. New York: Schirmer Books. ISBN 0-02-870161-5. 
  4. a b c d e f g h Gelfand, S. A. (2004). Hearing: an introduction to psychological and physiological acoustics (4th edición). New York: Marcel Dekker. ISBN 0-585-26606-9. 
  5. Munkong, R. (2008), IEEE Signal Processing Magazine 25 (3): 98-117, Bibcode:2008ISPM...25...98M, doi:10.1109/MSP.2008.918418 
  6. a b c d e f g h i Moore, B. C. J. (1998). Cochlear hearing loss. London: Whurr Publishers Ltd. ISBN 0-585-12256-3. 
  7. a b c Moore, B. C. J. (1986), «Parallels between frequency selectivity measured psychophysically and in cochlear mechanics», Scand. Audio Suppl. (25): 129-52 
  8. R. F. Lyon; A. G. Katsiamis; E. M. Drakakis (2010). «History and Future of Auditory Filter Models». Proc. ISCAS. IEEE. 
  9. a b Glasberg, B. R.; Moore, B. C. J. (1990), «Derivation of auditory filter shapes from notched-noise data», Hear. Res. (47): 103-138 
  10. a b c Nakaichi, T.; Watanuki, K.; Sakamoto, S. (2003), «A simplified measurement method of auditory filters for hearing impaired listeners», Acoust. Sci. and tech. 24 (6): 365-375 
  11. a b c d e f Plewes, K. (2006). Anatomy and physiology of the ear. 
  12. «Promenade 'round the Cochlea». 2003. 
  13. Moore, B. C. J. (2003). An introduction to the psychology of hearing (5th edición). San Diego, CA: Academic Press. ISBN 0-12-505627-3. 

Fletcher, H. (1940) ‘‘Auditory patterns,’’ Rev. Mod. Phys.12,47–65.

Enlaces externos[editar]

  • Vassilakis, P.N. and Fitz, K. (2007). SRA: A Web-based Research Tool for Spectral and Roughness Analysis of Sound Signals. Supported by a Northwest Academic Computing Consortium grant to J. Middleton, Eastern Washington University