Post on 23-Jan-2016
Detección de Silencio Basado en Umbral de Energía Auto-Ajustable
Redes de Alta Velocidad
Presentan: Felipe Galaz
Cristian Romero
Profesora: Marta Barría
Resumen de la Presentación:
Descripción del Problema.Mediciones de Tasa de Cruzamiento por
Cero, y Energía.Descripción del Algoritmo Propuesto.Detalles de la Implementación.Resultados Obtenidos.
Descripción del Problema:
Se dispone de una señal de voz, y se desea implementar un algoritmo capaz de detectar los instantes de silencio.
Mediciones de Tasa de Cruzamiento por Cero, y Energía.
Descripción del Algoritmo Propuesto.
Se trabajará con el problema inverso, es decir, detectar voz (sonido), no silencio. Por ende, todo lo que no sea voz (sonido), será considerado silencio.
Se utilizará un frame, de tamaño específico (tiempo o bytes) y se determinará si dicho frame corresponde a un frame de voz o de silencio.
Se trabajará en base a la energía de cada frame. Es necesario determinar el umbral de energía de voz.
Se desea detectar la mayor cantidad de silencio posible sin distorsionar la señal original.
Descripción del Algoritmo Propuesto.
¿Donde ubicar el Umbral?
Descripción del Algoritmo Propuesto.
Solución: Umbral auto-ajustable. Inicialmente, el umbral se ubica en 0 (Todo es
considerado voz). Si la señal es mayor que el umbral, este aumenta en
una unidad. Si la señal es menor que el umbral, este disminuye en
una unidad. Como resultado, luego de un tiempo, el umbral se
habrá ubicado cerca del 50% de la señal. Si además se varía el incremento hacia arriba,
respecto del incremento hacia abajo, es posible ubicar el umbral en cualquier nivel de la señal.
Descripción del Algoritmo Propuesto.
Ejemplo sencillo 50%:
Descripción del Algoritmo Propuesto.
Problemas si el umbral varía muy rápido:
Detalles de la Implementación:
Es necesario conocer la tasa de muestro de la señal, el rango de amplitud, y el piso de ruido.
Para los ejemplo que se presentan a continuación la voz se ha muestreado a 22,5[KHz] utilizando 16[bits] para cuantizar la señal en un rango de amplitud desde -1 a 1 (Parámetros por omisión de formato Wav, Grabadora de Windows). Como piso de ruido se ha seleccionado un nivel de 5·10-3
Detalles de la Implementación:
Se trabajará con frames de 256 muestras, lo cual en tiempo equivale a:
][1122500
256ºms
MuestreoFrecuencia
MuestrasNameDuraciónFr
Detalles de la Implementación:
Se desea ubicar el umbral en las cercanías del 30% de la señal. (según © Biopsychology.org, 1998-2006 el porcentaje de silencio de una conversación es cercano al 30%)
Además la frecuencia de variación máxima del umbral debe ser menor que la frecuencia de la voz.
Detalles de la Implementación:
Por ejemplo, el umbral varía +0,0003 o -0,0007 dependiendo de si está por sobre o por debajo de la señal respectivamente:
Con esto la posicion del umbral aproximada, y la velocidad de cambio del umbral quedan determinados por:
][75,1522500·0007,0
%300007,00003,0
0003,0
HzmbralciaCambioUMaxFrecuen
bralPosicionUm
Detalles de la Implementación:
Se calcula un valor proporcional a la energía del frame.
El umbral de energía está dado por la ubicación del umbral de la señal, multiplicado por la duración del frame.
ralEnergíaUmbmeEnergíaFraSilencio
ralEnergiaUmbmeEnergíaFraVoz
Frame
rFrameMuestrasPoNlUmbralSeñakgíaUmbralEner
XikmeEnergíaFraFramei
º··
·
Detalles de la Implementación:
Detalles de la Implementación:
Detalles de la Implementación:
Resultados Obtenidos:
Con Reproducciónde Silencio
Sin Reproducciónde Silencio
Resultados Obtenidos:
Con Reproducciónde Silencio
Sin Reproducciónde Silencio
Resultados Obtenidos:
Con Reproducciónde Silencio
Sin Reproducciónde Silencio
Resultados Obtenidos:
Con Reproducciónde Silencio
Sin Reproducciónde Silencio
Resultados Obtenidos:
Con Reproducciónde Silencio
Sin Reproducciónde Silencio
Resultados Obtenidos:
Se estudiaron los efectos de cambiar el tamaño del frame:
Conclusiones:
Se logró implementar un algoritmo de detección de silencio, independiente de los niveles de potencia de la señal a procesar.
El algoritmo funciona razonablemente bien, y puede ser configurado de acuerdo a las necesidades requeridas.
Bibliografía:
© Biopsychology.org, 1998-2006 http://www.biopsychology.org/tesis_esteve/privgen/privgen.htm
MATLAB® Featured Productshttp://www.mathworks.com/