Detección de Silencio Basado en Umbral de Energía Auto-Ajustable Redes de Alta Velocidad...

Post on 23-Jan-2016

224 views 0 download

Transcript of Detección de Silencio Basado en Umbral de Energía Auto-Ajustable Redes de Alta Velocidad...

Detección de Silencio Basado en Umbral de Energía Auto-Ajustable

Redes de Alta Velocidad

Presentan: Felipe Galaz

Cristian Romero

Profesora: Marta Barría

Resumen de la Presentación:

Descripción del Problema.Mediciones de Tasa de Cruzamiento por

Cero, y Energía.Descripción del Algoritmo Propuesto.Detalles de la Implementación.Resultados Obtenidos.

Descripción del Problema:

Se dispone de una señal de voz, y se desea implementar un algoritmo capaz de detectar los instantes de silencio.

Mediciones de Tasa de Cruzamiento por Cero, y Energía.

Descripción del Algoritmo Propuesto.

Se trabajará con el problema inverso, es decir, detectar voz (sonido), no silencio. Por ende, todo lo que no sea voz (sonido), será considerado silencio.

Se utilizará un frame, de tamaño específico (tiempo o bytes) y se determinará si dicho frame corresponde a un frame de voz o de silencio.

Se trabajará en base a la energía de cada frame. Es necesario determinar el umbral de energía de voz.

Se desea detectar la mayor cantidad de silencio posible sin distorsionar la señal original.

Descripción del Algoritmo Propuesto.

¿Donde ubicar el Umbral?

Descripción del Algoritmo Propuesto.

Solución: Umbral auto-ajustable. Inicialmente, el umbral se ubica en 0 (Todo es

considerado voz). Si la señal es mayor que el umbral, este aumenta en

una unidad. Si la señal es menor que el umbral, este disminuye en

una unidad. Como resultado, luego de un tiempo, el umbral se

habrá ubicado cerca del 50% de la señal. Si además se varía el incremento hacia arriba,

respecto del incremento hacia abajo, es posible ubicar el umbral en cualquier nivel de la señal.

Descripción del Algoritmo Propuesto.

Ejemplo sencillo 50%:

Descripción del Algoritmo Propuesto.

Problemas si el umbral varía muy rápido:

Detalles de la Implementación:

Es necesario conocer la tasa de muestro de la señal, el rango de amplitud, y el piso de ruido.

Para los ejemplo que se presentan a continuación la voz se ha muestreado a 22,5[KHz] utilizando 16[bits] para cuantizar la señal en un rango de amplitud desde -1 a 1 (Parámetros por omisión de formato Wav, Grabadora de Windows). Como piso de ruido se ha seleccionado un nivel de 5·10-3

Detalles de la Implementación:

Se trabajará con frames de 256 muestras, lo cual en tiempo equivale a:

][1122500

256ºms

MuestreoFrecuencia

MuestrasNameDuraciónFr

Detalles de la Implementación:

Se desea ubicar el umbral en las cercanías del 30% de la señal. (según © Biopsychology.org, 1998-2006 el porcentaje de silencio de una conversación es cercano al 30%)

Además la frecuencia de variación máxima del umbral debe ser menor que la frecuencia de la voz.

Detalles de la Implementación:

Por ejemplo, el umbral varía +0,0003 o -0,0007 dependiendo de si está por sobre o por debajo de la señal respectivamente:

Con esto la posicion del umbral aproximada, y la velocidad de cambio del umbral quedan determinados por:

][75,1522500·0007,0

%300007,00003,0

0003,0

HzmbralciaCambioUMaxFrecuen

bralPosicionUm

Detalles de la Implementación:

Se calcula un valor proporcional a la energía del frame.

El umbral de energía está dado por la ubicación del umbral de la señal, multiplicado por la duración del frame.

ralEnergíaUmbmeEnergíaFraSilencio

ralEnergiaUmbmeEnergíaFraVoz

Frame

rFrameMuestrasPoNlUmbralSeñakgíaUmbralEner

XikmeEnergíaFraFramei

º··

·

Detalles de la Implementación:

Detalles de la Implementación:

Detalles de la Implementación:

Resultados Obtenidos:

Con Reproducciónde Silencio

Sin Reproducciónde Silencio

Resultados Obtenidos:

Con Reproducciónde Silencio

Sin Reproducciónde Silencio

Resultados Obtenidos:

Con Reproducciónde Silencio

Sin Reproducciónde Silencio

Resultados Obtenidos:

Con Reproducciónde Silencio

Sin Reproducciónde Silencio

Resultados Obtenidos:

Con Reproducciónde Silencio

Sin Reproducciónde Silencio

Resultados Obtenidos:

Se estudiaron los efectos de cambiar el tamaño del frame:

Conclusiones:

Se logró implementar un algoritmo de detección de silencio, independiente de los niveles de potencia de la señal a procesar.

El algoritmo funciona razonablemente bien, y puede ser configurado de acuerdo a las necesidades requeridas.

Bibliografía:

© Biopsychology.org, 1998-2006 http://www.biopsychology.org/tesis_esteve/privgen/privgen.htm

MATLAB® Featured Productshttp://www.mathworks.com/