Sonido digital conceptos y tipos de archivo

3
GRABACIÓN Y EDICIÓN DE SONIDO DIGITAL Conceptos básicos: El sonido real es una onda que transcurre durante un tiempo (duración, en segundos, minutos, etc. ). Para almacenar un sonido en el ordenador tenemos que representar de alguna manera esa onda, de manera que después a partir de esa representación el ordenador u otro dispositivo diseñado para ello pueda mandar la señal adecuada a unos altavoces o auriculares. La onda del sonido puede tener este aspecto. El eje horizontal representa el tiempo, y el vertical la amplitud. Para guardar el sonido de esa onda se toma el valor de la amplitud cada cierto tiempo, es decir, se guarda la altura de los puntos que tiene la gráfica cada cierto espacio en el eje x. Para reproducir el sonido lo reconstruimos a partir de los valores guardados. Se toman los puntos guardados y se unen formando de nuevo la onda. Cuanto más cerca se hayan cogido los puntos en el tiempo, más se parecerá la onda formada (y por tanto el sonido que salga por los altavoces) a la original. En este ejemplo se puede ver como en el caso B, al haber cogido los puntos cada menos espacio en el eje x, la onda reconstruida se parece más que en el caso A a la original (en gris). En A tomamos 7 puntos, en B 21. Logicamente el tamaño del archivo B será tres veces más grande. Frecuencia o velocidad de muestra: Indica el número de puntos de muestra que se toman por segundo. Cuantos más tomemos más fidelidad habrá entre el sonido grabado y el iriginal. Se mide en miles de muestras por segundo (KHz, kilohertcios). Algunos ejemplos son:

Transcript of Sonido digital conceptos y tipos de archivo

Page 1: Sonido digital conceptos y tipos de archivo

GRABACIÓN Y EDICIÓN DE SONIDO DIGITAL

Conceptos básicos: El sonido real es una onda que transcurre durante un tiempo (duración, en segundos, minutos, etc.). Para almacenar un sonido en el ordenador tenemos que representar de alguna manera esa onda, de manera que después a partir de esa representación el ordenador u otro dispositivo diseñado para ello pueda mandar la señal adecuada a unos altavoces o auriculares. La onda del sonido puede tener este aspecto.

El eje horizontal representa el tiempo, y el vertical la amplitud.

Para guardar el sonido de esa onda se toma el valor de la amplitud cada cierto tiempo, es decir, se guarda la altura de los puntos que tiene la gráfica cada cierto espacio en el eje x.

Para reproducir el sonido lo reconstruimos a partir de los valores guardados. Se toman los puntos guardados y se unen formando de nuevo la onda. Cuanto más cerca se hayan cogido los puntos en el tiempo, más se parecerá la onda formada (y por tanto el sonido que salga por los altavoces) a la original.

En este ejemplo se puede ver como en el caso B, al haber cogido los puntos cada menos espacio en el eje x, la onda reconstruida se parece más que en el caso A a la original (en gris).

En A tomamos 7 puntos, en B 21. Logicamente el tamaño del archivo B será tres veces más grande.

Frecuencia o velocidad de muestra: Indica el número de puntos de muestra que se toman por segundo. Cuantos más tomemos más fidelidad habrá entre el sonido grabado y el iriginal. Se mide en miles de muestras por segundo (KHz, kilohertcios). Algunos ejemplos son:

Calidad telefónica: 8 KHz

Calidad de radio: 22 KHz

Calidad de CD: 44’1 KHz

Canales: Indica el número de ondas por las que está formado un sonido. Así hablamos de:

Sonido mono: Si sólo está formado por una onda (un canal) y que origina un sonido semejante al escuchado con un solo oído.

Sonido estéreo: está formado por dos ondas (dos canales). Recrea una experiencia más natural al escuchar, de donde proviene en sonido (izquierda y derecha). Vamos, como si escuchamos con los dos oidos.

Sistemas multicanal: como el dolby. Hasta un total de 6 canales de sonido, con 5 canales para los altavoces de rango-normal (frente derecho, centro, frente izquierdo, parte posterior derecha y parte posterior izquierda) y un canal exclusivo para los sonidos de baja frecuencia o subwoofer.

Page 2: Sonido digital conceptos y tipos de archivo

Tamaño de muestra: Cantidad de bits para codificar la información (amplitud) de cada punto de sonido de cada canal. Con 8 bits (unos y ceros) codificamos 256 amplitudes distintas, con 16 codificamos 65536 valores distintos.

Para ver estas propiedades (duración, frecuencia y estéreo/mono) de un archivo de sonido, sea del formato que sea, pulsamos el botón derecho sobre su icono y elegimos Propiedades; nos vamos a la pestaña Resumen y pulsamos el botón Opciones avanzadas.

A modo de resumen, el audio digital es similar a las imágenes de una película de cine, un montón de fotografías que vistas a determinada velocidad nos da la sensación de movimiento. El material de audio en un CD de audio tiene la misma estructura. En él encontramos dos canales (ondas grabadas) de 44100 fotografías por segundo cada una (frecuencia de muestra). Cada muestra en un CD de audio está hecha de 16 bits (tamaño de muestra). Una representación binaria de un valor podría verse como esto: 1010 1101 1101 1101 y cualquier muestra puede tomar valores entre 0 y 65535 (desde el binario 0000 0000 0000 0000 hasta el binario 1111 1111 1111 1111).

Por último para cubrir el espectro audible humano (20 a 20000 Hz) suele bastar con tasas de muestreo de algo más de 40000 Hz, lo que es el doble de la frecuencia de sonido original (se usa un 10% más por los aparatos electrónicos). Con 32000 muestras por segundo se tendría un ancho de banda similar al de la radio FM, es decir, permite registrar componentes de hasta 15 kHz, aproximadamente.

Formatos de audio

Los formatos de audio son las distintas formas que hay de guardar las amplitudes de la onda en cada instante dentro del archivo. Dependiendo del formato con el que esté guardado, el audio se escuchará mejor o peor y ocupará más o menos espacio en el disco.

Los formatos más importantes son:

.wav : en este formato se guardan las amplitudes como lo hemos descrito anteriormente. Es el de mejor calidad, pero en condiciones normales (44 KHz y estéreo) cada segundo de sonido ocupa unos 176 KB (44000*2*16=1408000 bits), por lo que un minuto ocupa unos 10 MB. Este formato es el que se usa en los CD de audio.

.mp3 : este formato usa técnicas para que el sonido ocupe menos espacio en disco, lo que se llama compresión. La cantidad que se puede reducir el espacio que ocupa el sonido influye en la calidad con la que se vaya a escuchar: cuanto menos ocupe en el disco, peor será la calidad; y al revés, cuanto más ocupe en el disco, mayor será la calidad. La calidad de un mp3 se mide en función del espacio que ocupa un segundo de sonido, medido en kbps (kilobits por segundo, no KB, kilobytes). A este factor se le llama Bitrate. La calidad 160 Kbps supone que un segundo ocupa 20 KB y un minuto aproximadamente 1’2 MB. A partir de esta calidad, el oído humano no es capaz de distinguir más calidad.

.wma : este formato es parecido al mp3, pero es propio de la compañía Microsoft. Funciona de la misma forma, por lo que la calidad se mide a través del bitrate. Consigue el mismo rendimiento que el mp3.