3.- El Sonido.dis.um.es/~jfernand/0607/smig/tema3.pdf3 Sistemas Multimedia e Interacción Gráfica -...

55
1 Sistemas Multimedia e Interacción Gráfica - Curso 2006/07 3.- El Sonido. 3.1. 3.1. INTRODUCCIÓN. INTRODUCCIÓN. 3.2. 3.2. PRINCIPIOS DEL SONIDO. PRINCIPIOS DEL SONIDO. 3.3. 3.3. CARACTERÍSTICAS DE LOS SONIDOS. CARACTERÍSTICAS DE LOS SONIDOS. 3.4. 3.4. HARDWARE PARA SONIDO HARDWARE PARA SONIDO 3.4.1. 3.4.1. Tarjetas de Sonido. Tarjetas de Sonido. 3.4.2. 3.4.2. EL DAC, Sensibilidad, Linealidad y Ruido. EL DAC, Sensibilidad, Linealidad y Ruido. 3.4.3. 3.4.3. Micrófonos Micrófonos 3.4.4. 3.4.4. Altavoces Altavoces 3.5. 3.5. DIGITALIZACIÓN DEL SONIDO. DIGITALIZACIÓN DEL SONIDO. 3.6. 3.6. EDICIÓN DE SONIDO DIGITAL. EDICIÓN DE SONIDO DIGITAL. 3.7. 3.7. EL ESTÁNDAR M.I.D.I. EL ESTÁNDAR M.I.D.I. 3.7.1. 3.7.1. Descripción del estándar M.I.D.I. Descripción del estándar M.I.D.I. 3.7.2. 3.7.2. Interfaz M.I.D.I. Interfaz M.I.D.I. 3.7.3. 3.7.3. Los canales M.I.D.I. Los canales M.I.D.I. 3.7.4. 3.7.4. Conexionados M.I.D.I. Conexionados M.I.D.I. 3.7.5. 3.7.5. Mensajes M.I.D.I. Mensajes M.I.D.I. 3.7.6. 3.7.6. Dispositivos usados en M.I.D.I. Dispositivos usados en M.I.D.I. Sistemas Multimedia e Interacción Gráfica - Curso 2006/07 3.- El Sonido. 3.8. 3.8. FORMATOS DE ARCHIVOS DE AUDIO. FORMATOS DE ARCHIVOS DE AUDIO. 3.8.1. 3.8.1. WAV WAV 3.8.2. 3.8.2. MP3 MP3 3.8.3. 3.8.3. VQF VQF 3.8.4. 3.8.4. OGG VORBIS OGG VORBIS 3.9. 3.9. AUDIO DIGITAL AUDIO DIGITAL 3.9.1. 3.9.1. SRS SRS 3.9.2. 3.9.2. DOLBY DIGITAL AC DOLBY DIGITAL AC-3 3.9.3. 3.9.3. SUPER AUDIO SUPER AUDIO-CD CD 3.9.4. 3.9.4. HDCD HDCD 3.9.5. 3.9.5. DVD DVD-Audio Audio 3.9.6. 3.9.6. COMPARATIVA DE SISTEMAS DE AUDIO DIGITAL COMPARATIVA DE SISTEMAS DE AUDIO DIGITAL 3.10. 3.10. SONIDO EN INTERNET SONIDO EN INTERNET 3.10.1. 3.10.1. Estrategias de uso del sonido en páginas web Estrategias de uso del sonido en páginas web 3.10.2. 3.10.2. Grabación de sonidos para páginas web Grabación de sonidos para páginas web 3.10.3. 3.10.3. Ejemplos de inserción de sonido en web Ejemplos de inserción de sonido en web 3.10.4. 3.10.4. Streaming Streaming

Transcript of 3.- El Sonido.dis.um.es/~jfernand/0607/smig/tema3.pdf3 Sistemas Multimedia e Interacción Gráfica -...

Page 1: 3.- El Sonido.dis.um.es/~jfernand/0607/smig/tema3.pdf3 Sistemas Multimedia e Interacción Gráfica - Curso 2006/07 Generación del sonido El tímpano vibra las partículas de aire

1

Sistemas Multimedia e Interacción Gráfica - Curso 2006/07

3.- El Sonido.

3.1.3.1. INTRODUCCIÓN.INTRODUCCIÓN.3.2.3.2. PRINCIPIOS DEL SONIDO.PRINCIPIOS DEL SONIDO.3.3.3.3. CARACTERÍSTICAS DE LOS SONIDOS.CARACTERÍSTICAS DE LOS SONIDOS.3.4.3.4. HARDWARE PARA SONIDOHARDWARE PARA SONIDO

3.4.1.3.4.1. Tarjetas de Sonido.Tarjetas de Sonido.3.4.2.3.4.2. EL DAC, Sensibilidad, Linealidad y Ruido.EL DAC, Sensibilidad, Linealidad y Ruido.3.4.3.3.4.3. MicrófonosMicrófonos3.4.4.3.4.4. AltavocesAltavoces

3.5.3.5. DIGITALIZACIÓN DEL SONIDO.DIGITALIZACIÓN DEL SONIDO.3.6.3.6. EDICIÓN DE SONIDO DIGITAL.EDICIÓN DE SONIDO DIGITAL.3.7.3.7. EL ESTÁNDAR M.I.D.I.EL ESTÁNDAR M.I.D.I.

3.7.1.3.7.1. Descripción del estándar M.I.D.I.Descripción del estándar M.I.D.I.3.7.2.3.7.2. Interfaz M.I.D.I.Interfaz M.I.D.I.3.7.3.3.7.3. Los canales M.I.D.I.Los canales M.I.D.I.3.7.4.3.7.4. Conexionados M.I.D.I.Conexionados M.I.D.I.3.7.5.3.7.5. Mensajes M.I.D.I.Mensajes M.I.D.I.3.7.6.3.7.6. Dispositivos usados en M.I.D.I.Dispositivos usados en M.I.D.I.

Sistemas Multimedia e Interacción Gráfica - Curso 2006/07

3.- El Sonido.

3.8.3.8. FORMATOS DE ARCHIVOS DE AUDIO.FORMATOS DE ARCHIVOS DE AUDIO.3.8.1.3.8.1. WAVWAV3.8.2.3.8.2. MP3MP33.8.3.3.8.3. VQFVQF3.8.4.3.8.4. OGG VORBISOGG VORBIS

3.9.3.9. AUDIO DIGITALAUDIO DIGITAL3.9.1.3.9.1. SRSSRS3.9.2.3.9.2. DOLBY DIGITAL ACDOLBY DIGITAL AC--333.9.3.3.9.3. SUPER AUDIOSUPER AUDIO--CDCD3.9.4.3.9.4. HDCDHDCD3.9.5.3.9.5. DVDDVD--AudioAudio3.9.6.3.9.6. COMPARATIVA DE SISTEMAS DE AUDIO DIGITALCOMPARATIVA DE SISTEMAS DE AUDIO DIGITAL

3.10.3.10. SONIDO EN INTERNETSONIDO EN INTERNET3.10.1.3.10.1. Estrategias de uso del sonido en páginas webEstrategias de uso del sonido en páginas web3.10.2.3.10.2. Grabación de sonidos para páginas webGrabación de sonidos para páginas web3.10.3.3.10.3. Ejemplos de inserción de sonido en webEjemplos de inserción de sonido en web3.10.4.3.10.4. StreamingStreaming

Page 2: 3.- El Sonido.dis.um.es/~jfernand/0607/smig/tema3.pdf3 Sistemas Multimedia e Interacción Gráfica - Curso 2006/07 Generación del sonido El tímpano vibra las partículas de aire

2

Sistemas Multimedia e Interacción Gráfica - Curso 2006/07

Introducción.

�� El sonido es un fenómeno físico El sonido es un fenómeno físico fundamentalmente analógico.fundamentalmente analógico.

�� Para tratamiento digitalPara tratamiento digital–– Fenómeno físico Fenómeno físico �� señal eléctrica señal eléctrica --> señal digital> señal digital

�� Forma de capturarlo:Forma de capturarlo:

–– Grabación y conversiónGrabación y conversión

–– Instrumentos musicales electrónicosInstrumentos musicales electrónicos

Sistemas Multimedia e Interacción Gráfica - Curso 2006/07

¿Cómo se produce el sonido?

�� El sonido se produce por la interacción de un objeto El sonido se produce por la interacción de un objeto que vibra, un medio de transmisión y un receptor.que vibra, un medio de transmisión y un receptor.

�� Atenuación con la distancia y obstáculosAtenuación con la distancia y obstáculos�� Una onda de presión se transmite a través de un Una onda de presión se transmite a través de un

medio, como el aire, y produce una sensación medio, como el aire, y produce una sensación llamada auditiva, al perturbar el estado de reposo de llamada auditiva, al perturbar el estado de reposo de las estructuras del oído.las estructuras del oído.

�� Vibraciones Vibraciones �� impulsos eléctricosimpulsos eléctricos

Page 3: 3.- El Sonido.dis.um.es/~jfernand/0607/smig/tema3.pdf3 Sistemas Multimedia e Interacción Gráfica - Curso 2006/07 Generación del sonido El tímpano vibra las partículas de aire

3

Sistemas Multimedia e Interacción Gráfica - Curso 2006/07

Generación del sonido

�� El tímpano vibra las partículas de aire que la El tímpano vibra las partículas de aire que la rodean y provocará la vibración de los huesos rodean y provocará la vibración de los huesos del oído interno.del oído interno.

�� Vibraciones Vibraciones --> señales neuronales (acción de > señales neuronales (acción de la membrana basilar)la membrana basilar)

�� Grado de intensidad dependiente de la Grado de intensidad dependiente de la frecuencia frecuencia --> profundidad de penetración> profundidad de penetración

Sistemas Multimedia e Interacción Gráfica - Curso 2006/07

Características de los sonidos (I).

�� Las características de los sonidos que nos permiten Las características de los sonidos que nos permiten identificarlos y diferenciarlos se pueden resumir en las identificarlos y diferenciarlos se pueden resumir en las siguientes:siguientes:

–– INTENSIDAD:INTENSIDAD: AMPLITUD DE LA ONDA SONORA. AMPLITUD DE LA ONDA SONORA. �� Indica a cuánto se alejan las partículas (y por tanto el tímpano) de Indica a cuánto se alejan las partículas (y por tanto el tímpano) de

su posición de reposo en cada periodo de vibración.su posición de reposo en cada periodo de vibración.

�� El oído responde a una rango de intensidades muy grande (desde El oído responde a una rango de intensidades muy grande (desde un sonido casi imperceptible al umbral del dolor).un sonido casi imperceptible al umbral del dolor).

Page 4: 3.- El Sonido.dis.um.es/~jfernand/0607/smig/tema3.pdf3 Sistemas Multimedia e Interacción Gráfica - Curso 2006/07 Generación del sonido El tímpano vibra las partículas de aire

4

Sistemas Multimedia e Interacción Gráfica - Curso 2006/07

Características del sonido (II).

–– INTENSIDAD:INTENSIDAD: AMPLITUD DE LA ONDA SONORA. AMPLITUD DE LA ONDA SONORA. �� Muchos sonidos presentan un patrón claro de intensidad que Muchos sonidos presentan un patrón claro de intensidad que

varía con el tiempo. A este patrón se le llama ENVOLVENTE.varía con el tiempo. A este patrón se le llama ENVOLVENTE.

�� Ejemplo1: Un piano presenta un fuerte golpe de gran Ejemplo1: Un piano presenta un fuerte golpe de gran intensidad inicial, que decae más o menos rápidamente hasta intensidad inicial, que decae más o menos rápidamente hasta desaparecer.desaparecer.

�� Ejemplo2: Una flauta presenta una envolvente más aplanada, Ejemplo2: Una flauta presenta una envolvente más aplanada, ya que no existe golpe inicial, sino una intensidad del sonido ya que no existe golpe inicial, sino una intensidad del sonido mantenida mientras dura la nota.mantenida mientras dura la nota.

�� Medida de la intensidad: decibelios (referencia umbral)Medida de la intensidad: decibelios (referencia umbral)

2

2

10log10refa

adB =

Sistemas Multimedia e Interacción Gráfica - Curso 2006/07

Características del sonido (III).

�� En la siguiente tabla podemos ver la intensidad en dB de En la siguiente tabla podemos ver la intensidad en dB de algunos sonidos representativos.algunos sonidos representativos.

Descripción Nivel (dB) Intensidad

Umbral del dolor 130 1013

Concierto heavy metal 120 1012

Martillazos sobre metal 110 1011

Tráfico de vehículos 70 107

Conversación normal 60 106

Restaurante concurrido 50 105

Casa en la ciudad 40 104

Iglesia vacía 30 103

Estudio de grabación 20 102

Umbral de audición 0 1

Page 5: 3.- El Sonido.dis.um.es/~jfernand/0607/smig/tema3.pdf3 Sistemas Multimedia e Interacción Gráfica - Curso 2006/07 Generación del sonido El tímpano vibra las partículas de aire

5

Sistemas Multimedia e Interacción Gráfica - Curso 2006/07

Características del sonido (IV).

–– FRECUENCIA Y PERIODO:FRECUENCIA Y PERIODO: SON DOS CONCEPTOS SON DOS CONCEPTOS QUE REPRESENTAN EL MISMO FENÓMENO FÍSICO Y QUE REPRESENTAN EL MISMO FENÓMENO FÍSICO Y QUE ESTÁN INVERSAMENTE RELACIONADOS.QUE ESTÁN INVERSAMENTE RELACIONADOS.�� FRECUENCIA: Mide cuantas vibraciones se producen por FRECUENCIA: Mide cuantas vibraciones se producen por

segundo (se miden en ciclos por segundo o hercios segundo (se miden en ciclos por segundo o hercios --> Hz. > Hz. Los humanos somos capaces de percibir frecuencias de Los humanos somos capaces de percibir frecuencias de entre 20 y 20.000 Hz).entre 20 y 20.000 Hz).

�� PERIODO: Cuantas fracciones de segundo dura una PERIODO: Cuantas fracciones de segundo dura una vibración (se mide en segundos).vibración (se mide en segundos).

Sistemas Multimedia e Interacción Gráfica - Curso 2006/07

Características del sonido (V).

–– TONO:TONO: CARACTERÍSTICA PERCEPTIVA QUE SOLO CAPTAMOS EN CARACTERÍSTICA PERCEPTIVA QUE SOLO CAPTAMOS EN LOS SONIDOS PERIÓDICOS: LOS QUE TIENEN UNA FRECUENCIA LOS SONIDOS PERIÓDICOS: LOS QUE TIENEN UNA FRECUENCIA MÁS O MENOS CONSTANTE (agudo o grave).MÁS O MENOS CONSTANTE (agudo o grave).

–– TIMBRE:TIMBRE: CONJUNTO DE FRECUENCIAS QUE SE PUEDEN CONJUNTO DE FRECUENCIAS QUE SE PUEDEN ENCONTRAR EN UN SONIDO EN MAYOR O MENOR PROPORCIÓN.ENCONTRAR EN UN SONIDO EN MAYOR O MENOR PROPORCIÓN.�� Dos instrumentos musicales distintos, como un violín y una flauta, que estén Dos instrumentos musicales distintos, como un violín y una flauta, que estén

interpretando la misma nota (frecuencia) con la misma intensidad, son interpretando la misma nota (frecuencia) con la misma intensidad, son claramente diferenciables claramente diferenciables --> TIMBRE o FORMA DE ONDA.> TIMBRE o FORMA DE ONDA.

�� Movimientos complejos descomponibles en movimientos simplesMovimientos complejos descomponibles en movimientos simples

�� Por ello, el timbre corresponde al conjunto de frecuencias que se pueden Por ello, el timbre corresponde al conjunto de frecuencias que se pueden encontrar en un sonido en mayor o menor proporción.encontrar en un sonido en mayor o menor proporción.

�� A la frecuencia que aparece con más fuerza , si la hay, se llama frecuencia A la frecuencia que aparece con más fuerza , si la hay, se llama frecuencia fundamental, el resto son armónicosfundamental, el resto son armónicos

Page 6: 3.- El Sonido.dis.um.es/~jfernand/0607/smig/tema3.pdf3 Sistemas Multimedia e Interacción Gráfica - Curso 2006/07 Generación del sonido El tímpano vibra las partículas de aire

6

Sistemas Multimedia e Interacción Gráfica - Curso 2006/07

Características del sonido (VI)

Figura 6. Espectros de frecuencias

Sistemas Multimedia e Interacción Gráfica - Curso 2006/07

Hardware básico para sonido

� Tarjeta de sonido

� Micrófono

� Altavoces

Page 7: 3.- El Sonido.dis.um.es/~jfernand/0607/smig/tema3.pdf3 Sistemas Multimedia e Interacción Gráfica - Curso 2006/07 Generación del sonido El tímpano vibra las partículas de aire

7

Sistemas Multimedia e Interacción Gráfica - Curso 2006/07

Elementos de una tarjeta de sonido (I).

�� El elemento hardware básico para realizar las tareas relacionadas El elemento hardware básico para realizar las tareas relacionadas con el sonido en un ordenador es la con el sonido en un ordenador es la tarjeta de sonidotarjeta de sonido..

�� En los ordenadores personales, las podemos encontrar en En los ordenadores personales, las podemos encontrar en BUS BUS ISA ISA (obsoletas), (obsoletas), PCI PCI (las más frecuentes), e integradas en la placa (las más frecuentes), e integradas en la placa base, además de tarjetas externas (PCMCIA, USB,..).base, además de tarjetas externas (PCMCIA, USB,..).

Sistemas Multimedia e Interacción Gráfica - Curso 2006/07

Elementos de una tarjeta de sonido (II).

�� Aparte de las capacidades de muestrear y reproducir sonidos (ADC Aparte de las capacidades de muestrear y reproducir sonidos (ADC y DAC), la mayoría de las tarjetas de sonido disponen de los y DAC), la mayoría de las tarjetas de sonido disponen de los siguientes elementos:siguientes elementos:

–– Un CHIP DE SÍNTESIS de efectos sonoros por tabla de ondas o por Un CHIP DE SÍNTESIS de efectos sonoros por tabla de ondas o por modulación de frecuencia:modulación de frecuencia: se usa para emular instrumentos MIDI sin se usa para emular instrumentos MIDI sin necesidad de conectar un verdadero instrumento de este tipo a la necesidad de conectar un verdadero instrumento de este tipo a la tarjeta.tarjeta.

–– Un MEZCLADORUn MEZCLADOR: capaz de seleccionar y combinar las señales : capaz de seleccionar y combinar las señales procedentes del micrófono, entrada de línea, CD/DVD, DAC y chip de procedentes del micrófono, entrada de línea, CD/DVD, DAC y chip de síntesis, y dirigir esta salida combinada a la salida de altavoces, a la de síntesis, y dirigir esta salida combinada a la salida de altavoces, a la de auriculares, o al ADC.auriculares, o al ADC.

–– CONTROLADOR DE UN LECTOR DE CDCONTROLADOR DE UN LECTOR DE CD--ROM:ROM: menos frecuente en menos frecuente en las nuevas tarjetas.las nuevas tarjetas.

–– PROCESADOR DE AUDIO, DSP (Digital Sound Processor)PROCESADOR DE AUDIO, DSP (Digital Sound Processor): : procesador de audio capaz de realizar operaciones sobre el audio en procesador de audio capaz de realizar operaciones sobre el audio en tiempo real.tiempo real.

Page 8: 3.- El Sonido.dis.um.es/~jfernand/0607/smig/tema3.pdf3 Sistemas Multimedia e Interacción Gráfica - Curso 2006/07 Generación del sonido El tímpano vibra las partículas de aire

8

Sistemas Multimedia e Interacción Gráfica - Curso 2006/07

Elementos de una tarjeta de sonido (III).

Sistemas Multimedia e Interacción Gráfica - Curso 2006/07

Elementos de una tarjeta de sonido (IV).

�� Las tarjetas de sonido para relacionarse con el exterior suelen Las tarjetas de sonido para relacionarse con el exterior suelen disponer de las siguientes conexiones:disponer de las siguientes conexiones:

–– SALIDA ANALÓGICA AMPLIFICADA PARA ALTAVOCES:SALIDA ANALÓGICA AMPLIFICADA PARA ALTAVOCES: suele suele entregar una señal amplificada de 2 a 4 voltios. Se usa entregar una señal amplificada de 2 a 4 voltios. Se usa habitualmente para conectar los altavoces.habitualmente para conectar los altavoces.

–– SALIDA ANALÓGICA SIN AMPLIFICAR (Line Out)SALIDA ANALÓGICA SIN AMPLIFICAR (Line Out): proviene del : proviene del mezclador y se entrega sin amplificar, para conectar la tarjeta de mezclador y se entrega sin amplificar, para conectar la tarjeta de sonido a un amplificador externo.sonido a un amplificador externo.

–– MICRÓFONO.MICRÓFONO.

–– ENTRADA ANALÓGICA AUXILIAR (Line In)ENTRADA ANALÓGICA AUXILIAR (Line In): permite introducir en : permite introducir en la tarjeta una señal proveniente de una fuente externa, como una la tarjeta una señal proveniente de una fuente externa, como una radio, un equipo de música, etc.radio, un equipo de música, etc.

–– CONECTOR MIDI / JOYSTICKCONECTOR MIDI / JOYSTICK: permite la conexión a un joystick : permite la conexión a un joystick analógico o bien sirve de interfaz para la conexión con otros analógico o bien sirve de interfaz para la conexión con otros dispositivos MIDI como teclado, sintetizadores, etc.dispositivos MIDI como teclado, sintetizadores, etc.

–– SALIDA DIGITALSALIDA DIGITAL (las tarjetas más recientes) /5.1(las tarjetas más recientes) /5.1

Page 9: 3.- El Sonido.dis.um.es/~jfernand/0607/smig/tema3.pdf3 Sistemas Multimedia e Interacción Gráfica - Curso 2006/07 Generación del sonido El tímpano vibra las partículas de aire

9

Sistemas Multimedia e Interacción Gráfica - Curso 2006/07

Elementos de una tarjeta de sonido (V).

Sistemas Multimedia e Interacción Gráfica - Curso 2006/07

Elementos de una tarjeta de sonido (VI).

�� En cuanto a las capacidades y prestaciones de una En cuanto a las capacidades y prestaciones de una tarjeta de sonido, debemos destacar:tarjeta de sonido, debemos destacar:

–– NÚMERO DE BITS DE LOS ADC y DAC:NÚMERO DE BITS DE LOS ADC y DAC: en las primeras en las primeras tarjetas había que conformarse con sólo 8 bits (256 niveles de tarjetas había que conformarse con sólo 8 bits (256 niveles de señal diferentes). En la actualidad, la mayoría son de 16 bits señal diferentes). En la actualidad, la mayoría son de 16 bits (65.536 niveles). Ej: SB Audigy 4 Pro 24 bits(65.536 niveles). Ej: SB Audigy 4 Pro 24 bits�� Nota: SB64, SB128, etc no indican el número de bits de Nota: SB64, SB128, etc no indican el número de bits de

codificación, sino el número de voces MIDI que es capaz de codificación, sino el número de voces MIDI que es capaz de generar su chip de síntesis.generar su chip de síntesis.

–– MÁXIMA FRECUENCIA DE MUESTREO:MÁXIMA FRECUENCIA DE MUESTREO: +44.000 khz+44.000 khz

–– FULL DUPLEX:FULL DUPLEX: otra característica presente en algunas tarjetas otra característica presente en algunas tarjetas de sonido recientes, es la capacidad de grabar (ADC) y de sonido recientes, es la capacidad de grabar (ADC) y reproducir (DAC) al mismo tiempo. reproducir (DAC) al mismo tiempo. �� Enhanced (con diferentes frecuencias de muestreo)Enhanced (con diferentes frecuencias de muestreo)

Page 10: 3.- El Sonido.dis.um.es/~jfernand/0607/smig/tema3.pdf3 Sistemas Multimedia e Interacción Gráfica - Curso 2006/07 Generación del sonido El tímpano vibra las partículas de aire

10

Sistemas Multimedia e Interacción Gráfica - Curso 2006/07

Ejemplo de tarjeta de sonido: SB Audigy Platinium Ex (I)

� Conectores en placa– Salida digital/analógica (Central y Subwoofer analógico/

salida de 6 canales SPDIF)

– Entrada de línea

– Entrada de micrófono

– Salida de línea (frontales) / auriculares

– Salida de línea (traseros)

– Entrada CD analógica

– Entrada CD digital

– Entrada contestador telefónico

– Conector de expansión SB1394™ *

– Conector de expansión para módulo externo Audigy™* * Conexión entre tarjeta de sonido y módulo externo

Sistemas Multimedia e Interacción Gráfica - Curso 2006/07

Ejemplo de tarjeta de sonido: SB Audigy Platinium Ex (II)

� Conectores en unidad externa– Salida digital/analógica (Central y Subwoofer analógico/

salida de 6 canales SPDIF)

– Entrada de línea

– Entrada de micrófono

– Salida de línea (frontales) / auriculares

– Salida de línea (traseros)

– Entrada CD analógica

– Entrada CD digital

– Entrada contestador telefónico

– Puerto SB1394™

– Conector de expansión a Joystick / MIDI de 15 pin

Page 11: 3.- El Sonido.dis.um.es/~jfernand/0607/smig/tema3.pdf3 Sistemas Multimedia e Interacción Gráfica - Curso 2006/07 Generación del sonido El tímpano vibra las partículas de aire

11

Sistemas Multimedia e Interacción Gráfica - Curso 2006/07

Ejemplo de tarjeta de sonido: SB Audigy Platinium Ex (III)

� Algunas características– 48 canales MIDI con 128 instrumentos compatible GM y GS

y 10 conjuntos de percusión – Reproducción de 64 canales de sonido, cada uno con

velocidades de muestro independientes– Conversión analógica - digital de 24 bits a 48kHz– Conversión digital - analógica de 24 bits a 48kHz y para

sistemas de altavoces 5.1 – Grabación a 16 bits con frecuencias de muestreo de 8,

11.025, 16, 22.05, 24, 32, 44.1 y 48kHz – Admite señales de 24 bits y 96kHz a través de interfaz

SPDIF (Sony/Philips Digital Interface) – Salida SPDIF con resolución de hasta 24 bits con

frecuencias de muestreo de 44.1, 48 o 96kHz – Completo mezclador digital de 32 bits

Sistemas Multimedia e Interacción Gráfica - Curso 2006/07

El DAC (I).

�� El elemento clave en la digitalización del audio es el El elemento clave en la digitalización del audio es el conversor analógico / digital o DAC, que transforma la conversor analógico / digital o DAC, que transforma la señal de audio en una secuencia de datos binarios.señal de audio en una secuencia de datos binarios.

�� Estos conversores se caracterizan por una serie de Estos conversores se caracterizan por una serie de propiedades:propiedades:

–– FRECUENCIA DE MUESTREO (número de muestras por FRECUENCIA DE MUESTREO (número de muestras por segundo)segundo)

–– RESOLUCIÓN DE LA MUESTRA (número de bits para RESOLUCIÓN DE LA MUESTRA (número de bits para codificar)codificar)

–– UMBRAL DE SENSIBILIDAD Y TOLERANCIA.UMBRAL DE SENSIBILIDAD Y TOLERANCIA.

–– LINEALIDAD DE LA RESPUESTA Y RUIDO.LINEALIDAD DE LA RESPUESTA Y RUIDO.

Page 12: 3.- El Sonido.dis.um.es/~jfernand/0607/smig/tema3.pdf3 Sistemas Multimedia e Interacción Gráfica - Curso 2006/07 Generación del sonido El tímpano vibra las partículas de aire

12

Sistemas Multimedia e Interacción Gráfica - Curso 2006/07

El DAC (II).

�� UMBRAL DE SENSIBILIDAD y TOLERANCIA:UMBRAL DE SENSIBILIDAD y TOLERANCIA:–– Niveles mínimo y máximo de intensidad que pueden recoger y Niveles mínimo y máximo de intensidad que pueden recoger y

además, dos mediciones del mismo sonido, deben dar el además, dos mediciones del mismo sonido, deben dar el mismo resultado.mismo resultado.

–– Una de las diferencias principales entre una tarjeta de sonido Una de las diferencias principales entre una tarjeta de sonido normal y una profesional es la tolerancia (depende de los normal y una profesional es la tolerancia (depende de los controles de calidad en la fabricación del chip).controles de calidad en la fabricación del chip).

�� RUIDO:RUIDO:–– Ruido es todo aquello que se oye pero no debería escucharse.Ruido es todo aquello que se oye pero no debería escucharse.–– Los DAC también tienen ruido aunque muy poco. Los DAC también tienen ruido aunque muy poco. –– Si se combina un ruido elevado con un circuito poco preciso, Si se combina un ruido elevado con un circuito poco preciso,

podemos encontrar que la toma de muestras puede llegar a podemos encontrar que la toma de muestras puede llegar a distorsionar la grabación <=> Esto es lo que ocurre con las distorsionar la grabación <=> Esto es lo que ocurre con las tarjetas de sonido de baja calidad.tarjetas de sonido de baja calidad.

Sistemas Multimedia e Interacción Gráfica - Curso 2006/07

El DAC (III).

�� LINEALIDAD:LINEALIDAD:–– Un DAC tiene respuesta en frecuencia.Un DAC tiene respuesta en frecuencia.–– Los objetos que se comportan bien a una frecuencia puede que Los objetos que se comportan bien a una frecuencia puede que

no se comporten bien a otra; incluso pueden dar resultados no se comporten bien a otra; incluso pueden dar resultados erróneos.erróneos.

–– La razón de que haya altavoces de dos o tres vías es que cada La razón de que haya altavoces de dos o tres vías es que cada uno de los conos que los forman sólo responden bien en una uno de los conos que los forman sólo responden bien en una franja estrecha del espectro auditivo (tweeter franja estrecha del espectro auditivo (tweeter --> agudos, woofer > agudos, woofer --> graves).> graves).

–– Todo tiene una respuesta en frecuencia característica, desde el Todo tiene una respuesta en frecuencia característica, desde el micrófono hasta los cables, pasando por el DAC y las micrófono hasta los cables, pasando por el DAC y las membranas de los altavoces.membranas de los altavoces.

–– Por norma, un dispositivo es mejor cuanto más lineal es su Por norma, un dispositivo es mejor cuanto más lineal es su respuesta, esto es, respuestas similares para frecuencia respuesta, esto es, respuestas similares para frecuencia diversasdiversas

Page 13: 3.- El Sonido.dis.um.es/~jfernand/0607/smig/tema3.pdf3 Sistemas Multimedia e Interacción Gráfica - Curso 2006/07 Generación del sonido El tímpano vibra las partículas de aire

13

Sistemas Multimedia e Interacción Gráfica - Curso 2006/07

Micrófonos

� Energía acústica (sonido)-> energía eléctrica (audio)

� Amplifica la señal original para ser copiada en forma eléctrica.

� Calidad de la copia– Perfección del micro

– Ruido

– Localización

– Acústica de la sala

� “Tu equipo sonará como suene el peor de los componentes”

Sistemas Multimedia e Interacción Gráfica - Curso 2006/07

Tipos principales de micrófonos

– De mano: 30º, separación (seseo)

– Personal� Micrófono/Audífono: retransmisiones deportivas (2

señales: audio e indicaciones del director).

� Inalámbrico: conectado a un radio transmisor. Audio como radio frecuencia. Distancia e interferencias

– No visibles� Boom: fijos o móviles, tipo plataforma, controlados a

distancia

� Suspendido: fijados en un lugar, calidad dependiente de posición

� Oculto: detrás de algún elemento, efecto de proximidad, varios micrófonos ocultos

Page 14: 3.- El Sonido.dis.um.es/~jfernand/0607/smig/tema3.pdf3 Sistemas Multimedia e Interacción Gráfica - Curso 2006/07 Generación del sonido El tímpano vibra las partículas de aire

14

Sistemas Multimedia e Interacción Gráfica - Curso 2006/07

Altavoces

� Transforma la energía eléctrica en mecánica, de modo inverso al micrófono

1.- Cono o diafragma2.- Campana3.- Yugo4.- Imán permanente5.- Bobina móvil6.- Araña7.- Tapa de retención de polvo8.- Hilos de conexión de la bobina9.- Bornes de conexión

Sistemas Multimedia e Interacción Gráfica - Curso 2006/07

Tipos de altavoces

� Cubrimiento del espectro audible. Mínimo 2 altavoces (altas y bajas frecuencias)

� División del espectro en partes (vías)

� Altavoces de 2,3,4 vías

� Atendiendo a la gama de frecuencias– Graves (woofer)

– Medios (midrange)

– Agudos (tweeter)

– Otros para sistemas multivía: subwoofer, midbass

Page 15: 3.- El Sonido.dis.um.es/~jfernand/0607/smig/tema3.pdf3 Sistemas Multimedia e Interacción Gráfica - Curso 2006/07 Generación del sonido El tímpano vibra las partículas de aire

15

Sistemas Multimedia e Interacción Gráfica - Curso 2006/07

Altavoces de 2-3 vías

Sistemas Multimedia e Interacción Gráfica - Curso 2006/07

Sistemas de altavoces

� Dependen del número y tipo de altavoces que se empleen.

� Sonido estéreo: 2 altavoces.

� Sonido envolvente/3D: – 4 altavoces (2 delanteros y 2 traseros).

– Mayor realismo.

� Virtual Surround: – Sonido envolvente 3D con 2 altavoces.

– Simulación por hardware

Page 16: 3.- El Sonido.dis.um.es/~jfernand/0607/smig/tema3.pdf3 Sistemas Multimedia e Interacción Gráfica - Curso 2006/07 Generación del sonido El tímpano vibra las partículas de aire

16

Sistemas Multimedia e Interacción Gráfica - Curso 2006/07

Sistemas de altavoces 5.1

� Dolby Digital, DTS (DVD)

� Altavoces frontales (estéreo): música y efectos de sonido principalmente

� Altavoz central: acción principal y diálogos

� Altavoces surround (envolvente): sensación de profundidad, efectos especiales.

� Altavoz subwoofer: frecuencias más bajas, sensación más envolvente música y efectos

� Colocación

Sistemas Multimedia e Interacción Gráfica - Curso 2006/07

Digitalización del sonido (I).

�� Los humanos no percibimos todas las ondas que se propagan a Los humanos no percibimos todas las ondas que se propagan a nuestro alrededor (sólo percibimos el espectro de 20Hz a 20Khz).nuestro alrededor (sólo percibimos el espectro de 20Hz a 20Khz).

�� Si queremos construir un sistema que grabe el sonido que nos Si queremos construir un sistema que grabe el sonido que nos rodea, no nos interesa que grabe todo, sino sólo aquellas rodea, no nos interesa que grabe todo, sino sólo aquellas porciones del espectro de frecuencias que podemos percibir porciones del espectro de frecuencias que podemos percibir ��DIGITALIZACIÓNDIGITALIZACIÓN..

�� Para digitalizar la señal analógica de entrada tenemos que tener Para digitalizar la señal analógica de entrada tenemos que tener en cuenta varias cosas:en cuenta varias cosas:

–– ¿Cual es la frecuencia de muestreo necesaria para efectuar un buen ¿Cual es la frecuencia de muestreo necesaria para efectuar un buen registro de la señal de entrada? registro de la señal de entrada? �� TEOREMA DE NYQUIST TEOREMA DE NYQUIST �� EL EL DOBLE DE LA MÁXIMA FRECUENCIA QUE QUEREMOS GRABAR DOBLE DE LA MÁXIMA FRECUENCIA QUE QUEREMOS GRABAR (20Khz) (20Khz) �� La frecuencia de muestreo debe ser de unos 44Khz.La frecuencia de muestreo debe ser de unos 44Khz.

Page 17: 3.- El Sonido.dis.um.es/~jfernand/0607/smig/tema3.pdf3 Sistemas Multimedia e Interacción Gráfica - Curso 2006/07 Generación del sonido El tímpano vibra las partículas de aire

17

Sistemas Multimedia e Interacción Gráfica - Curso 2006/07

Digitalización del sonido (II).

–– ¿Cuál es la diferencia mínima¿Cuál es la diferencia mínima que tenemos que registrar en la que tenemos que registrar en la amplitud de las ondas? amplitud de las ondas? �� Una codificación con 16 bits nos Una codificación con 16 bits nos proporciona más de 64.000 intervalos de codificación.proporciona más de 64.000 intervalos de codificación.

�� DIGITALIZACIÓN:DIGITALIZACIÓN:–– FRECUENCIA DE MUESTREO O DISCRETIZACIÓN TEMPORAL: FRECUENCIA DE MUESTREO O DISCRETIZACIÓN TEMPORAL:

medida del valor de la señal original a intervalos regulares de tiempo.medida del valor de la señal original a intervalos regulares de tiempo.

–– BITS DE CODIFICACIÓN O CUANTIZACIÓN O DISCRETIZACIÓN BITS DE CODIFICACIÓN O CUANTIZACIÓN O DISCRETIZACIÓN DE LA AMPLITUD: aproximación de cada valor medido al valor entero DE LA AMPLITUD: aproximación de cada valor medido al valor entero más próximo.más próximo.

Sistemas Multimedia e Interacción Gráfica - Curso 2006/07

Digitalización del sonido (III).

�� La digitalización consiste en convertir los valores de intensidad La digitalización consiste en convertir los valores de intensidad de la señal en valores numéricos que la representen.de la señal en valores numéricos que la representen.

�� Para ello se utilizan circuitos conversores de Para ello se utilizan circuitos conversores de ANALÓGICO a ANALÓGICO a DIGITALDIGITAL (analog to digital converter (analog to digital converter �� ADC) que llevan a cabo ADC) que llevan a cabo una conversión o lectura cada cierto tiempo.una conversión o lectura cada cierto tiempo.

�� A cada lectura se la llama A cada lectura se la llama muestramuestra y el número de muestras y el número de muestras que se toman por segundo que se toman por segundo FRECUENCIA DE MUESTREOFRECUENCIA DE MUESTREO..

�� Para volcar una señal al exterior en forma de sonido (digital to Para volcar una señal al exterior en forma de sonido (digital to analog converter analog converter �� DAC), conectado a un amplificador de DAC), conectado a un amplificador de salida y a un altavoz.salida y a un altavoz.

Page 18: 3.- El Sonido.dis.um.es/~jfernand/0607/smig/tema3.pdf3 Sistemas Multimedia e Interacción Gráfica - Curso 2006/07 Generación del sonido El tímpano vibra las partículas de aire

18

Sistemas Multimedia e Interacción Gráfica - Curso 2006/07

Digitalización del sonido (IV).

Sistemas Multimedia e Interacción Gráfica - Curso 2006/07

Digitalización del sonido (V).

�� La precisión con la que el ADC codifica los valores de la señal La precisión con la que el ADC codifica los valores de la señal (número de bits de la representación digital o tamaño de la (número de bits de la representación digital o tamaño de la palabra del convertidor), tiene una repercusión directa en la palabra del convertidor), tiene una repercusión directa en la calidad de la misma.calidad de la misma.

Page 19: 3.- El Sonido.dis.um.es/~jfernand/0607/smig/tema3.pdf3 Sistemas Multimedia e Interacción Gráfica - Curso 2006/07 Generación del sonido El tímpano vibra las partículas de aire

19

Sistemas Multimedia e Interacción Gráfica - Curso 2006/07

Digitalización del sonido (VI).

�� La frecuencia de muestreo también tiene una influencia clave en la La frecuencia de muestreo también tiene una influencia clave en la exactitud de la señal (teorema de Nyquist y Aliasing).exactitud de la señal (teorema de Nyquist y Aliasing).

�� La frecuencia de muestreo debe ser al menos doble que la máxima La frecuencia de muestreo debe ser al menos doble que la máxima frecuencia de la señal que pretendemos obtener (por tanto, la frecuencia de la señal que pretendemos obtener (por tanto, la frecuencia de muestreo debe ser superior a 40.000 muestras por frecuencia de muestreo debe ser superior a 40.000 muestras por segundo).segundo).

Sistemas Multimedia e Interacción Gráfica - Curso 2006/07

Edición de sonido digital (I).

�� Una de las mayores ventajas del sonido digital es la Una de las mayores ventajas del sonido digital es la enorme flexibilidad que ofrece a la hora de editar el enorme flexibilidad que ofrece a la hora de editar el sonido.sonido.

�� Podemos clasificar las técnicas de edición de sonido Podemos clasificar las técnicas de edición de sonido digital atendiendo al aspecto del sonido que modifican:digital atendiendo al aspecto del sonido que modifican:

–– MODIFICACIÓN DE LA DIMENSIÓN TEMPORAL:MODIFICACIÓN DE LA DIMENSIÓN TEMPORAL:Podemos realizar las siguientes acciones:Podemos realizar las siguientes acciones:�� Cortar, copiar y pegar.Cortar, copiar y pegar.

�� Cambio de sentido.Cambio de sentido.

�� Eliminar silencios.Eliminar silencios.

�� Insertar silenciosInsertar silencios..

Page 20: 3.- El Sonido.dis.um.es/~jfernand/0607/smig/tema3.pdf3 Sistemas Multimedia e Interacción Gráfica - Curso 2006/07 Generación del sonido El tímpano vibra las partículas de aire

20

Sistemas Multimedia e Interacción Gráfica - Curso 2006/07

Edición de sonido digital (II).

–– MODIFICACIÓN DE LA AMPLITUD MEDIANTE MODIFICACIÓN DE LA AMPLITUD MEDIANTE OPERACIONES DE MULTIPLICACIÓN:OPERACIONES DE MULTIPLICACIÓN: Podemos realizar Podemos realizar las siguientes acciones:las siguientes acciones:�� Modificar la gananciaModificar la ganancia..

�� SilenciarSilenciar..

�� Umbral de ruido (“noise gate”)Umbral de ruido (“noise gate”)..

�� Normalizar respecto de la mayor amplitud de ondaNormalizar respecto de la mayor amplitud de onda..

�� Fundido de entrada y de salida (“fade in” y “fade out”): Fundido de entrada y de salida (“fade in” y “fade out”): son dos envolventes muy utilizados, para dar comienzo o son dos envolventes muy utilizados, para dar comienzo o final progresivofinal progresivo

�� Modulación de la amplitud con una señal periódica.Modulación de la amplitud con una señal periódica.

�� InversiónInversión..

Sistemas Multimedia e Interacción Gráfica - Curso 2006/07

Edición de sonido digital (III).

–– MODIFICACIÓN DE LA FRECUENCIA:MODIFICACIÓN DE LA FRECUENCIA:�� Cambio de la frecuencia de reproducción:Cambio de la frecuencia de reproducción: si un sonido muestreado a 44,1 si un sonido muestreado a 44,1

khz se reproduce a 22,05 Khz, sonará una octava más grave y durará el khz se reproduce a 22,05 Khz, sonará una octava más grave y durará el doble de tiempo.doble de tiempo.

�� Remuestreo: Remuestreo: a partir de las muestras de un sonido digital, aumentar o a partir de las muestras de un sonido digital, aumentar o disminuir su frecuencia de muestreo, añadiendo o eliminando muestras disminuir su frecuencia de muestreo, añadiendo o eliminando muestras respectivamente. Para pasar de 44,1 Khz a 22,05 Khz, se elimina una respectivamente. Para pasar de 44,1 Khz a 22,05 Khz, se elimina una muestra de cada dos. Para pasar de 22,05 Khz a 44,1 Khz, se crea por muestra de cada dos. Para pasar de 22,05 Khz a 44,1 Khz, se crea por interpolación una nueva muestra entre cada dos. interpolación una nueva muestra entre cada dos.

�� Transposición:Transposición: es un término musical que significa subir o bajar la altura de es un término musical que significa subir o bajar la altura de una melodía uno o más semitonos. La transposición supone una variación de una melodía uno o más semitonos. La transposición supone una variación de la duración del sonido: dura más cuanto más grave, y menos cuanto más la duración del sonido: dura más cuanto más grave, y menos cuanto más agudo.agudo.

�� El “pitch bend” o modificación continua de la frecuencia:El “pitch bend” o modificación continua de la frecuencia: es similar a la es similar a la transposición, pero en vez de realizarse en intervalos discretos (semitonos) transposición, pero en vez de realizarse en intervalos discretos (semitonos) se lleva a cabo de forma continua. Se puede definir la evolución de la se lleva a cabo de forma continua. Se puede definir la evolución de la frecuencia en el tiempo mediante una envolvente. frecuencia en el tiempo mediante una envolvente.

Page 21: 3.- El Sonido.dis.um.es/~jfernand/0607/smig/tema3.pdf3 Sistemas Multimedia e Interacción Gráfica - Curso 2006/07 Generación del sonido El tímpano vibra las partículas de aire

21

Sistemas Multimedia e Interacción Gráfica - Curso 2006/07

El estándar M.I.D.I. (I)

�� MMusical usical IInstrument nstrument DDigital igital IInterface (INTERFAZ DIGITAL PARA INSTRUMENTOS nterface (INTERFAZ DIGITAL PARA INSTRUMENTOS MUSICALES) MUSICALES) �� Es un protocolo de comunicaciones de datos, capaz de permitir que Es un protocolo de comunicaciones de datos, capaz de permitir que un instrumento musical pueda controlar a otro. Es un método para describir la música un instrumento musical pueda controlar a otro. Es un método para describir la música mediante comandos.mediante comandos.

�� SuSu metameta inicialinicial eraera conseguirconseguir queque desdedesde unun tecladoteclado centralcentral sese pudieranpudieran controlarcontrolardistintosdistintos instrumentosinstrumentos musicalesmusicales electrónicoselectrónicos interconectados,interconectados, peropero concon elel usouso dedeordenadores,ordenadores, elel MIDIMIDI sese convierteconvierte ademásademás enen unauna herramientaherramienta parapara distintasdistintasaplicacionesaplicaciones musicalesmusicales:: ayudaayuda aa lala composición,composición, docencia,docencia, ediciónedición dede partituraspartituras......

�� La diferencia entre la información de audio y los datos MIDI es comparable a la que La diferencia entre la información de audio y los datos MIDI es comparable a la que existe entre un disco compacto con la novena sinfonía de Beethoven y su partitura, con existe entre un disco compacto con la novena sinfonía de Beethoven y su partitura, con la diferencia añadida de que el MIDI trata de partituras que han de ser entendidas por la diferencia añadida de que el MIDI trata de partituras que han de ser entendidas por máquinas, no por seres humanos.máquinas, no por seres humanos.

�� El instrumento controlador recibe el nombre de El instrumento controlador recibe el nombre de MASTER o MAESTROMASTER o MAESTRO, mientras que el , mientras que el instrumento o instrumentos controlados reciben el nombre de instrumento o instrumentos controlados reciben el nombre de ESCLAVOSESCLAVOS..

�� También es posible desde un ordenador controlar la mayoría de los instrumentos También es posible desde un ordenador controlar la mayoría de los instrumentos musicales electrónicos y capturar y almacenar la información que genera la ejecución musicales electrónicos y capturar y almacenar la información que genera la ejecución de un intérprete sobre un instrumento.de un intérprete sobre un instrumento.

Sistemas Multimedia e Interacción Gráfica - Curso 2006/07

El estándar M.I.D.I. (II).

�� Transmisión asíncronaTransmisión asíncrona

�� Su velocidad de transmisión es de 31,25 Kbaudios.Su velocidad de transmisión es de 31,25 Kbaudios.

�� Podemos distinguir tres aspectos en este estándar Podemos distinguir tres aspectos en este estándar de comunicación:de comunicación:

–– Especificaciones físicas: conectores, tensiones, etc.Especificaciones físicas: conectores, tensiones, etc.–– Especificaciones de datos:notas.Especificaciones de datos:notas.–– Especificaciones de control: cambios de sonido, Especificaciones de control: cambios de sonido,

velocidad, frecuencia, etc.velocidad, frecuencia, etc.

Page 22: 3.- El Sonido.dis.um.es/~jfernand/0607/smig/tema3.pdf3 Sistemas Multimedia e Interacción Gráfica - Curso 2006/07 Generación del sonido El tímpano vibra las partículas de aire

22

Sistemas Multimedia e Interacción Gráfica - Curso 2006/07

Interfaz M.I.D.I. (I).

�� La interfaz es el dispositivo electrónico que se encarga de enviar y recibir La interfaz es el dispositivo electrónico que se encarga de enviar y recibir información M.I.D.I. hacia y desde otros dispositivos.información M.I.D.I. hacia y desde otros dispositivos.

�� El interfaz MIDI transmite información digital por una línea y recibe por otra.El interfaz MIDI transmite información digital por una línea y recibe por otra.

�� Cada dispositivo debe contar con al menos una interfaz M.I.D.I.Cada dispositivo debe contar con al menos una interfaz M.I.D.I.

�� El conector que recibe información recibe el nombre de El conector que recibe información recibe el nombre de M.I.D.I. IN: M.I.D.I. IN: se encarga de se encarga de convertir los voltajes eléctricos en datos digitales entendibles por el dispositivo.convertir los voltajes eléctricos en datos digitales entendibles por el dispositivo.

�� El conector que transmite información recibe el nombre de El conector que transmite información recibe el nombre de M.I.D.I. OUT: M.I.D.I. OUT: se se encarga de convertir los datos digitales generados por el dispositivo en series de encarga de convertir los datos digitales generados por el dispositivo en series de voltajes eléctricos.voltajes eléctricos.

�� Algunos dispositivos también disponen de otro conector Algunos dispositivos también disponen de otro conector M.I.D.I. THRUM.I.D.I. THRU que reenvía que reenvía una copia de todo lo recibido por una copia de todo lo recibido por M.I.D.I. INM.I.D.I. IN. De esta forma se puede organizar una . De esta forma se puede organizar una cadena de dispositivos conectados.cadena de dispositivos conectados.

Sistemas Multimedia e Interacción Gráfica - Curso 2006/07

Interfaz M.I.D.I. (II).

�� Los tres son conectores Los tres son conectores DIN hembra de 5 pines DIN hembra de 5 pines (de los cuales solo (de los cuales solo se usan tres en realidad).se usan tres en realidad).

�� Los cables M.I.D.I. siempre conectan el MIDI OUT o el MIDI THRU de Los cables M.I.D.I. siempre conectan el MIDI OUT o el MIDI THRU de un dispositivo con el MIDI IN de otro, y no deben tener una longitud un dispositivo con el MIDI IN de otro, y no deben tener una longitud superior a 15 metros.superior a 15 metros.

Page 23: 3.- El Sonido.dis.um.es/~jfernand/0607/smig/tema3.pdf3 Sistemas Multimedia e Interacción Gráfica - Curso 2006/07 Generación del sonido El tímpano vibra las partículas de aire

23

Sistemas Multimedia e Interacción Gráfica - Curso 2006/07

Interfaz M.I.D.I. (III).

�� Los cables MIDI, que utilizan forzosamente conectores DIN machos, Los cables MIDI, que utilizan forzosamente conectores DIN machos, conectan el MIDI OUT o el MIDI THRU de un dispositivo con el MIDI IN conectan el MIDI OUT o el MIDI THRU de un dispositivo con el MIDI IN de otro. Su construcción garantiza la transmisión sin errores en de otro. Su construcción garantiza la transmisión sin errores en longitudes inferiores a 15 metros. En la figura siguiente se aprecian las longitudes inferiores a 15 metros. En la figura siguiente se aprecian las conexiones internas de un cable MIDI.conexiones internas de un cable MIDI.

Sistemas Multimedia e Interacción Gráfica - Curso 2006/07

Los canales M.I.D.I. (I).

�� 16 canales lógicos diferentes simultáneos, que 16 canales lógicos diferentes simultáneos, que permiten dirigir los mensajes individuales a 16 permiten dirigir los mensajes individuales a 16 instrumentos distintos.instrumentos distintos.

�� Mensajes identificados por número de canalMensajes identificados por número de canal

�� Un dispositivo controlador suele enviar por un único Un dispositivo controlador suele enviar por un único canal a la vez, mientras que un dispositivo receptor canal a la vez, mientras que un dispositivo receptor (un sintetizador) puede ser configurado para recibir en (un sintetizador) puede ser configurado para recibir en uno o varios canales simultáneos.uno o varios canales simultáneos.

�� Un instrumento puede estar sintonizado en modo Un instrumento puede estar sintonizado en modo OMNIOMNI, lo cual implica que recibe de todos los canales., lo cual implica que recibe de todos los canales.

Page 24: 3.- El Sonido.dis.um.es/~jfernand/0607/smig/tema3.pdf3 Sistemas Multimedia e Interacción Gráfica - Curso 2006/07 Generación del sonido El tímpano vibra las partículas de aire

24

Sistemas Multimedia e Interacción Gráfica - Curso 2006/07

Los canales M.I.D.I. (II).

�� Cada canal MIDI permite implementar un instrumento virtual Cada canal MIDI permite implementar un instrumento virtual diferente. En un sintetizador hay que distinguir dos conceptos:diferente. En un sintetizador hay que distinguir dos conceptos:

–– Capacidad polifónica: Capacidad polifónica: número máximo de notas que puede número máximo de notas que puede reproducir simultáneamente.reproducir simultáneamente.

–– Capacidad multitímbrica: Capacidad multitímbrica: número máximo de número máximo de instrumentos instrumentos musicales que se pueden reproducir simultáneamente.musicales que se pueden reproducir simultáneamente.

�� Los sintetizadores MIDI suelen tener una polifonía de 32 o más Los sintetizadores MIDI suelen tener una polifonía de 32 o más notas y una capacidad multitímbrica de hasta 16 (límite notas y una capacidad multitímbrica de hasta 16 (límite determinado por los 16 canales de estándar MIDI).determinado por los 16 canales de estándar MIDI).

�� La totalidad de las tarjetas de sonido son capaces de reproducir La totalidad de las tarjetas de sonido son capaces de reproducir varios instrumentos diferentes de forma simultáneavarios instrumentos diferentes de forma simultánea

Sistemas Multimedia e Interacción Gráfica - Curso 2006/07

Los canales M.I.D.I. (III).

�� Los instrumentos que puede reproducir un sintetizador MIDI se Los instrumentos que puede reproducir un sintetizador MIDI se llaman programas. Para activar un instrumento determinado llaman programas. Para activar un instrumento determinado basta con mandar un mensaje de basta con mandar un mensaje de Program ChangeProgram Change junto con el junto con el número de instrumento que se desee.número de instrumento que se desee.

�� Un sintetizador que pueda generar cuatro instrumentos Un sintetizador que pueda generar cuatro instrumentos simultáneos (como por ejemplo una línea de bajo, unos acordes simultáneos (como por ejemplo una línea de bajo, unos acordes de piano, una sección de cuerdas y una batería) deberá como de piano, una sección de cuerdas y una batería) deberá como mínimo poder recibir en cuatro canales MIDI diferentes. Un mínimo poder recibir en cuatro canales MIDI diferentes. Un aparato que satisface estas características se denomina aparato que satisface estas características se denomina multitímbrico.multitímbrico.

�� General MIDI (GM) que entre otros aspectos incluye:General MIDI (GM) que entre otros aspectos incluye:–– Polifonía mínima de 24 notas.Polifonía mínima de 24 notas.–– Capacidad multitímbrica de 16 canales.Capacidad multitímbrica de 16 canales.–– Lista estándar de 128 instrumentos o programas (0 a 127 ó 1 a 128).Lista estándar de 128 instrumentos o programas (0 a 127 ó 1 a 128).–– Caja de ritmos en el canal 10 con una lista estándar de 59 sonidos Caja de ritmos en el canal 10 con una lista estándar de 59 sonidos

de percusión.de percusión.

Page 25: 3.- El Sonido.dis.um.es/~jfernand/0607/smig/tema3.pdf3 Sistemas Multimedia e Interacción Gráfica - Curso 2006/07 Generación del sonido El tímpano vibra las partículas de aire

25

Sistemas Multimedia e Interacción Gráfica - Curso 2006/07

Tipos de conexiones M.I.D.I. (I).

�� Los diferentes tipos de conexiones que nos podemos encontrar Los diferentes tipos de conexiones que nos podemos encontrar entre elementos MIDI son las siguientes:entre elementos MIDI son las siguientes:

–– CONEXIONADO BÁSICO:CONEXIONADO BÁSICO: Consiste en un dispositivo Consiste en un dispositivo MAESTROMAESTRO que transmite información y otro que transmite información y otro ESCLAVOESCLAVO que que recibe información.recibe información.

Sistemas Multimedia e Interacción Gráfica - Curso 2006/07

Tipos de conexiones M.I.D.I. (II).

–– CONEXIONADO ENCADENADO DAISY o SERIE:CONEXIONADO ENCADENADO DAISY o SERIE: Consiste en varios Consiste en varios dispositivos M.I.D.I. Conectados en serie a través del conector dispositivos M.I.D.I. Conectados en serie a través del conector M.I.D.I. THRU.M.I.D.I. THRU.

–– Aunque en teoría la interconexión vía MIDI THRU es transparente, en la práctica Aunque en teoría la interconexión vía MIDI THRU es transparente, en la práctica se produce una distorsión que puede acarrear la perdida de mensajes tras más se produce una distorsión que puede acarrear la perdida de mensajes tras más de tres enlaces. Por ello, en sistemas complejos con muchos dispositivos, es de tres enlaces. Por ello, en sistemas complejos con muchos dispositivos, es aconsejable utilizar un dispositivo hardware adicional que centraliza y aconsejable utilizar un dispositivo hardware adicional que centraliza y redistribuye todos los mensajes, denominado redistribuye todos los mensajes, denominado MIDI patch bayMIDI patch bay

Configuración MIDI compuesta por tres sintetizadoresConfiguración MIDI compuesta por tres sintetizadores(solo el sintetizador A puede actuar como controlador o maestro)(solo el sintetizador A puede actuar como controlador o maestro)

Page 26: 3.- El Sonido.dis.um.es/~jfernand/0607/smig/tema3.pdf3 Sistemas Multimedia e Interacción Gráfica - Curso 2006/07 Generación del sonido El tímpano vibra las partículas de aire

26

Sistemas Multimedia e Interacción Gráfica - Curso 2006/07

Tipos de conexiones M.I.D.I. (III).

Configuración MIDI compuesta por tres sintetizadores y un ordenadorConfiguración MIDI compuesta por tres sintetizadores y un ordenador(solo el sintetizador A puede actuar como controlador o maestro)(solo el sintetizador A puede actuar como controlador o maestro)

Sistemas Multimedia e Interacción Gráfica - Curso 2006/07

Tipos de conexiones M.I.D.I. (IV).

–– CONEXIONADO PARALELO:CONEXIONADO PARALELO: Se pueden utilizar elementos como Se pueden utilizar elementos como MIDI Thru Box o MIDI Patch Bay que son cajas derivadoras con una MIDI Thru Box o MIDI Patch Bay que son cajas derivadoras con una entrada y varias salidas (MIDI THRU BOX) o varias entradas y varias entrada y varias salidas (MIDI THRU BOX) o varias entradas y varias salidas (MIDI PATCH BAY).salidas (MIDI PATCH BAY).

Page 27: 3.- El Sonido.dis.um.es/~jfernand/0607/smig/tema3.pdf3 Sistemas Multimedia e Interacción Gráfica - Curso 2006/07 Generación del sonido El tímpano vibra las partículas de aire

27

Sistemas Multimedia e Interacción Gráfica - Curso 2006/07

Mensajes M.I.D.I. (I).

�� La especificación MIDI determina también con precisión el La especificación MIDI determina también con precisión el formato de los datos y el orden y disposición de los mensajes que formato de los datos y el orden y disposición de los mensajes que se pueden transmitir.se pueden transmitir.

�� Existen diferentes tipos de mensajes MIDI y cada uno de ellos Existen diferentes tipos de mensajes MIDI y cada uno de ellos tiene un tamaño fijo (normalmente dos o tres bytes). tiene un tamaño fijo (normalmente dos o tres bytes).

�� Todo dispositivo MIDI dispone de al menos un microprocesador Todo dispositivo MIDI dispone de al menos un microprocesador capaz de interpretar algunos de estos mensajes, aunque no es capaz de interpretar algunos de estos mensajes, aunque no es imprescindible que los entienda todos (cuando un dispositivo imprescindible que los entienda todos (cuando un dispositivo recibe un mensaje que no es capaz de interpretar, simplemente lo recibe un mensaje que no es capaz de interpretar, simplemente lo ignora y pasa al siguiente).ignora y pasa al siguiente).

Sistemas Multimedia e Interacción Gráfica - Curso 2006/07

Mensajes M.I.D.I. (II).

�� Un mensaje MIDI está formado por:Un mensaje MIDI está formado por:–– 1 byte de status, que tiene siempre el bit más significativo a 1. Los tres bits 1 byte de status, que tiene siempre el bit más significativo a 1. Los tres bits

siguientes codifican el tipo de mensaje y los cuatro bits menos significativos siguientes codifican el tipo de mensaje y los cuatro bits menos significativos codifican el canal.codifican el canal.

–– 1 o 2 bytes de datos, según el tipo de mensaje, con el bit más significativo 1 o 2 bytes de datos, según el tipo de mensaje, con el bit más significativo siempre a 0.siempre a 0.

�� Existen dos grandes grupos de mensajes:Existen dos grandes grupos de mensajes:–– MENSAJES DE CANAL (CHANNEL MESSAGES).MENSAJES DE CANAL (CHANNEL MESSAGES).–– MENSAJES DE SISTEMA (SYSTEM MESSAGES).MENSAJES DE SISTEMA (SYSTEM MESSAGES).

�� MENSAJES DE CANAL (CHANNEL MESSAGE):MENSAJES DE CANAL (CHANNEL MESSAGE): Están dirigidos a Están dirigidos a instrumentos en particular.instrumentos en particular.

�� MENSAJES DE VOZ DE CANAL: MENSAJES DE VOZ DE CANAL: Por medio de estos mensajes, se reciben y Por medio de estos mensajes, se reciben y transmiten las acciones realizadas por el usuario al tocar el teclado o cualquier transmiten las acciones realizadas por el usuario al tocar el teclado o cualquier otro controlador.otro controlador.

Page 28: 3.- El Sonido.dis.um.es/~jfernand/0607/smig/tema3.pdf3 Sistemas Multimedia e Interacción Gráfica - Curso 2006/07 Generación del sonido El tímpano vibra las partículas de aire

28

Sistemas Multimedia e Interacción Gráfica - Curso 2006/07

Mensajes M.I.D.I. (II).

�� MENSAJES DE MODO DE CANAL: MENSAJES DE MODO DE CANAL: Determinan cómo responderán los Determinan cómo responderán los teclados o elementos esclavos o cómo recibirán la información transmitida teclados o elementos esclavos o cómo recibirán la información transmitida por los maestros.por los maestros.–– Modo 1: Omni activado / polifónico (el elemento debe reaccionar sea cual sea Modo 1: Omni activado / polifónico (el elemento debe reaccionar sea cual sea

el canal y podrá tocar varias notas a la vez).el canal y podrá tocar varias notas a la vez).

–– Modo 2: Omni activado / monofónico (el elemento debe reaccionar sea cual Modo 2: Omni activado / monofónico (el elemento debe reaccionar sea cual sea el canal y sólo podrá tocar una nota cada vez).sea el canal y sólo podrá tocar una nota cada vez).

–– Modo 3: Omni desactivado / polifónico (sólo debe reaccionar a las Modo 3: Omni desactivado / polifónico (sólo debe reaccionar a las instrucciones por un canal y podrá tocar varias notas a la vez).instrucciones por un canal y podrá tocar varias notas a la vez).

–– Modo 4: Omni desactivado / monofónico (sólo debe reaccionar a las Modo 4: Omni desactivado / monofónico (sólo debe reaccionar a las instrucciones por un canal y sólo podrá tocar una nota cada vez).instrucciones por un canal y sólo podrá tocar una nota cada vez).

–– MENSAJES DE SISTEMA (SYSTEM MESSAGES):MENSAJES DE SISTEMA (SYSTEM MESSAGES): Están dirigidos al Están dirigidos al sistema M.I.D.I. y no necesitan estar asignados a un canal específico. sistema M.I.D.I. y no necesitan estar asignados a un canal específico. Su byte de status comienza por 1111. Se utilizan para manejar por Su byte de status comienza por 1111. Se utilizan para manejar por control remoto desde el maestro los instrumentos M.I.D.I. Se dividen en control remoto desde el maestro los instrumentos M.I.D.I. Se dividen en tres grupos:tres grupos:

Sistemas Multimedia e Interacción Gráfica - Curso 2006/07

Mensajes M.I.D.I. (III).

�� MENSAJES DE SISTEMA COMÚN: MENSAJES DE SISTEMA COMÚN: Se utilizan para llevar a cabo funciones Se utilizan para llevar a cabo funciones M.I.D.I. Como por ejemplo: controlar secuenciadores, ordenadores y cajas M.I.D.I. Como por ejemplo: controlar secuenciadores, ordenadores y cajas de ritmo (selección de canción, afinación, etc).de ritmo (selección de canción, afinación, etc).

�� MENSAJES DE TIEMPO REAL: MENSAJES DE TIEMPO REAL: Se utilizan para sincronizar los diferentes Se utilizan para sincronizar los diferentes instrumentos electrónicos (Reloj, mensaje de inicio, continuar, mensajes de instrumentos electrónicos (Reloj, mensaje de inicio, continuar, mensajes de final, etc).final, etc).

�� MENSAJES DE SISTEMAS EXCLUSIVOS:MENSAJES DE SISTEMAS EXCLUSIVOS: Se utilizan para enviar mensajes Se utilizan para enviar mensajes entre dispositivos de la misma marca. Se trata pues de mensajes específicos entre dispositivos de la misma marca. Se trata pues de mensajes específicos que están pensados para ser procesador por determinados dispositivos que están pensados para ser procesador por determinados dispositivos M.I.D.I.M.I.D.I.

�� El estándar M.I.D.I. ha incorporado sucesivas mejoras a los El estándar M.I.D.I. ha incorporado sucesivas mejoras a los largo de los años ampliando el número de mensajes y largo de los años ampliando el número de mensajes y dispositivos soportados.dispositivos soportados.

Page 29: 3.- El Sonido.dis.um.es/~jfernand/0607/smig/tema3.pdf3 Sistemas Multimedia e Interacción Gráfica - Curso 2006/07 Generación del sonido El tímpano vibra las partículas de aire

29

Sistemas Multimedia e Interacción Gráfica - Curso 2006/07

Resumen Mensajes M.I.D.I.

Sistemas Multimedia e Interacción Gráfica - Curso 2006/07

Dispositivos usados en M.I.D.I.

–– SINTETIZADORESSINTETIZADORES

–– MÓDULO DE SONIDOSMÓDULO DE SONIDOS

–– TECLADO MAESTROTECLADO MAESTRO

–– SAMPLERSAMPLER

–– CAJA DE RITMOSCAJA DE RITMOS

–– SECUENCIADOR “HARD”SECUENCIADOR “HARD”

–– MUSICAL WORKSTATIONMUSICAL WORKSTATION

–– PATCH BAY MIDIPATCH BAY MIDI

–– M.I.D.I. MERGE BOXM.I.D.I. MERGE BOX

–– M.I.D.I. THRU BOXM.I.D.I. THRU BOX

–– MEZCLADOR (MERGE) M.I.D.I.MEZCLADOR (MERGE) M.I.D.I.

Page 30: 3.- El Sonido.dis.um.es/~jfernand/0607/smig/tema3.pdf3 Sistemas Multimedia e Interacción Gráfica - Curso 2006/07 Generación del sonido El tímpano vibra las partículas de aire

30

Sistemas Multimedia e Interacción Gráfica - Curso 2006/07

Formatos de archivo de audio

� WAV

� MP3

� VQF

� OGG VORBIS

Sistemas Multimedia e Interacción Gráfica - Curso 2006/07

Formatos de archivos de audio

�� Históricamente, cada modelo de ordenador o programa definió su Históricamente, cada modelo de ordenador o programa definió su propio formato de fichero para almacenar la información de propio formato de fichero para almacenar la información de sonido. Algunos de estos formatos han perdurado y se han sonido. Algunos de estos formatos han perdurado y se han convertido en los más usados actualmente.convertido en los más usados actualmente.

�� Podemos distinguir dos estilos de formato:Podemos distinguir dos estilos de formato:–– Contienen una cabecera que indica los parámetros empleados en la Contienen una cabecera que indica los parámetros empleados en la

codificación (frecuencia de muestreo, número de bits, stereo/mono, codificación (frecuencia de muestreo, número de bits, stereo/mono, etc) (ej: au, aif, wav,..)etc) (ej: au, aif, wav,..)

–– De tipo “raw” o crudo que no contienen más información que los De tipo “raw” o crudo que no contienen más información que los propios datos (ej: snd)propios datos (ej: snd)

Page 31: 3.- El Sonido.dis.um.es/~jfernand/0607/smig/tema3.pdf3 Sistemas Multimedia e Interacción Gráfica - Curso 2006/07 Generación del sonido El tímpano vibra las partículas de aire

31

Sistemas Multimedia e Interacción Gráfica - Curso 2006/07

Formato WAV Bytes Contenido Usual Propósito/Descripción

00 - 03 "RIFF" Bloque de identificación (sin comillas).

04 - 07 ??? Entero largo. Tamaño del fichero en bytes, incluyendo cabecera.

08 - 11 "WAVE" Otro identificador.

12 - 15 "fmt " Otro identificador

16 -19 16, 0, 0, 0 Tamaño de la cabecera hasta este punto. (byte menos sig,…., byte más sig)

20 - 21 1, 0 Etiqueta de formato. (Algo así como la versión del tipo de formato utilizado).

22 - 23 1, 0 (mono) ; 2,0 (estéreo) Número de canales (2 si es estéreo).

24 - 27 ??? Frecuencia de muestreo (muestras/segundo).

28 - 31 ??? Número medio de bytes/segundo.

32 - 33 1, 0 Bytes por muestra

34 - 35 8, 0 Número de Bits por muestra (normalmente 8, 16 ó 32).

36 – 39 "data" Marcador que indica el comienzo de los datos de las muestras.

40 - 43 ??? Número de bytes muestreados.

Resto ??? Muestras (cuantización uniforme)

Sistemas Multimedia e Interacción Gráfica - Curso 2006/07

Formato MP3 (I).

�� MP3 significa MPEG 1 Layer 3, tercer nivel de compresión del MPEG 1.MP3 significa MPEG 1 Layer 3, tercer nivel de compresión del MPEG 1.

�� El proceso de codificación utilizado en MP3 es denominado El proceso de codificación utilizado en MP3 es denominado ““codificación perceptualcodificación perceptual” y se basa en las pequeñas imperfecciones ” y se basa en las pequeñas imperfecciones del oído humano. Eliminando aquellos datos que no serán percibidos por del oído humano. Eliminando aquellos datos que no serán percibidos por el oyente , podemos reducir la cantidad de datos a almacenar.el oyente , podemos reducir la cantidad de datos a almacenar.

�� La fundamentación matemática es muy compleja y es un proceso lento.La fundamentación matemática es muy compleja y es un proceso lento.

�� Aplicando las técnicas del MP3, se consigue reducir el tamaño que Aplicando las técnicas del MP3, se consigue reducir el tamaño que ocupa una pieza musical en un factor entre 10 y 12 a 1.ocupa una pieza musical en un factor entre 10 y 12 a 1.

�� Según el cálculo anterior, reducimos el espacio necesario para Según el cálculo anterior, reducimos el espacio necesario para almacenar 1 minuto de música estéreo de calidad CD de 10MB a 1MB.almacenar 1 minuto de música estéreo de calidad CD de 10MB a 1MB.

�� Almacenamiento MP3 en CDAlmacenamiento MP3 en CD--ROM, más de ¡11 horas! con “calidad casi ROM, más de ¡11 horas! con “calidad casi de CDde CD””..

Page 32: 3.- El Sonido.dis.um.es/~jfernand/0607/smig/tema3.pdf3 Sistemas Multimedia e Interacción Gráfica - Curso 2006/07 Generación del sonido El tímpano vibra las partículas de aire

32

Sistemas Multimedia e Interacción Gráfica - Curso 2006/07

Capas de compresión MPEG

Formato

Compresión Kb/seg

Layer1 4 a 1 384

Layer2

6 a 1

8 a 1

256

192

Layer3

10 a 1

12 a 1

128

112

Sistemas Multimedia e Interacción Gráfica - Curso 2006/07

Compresión MP3 (I)

�� El formato MP3 utiliza unos cuantos trucos para comprimir el El formato MP3 utiliza unos cuantos trucos para comprimir el sonido, fundamentalmente técnicas de codificación de percepción sonido, fundamentalmente técnicas de codificación de percepción que aprovechan la manera en la que el oído humano percibe el que aprovechan la manera en la que el oído humano percibe el sonido. Algunas claves son:sonido. Algunas claves son:

–– UMBRAL MÍNIMO DE AUDICIÓN:UMBRAL MÍNIMO DE AUDICIÓN: El umbral mínimo de audición El umbral mínimo de audición humano no es lineal. De acuerdo con la ley de Fletcher y Munson, se humano no es lineal. De acuerdo con la ley de Fletcher y Munson, se representa por una curva entre 2 y 5 KHz. Cualquier sonido situado representa por una curva entre 2 y 5 KHz. Cualquier sonido situado fuera de este margen puede no codificarse, ya que no será percibido fuera de este margen puede no codificarse, ya que no será percibido de todas formas. de todas formas.

–– EFECTO MÁSCARA:EFECTO MÁSCARA: Hay una serie de propiedades de ocultación Hay una serie de propiedades de ocultación (masking efects) del oído humano, de forma que los sonidos fuertes (masking efects) del oído humano, de forma que los sonidos fuertes no dejan oír a los débiles. Para conseguir aprovechar esta no dejan oír a los débiles. Para conseguir aprovechar esta característica, mp3 filtra los sonidos más débiles cuando hay sonidos característica, mp3 filtra los sonidos más débiles cuando hay sonidos muy fuertes a la vez.muy fuertes a la vez.

Page 33: 3.- El Sonido.dis.um.es/~jfernand/0607/smig/tema3.pdf3 Sistemas Multimedia e Interacción Gráfica - Curso 2006/07 Generación del sonido El tímpano vibra las partículas de aire

33

Sistemas Multimedia e Interacción Gráfica - Curso 2006/07

Compresión MP3 (II)

Sistemas Multimedia e Interacción Gráfica - Curso 2006/07

Compresión MP3 (III)

–– RESERVA DE BYTES:RESERVA DE BYTES: MP3 usa partes de los fragmentos que pueden MP3 usa partes de los fragmentos que pueden codificarse en un tamaño inferior para almacenar parte de los que codificarse en un tamaño inferior para almacenar parte de los que requieren un número determinado de bytes/seg.requieren un número determinado de bytes/seg.

–– FUSIÓN DE ESTÉREO:FUSIÓN DE ESTÉREO: En muchas músicas, en frecuencias En muchas músicas, en frecuencias determinadas, el oído humano no puede distinguir el origen espacial de determinadas, el oído humano no puede distinguir el origen espacial de los sonidos de un canal u otro del estéreo. En este caso, MP3 puede los sonidos de un canal u otro del estéreo. En este caso, MP3 puede fusionar las dos señales en una sola (mono).fusionar las dos señales en una sola (mono).

–– CODIFICACIÓN DE HUFFMAN:CODIFICACIÓN DE HUFFMAN: El código Huffman se aplica al final de El código Huffman se aplica al final de la compresión. la compresión.

Page 34: 3.- El Sonido.dis.um.es/~jfernand/0607/smig/tema3.pdf3 Sistemas Multimedia e Interacción Gráfica - Curso 2006/07 Generación del sonido El tímpano vibra las partículas de aire

34

Sistemas Multimedia e Interacción Gráfica - Curso 2006/07

Ejemplo Codificación Huffman

Ejemplo : Fichero con 100.000 caracteres. Se sabe que aparecen 6 caracteres

diferentes y la frecuencia de aparición de cada uno de ellos es :

a b c d e f

Frecuencia

( en miles )

45 13 12 16 9 5

¿ Cómo codificar los caracteres para comprimir el espacio ocupado

utilizando un código binario ?

Sistemas Multimedia e Interacción Gráfica - Curso 2006/07

Ejemplo Codificación Huffman (I)

Solución 1 : Código de longitud fija

Para 6 caracteres se necesitan 3 bits (300000 bits)

Fija 000 001 010 011 100 101

Solución 2 : Código de longitud variable en el que los más

frecuentes tienen el código más corto. Restricción : ningún código

es prefijo de otro.( 224000 bits )

Variable 0 101 100 111 1101 1100

Page 35: 3.- El Sonido.dis.um.es/~jfernand/0607/smig/tema3.pdf3 Sistemas Multimedia e Interacción Gráfica - Curso 2006/07 Generación del sonido El tímpano vibra las partículas de aire

35

Sistemas Multimedia e Interacción Gráfica - Curso 2006/07

Ejemplo Codificación Huffman (II)

Codificación : Basta con concatenar el código de cada uno de

los caracteres.

Ejemplo : aabacd ≡ 0⋅0⋅101⋅0⋅100⋅111≡ 001010100111

Descodificación : Fácil porque ningún código es prefijo de otro

código ⇒ NO hay ambigüedad.

Ejemplo : 101011101111011100 ≡ badadcf

¡ Es la única posibilidad !

Sistemas Multimedia e Interacción Gráfica - Curso 2006/07

Estructura archivo MP3 (I)

� Grupos de frames que contienen una fracción de segundo de datos de audio (1152 muestras)

� Cada frame tiene una cabecera de 32 bits de metadatos, de la siguiente forma:

Page 36: 3.- El Sonido.dis.um.es/~jfernand/0607/smig/tema3.pdf3 Sistemas Multimedia e Interacción Gráfica - Curso 2006/07 Generación del sonido El tímpano vibra las partículas de aire

36

Sistemas Multimedia e Interacción Gráfica - Curso 2006/07

Estructura archivo MP3 (II)

Sistemas Multimedia e Interacción Gráfica - Curso 2006/07

Estructura archivo MP3 (III)Señal Longitud

(bits)Posición

(bits)Descripción

A 11 (31-21) Sincronización (todos los bits a 1)

B 2 (20,19) Versión MPEG Audio 00 - MPEG Versión 2.5 01 - reserved

10 - MPEG Versión 2 (ISO/IEC 13818-3)11 - MPEG Versión 1 (ISO/IEC 11172-3)

C 2 (18,17) Descripción de nivel00 - reserved01 - Layer III10 - Layer II11 - Layer I

D 1 (16) Bit de Protección0 – Protegido por CRC

1 - No protegido

Page 37: 3.- El Sonido.dis.um.es/~jfernand/0607/smig/tema3.pdf3 Sistemas Multimedia e Interacción Gráfica - Curso 2006/07 Generación del sonido El tímpano vibra las partículas de aire

37

Sistemas Multimedia e Interacción Gráfica - Curso 2006/07

Estructura archivo MP3 (IV)

E 4 ( 1 5 , 1 2 ) B i t r a t e e n k b p s b i t s V 1 , L 1 V 1 , L 2 V 1 , L 3 V 2 , L 1 V 2 , L 2 & L 3

0 0 0 0 L i b r e L i b r e L i b r e L i b r e L i b r e

0 0 0 1 3 2 3 2 3 2 3 2 8

0 0 1 0 6 4 4 8 4 0 4 8 1 6

0 0 1 1 9 6 5 6 4 8 5 6 2 4

0 1 0 0 1 2 8 6 4 5 6 6 4 3 2

0 1 0 1 1 6 0 8 0 6 4 8 0 4 0

0 1 1 0 1 9 2 9 6 8 0 9 6 4 8

0 1 1 1 2 2 4 1 1 2 9 6 1 1 2 5 6

1 0 0 0 2 5 6 1 2 8 1 1 2 1 2 8 6 4

1 0 0 1 2 8 8 1 6 0 1 2 8 1 4 4 8 0

1 0 1 0 3 2 0 1 9 2 1 6 0 1 6 0 9 6

1 0 1 1 3 5 2 2 2 4 1 9 2 1 7 6 1 1 2

1 1 0 0 3 8 4 2 5 6 2 2 4 1 9 2 1 2 8

1 1 0 1 4 1 6 3 2 0 2 5 6 2 2 4 1 4 4

1 1 1 0 4 4 8 3 8 4 3 2 0 2 5 6 1 6 0

1 1 1 1 M a l M a l M a l M a l M a l

V 1 - M P E G V e r s i ó n 1 V 2 - M P E G V e r s i ó n 2 y V e r s i ó n 2 . 5 L 1 - L a y e r I

L 2 - L a y e r I I

L 3 - L a y e r I I I " l i b r e " : f o r m a t o l i b r e . D e b e s e r c o n s t a n t e y p o r d e b a j o d e l m á x i m o p e r m i t i d o . N o t i e n e p o r q u é s e r a c e p t a d o p o r u n d e c o d i f i c a d o r . " m a l " : v a l o r n o p e r m i t i d o .

A l g u n o s f i c h e r o s M P E G u s a n b i t r a t e v a r i a b l e ( V B R ) . C a d a f r a m e p u e d e p o s e e r u n b i t a r e d i f e r e n t e . E s t a c a r a c t e r í s t i c a e s s o p o r t a d a p o r l o s d e c o d i f i c a d o r e s L a y e r I I I , n o p o r t o d o s l o s d e L a y e r I y I I

Sistemas Multimedia e Interacción Gráfica - Curso 2006/07

Estructura archivo MP3 (IV)

F 2 (11,10) Frecuencia de muestreo bits MPEG1 MPEG2 MPEG2.5

00 44100 Hz 22050 Hz 11025 Hz

01 48000 Hz 24000 Hz 12000 Hz

10 32000 Hz 16000 Hz 8000 Hz

11 reserv. reserv. reserv.

G 1 (9) Bit de ajuste 0 - frame no ajustado 1 - frame ajustado con un slot extra

Sirve para asegurarnos que cada frame cumple los requisitos del bitrate.

H 1 (8) Bit Privado, informativo. Si no existe, se pone un checksum de 16 bits antes de los datos de audio

Page 38: 3.- El Sonido.dis.um.es/~jfernand/0607/smig/tema3.pdf3 Sistemas Multimedia e Interacción Gráfica - Curso 2006/07 Generación del sonido El tímpano vibra las partículas de aire

38

Sistemas Multimedia e Interacción Gráfica - Curso 2006/07

Estructura archivo MP3 (V)

I 2 (7,6) Modo 00 - Stereo 01 - Joint stereo (Stereo) 10 - Dual channel (2 mono channels) 11 - Single channel (Mono) Nota: Los archivos de canal dual se construyen a partir de dos mono independientes, cada uno usa la mitad del bitrate.

J 2 (5,4) Extensión de Modo (para Joint stereo)

Determinados directa y dinámicamente por un codificador. Se divide el rango de frecuencias en 32 subbandas. Para Layer I y II los bits determinan las bandas donde se aplica el estéreo intenso. Para Layer III determinan qué tipo de estéreo se usa (intenso o MS)

Layer I y II Layer III

valor Layer I & II

00 bandas 4 a 31

01 bandas 8 a 31

10 bandas 12 a 31

11 bandas 16 a 31

Intenso MS

off off

on off

off on

on on

Sistemas Multimedia e Interacción Gráfica - Curso 2006/07

Estructura archivo MP3 (VI)

K 1 (3) Copyright 0 - Audio sin copyright 1 - Audio con copyright

L 1 (2) Originalidad 0 - Copia 1 - Original

M 2 (1,0) Énfasis 00 - no 01 - 50/15 ms 10 – reservado 11 - CCIT J.17 Indica al decodificador si el fichero ha de ser re-ecualizado. No se suele usar

Page 39: 3.- El Sonido.dis.um.es/~jfernand/0607/smig/tema3.pdf3 Sistemas Multimedia e Interacción Gráfica - Curso 2006/07 Generación del sonido El tímpano vibra las partículas de aire

39

Sistemas Multimedia e Interacción Gráfica - Curso 2006/07

Proceso de codificación MP3

Sistemas Multimedia e Interacción Gráfica - Curso 2006/07

MP3 y sonido surround

� MP3 tradicional no es multicanal

� Extensión multicanal en 2004 compatible con MP3 stereo

� Bitrate similar al MP3 stereo

Page 40: 3.- El Sonido.dis.um.es/~jfernand/0607/smig/tema3.pdf3 Sistemas Multimedia e Interacción Gráfica - Curso 2006/07 Generación del sonido El tímpano vibra las partículas de aire

40

Sistemas Multimedia e Interacción Gráfica - Curso 2006/07

OGG VORBIS

� GNU

� Mayor calidad que MP3 para un mismo tamaño de fichero

� Usa principios matemáticos diferentes a MP3

� Genera archivos más pequeños que MP3 para VBR

� No tiene límite de muestreo teórico

� Múltiples canales (MP3 -> 2)

Sistemas Multimedia e Interacción Gráfica - Curso 2006/07

Estructura de un archivo OGG (I)

� 3 cabeceras– Identificación

– Comentarios

– Configuración

� Comienzo de cabecera

1) [tipo] : valor de 8 bits (1 I ,3 Cm,5 Cf)

2) 0x76, 0x6f, 0x72, 0x62, 0x69, 0x73: 'v','o','r','b','i','s'

Page 41: 3.- El Sonido.dis.um.es/~jfernand/0607/smig/tema3.pdf3 Sistemas Multimedia e Interacción Gráfica - Curso 2006/07 Generación del sonido El tímpano vibra las partículas de aire

41

Sistemas Multimedia e Interacción Gráfica - Curso 2006/07

Estructura de un archivo OGG (II)

� Cabecera de información– 1) [vorbis_version] = 32 bits. Suele estar a 0.– 2) [canales_audios] = 8 bits. Valor mayor que 0.– 3) [ratio_muestreo_audio] =32 bits Valor mayor que 0.– 4) [bitrate_max] = 32 bits– 5) [bitrate_nominal] = 32 bits. No se pone nada cuando se

codifica con VBR.– 6) [bitrate_min] = 32 bits– 7) [tamaño_bloque_0] = 2 exponente (4 bits) Valores

posibles_ 64, 128,256,512,1024,2048, 4096, 8192.– 8) [tamaño_bloque_1] = 2 exponente (4 bits) Debe ser mayor

o igual que el campo anterior– 9) [bandera_framing] = 1 bit. Debe valer 1.Comienzo de

cabecera

Sistemas Multimedia e Interacción Gráfica - Curso 2006/07

Estructura de un archivo OGG (III)

� Cabecera de comentarios– 1) [vendor_length] = 32 bits– 2) [vendor_string] = UTF-8 vector con longitud [vendor_length] – 3) [longitud_lista_comentarios] = 32 bits– 4) iterar de 1 a longitud_lista_comentarios {– 5) [longitud] = 32 bits– 6) comentario = UTF-8 vector como octetos de longitud [longitud] octets– }– 7) [bit_framing] = 1 bit – 8) if ( [bit_framing] a 0 o fin de paquete ) then ERROR

� Estructura comentario– comment[0]="ARTIST=me"; – comment[1]="TITLE=the sound of Vorbis";

Page 42: 3.- El Sonido.dis.um.es/~jfernand/0607/smig/tema3.pdf3 Sistemas Multimedia e Interacción Gráfica - Curso 2006/07 Generación del sonido El tímpano vibra las partículas de aire

42

Sistemas Multimedia e Interacción Gráfica - Curso 2006/07

Estructura de un archivo OGG (IV)� Cabecera de comentarios

– TITLE: Nombre de la pista o trabajo– VERSION: Para diferenciar versiones de una misma pista.– ALBUM: Nombre del álbum al que pertenece la pista.– TRACKNUMBER: Número de pista.– ARTIST: Nombre del compositor.– PERFORMER: Cantante.– COPYRIGHT: Quien tiene los derechos.– LICENSE: Información sobre la licencia– ORGANIZATION: Productora– DESCRIPTION: Descripción del contenido.– GENRE: Género– DATE: Fecha de grabación.– LOCATION: Localidad de grabación.– CONTACT: Información de contacto.– ISRC: Número ISRC para la pista.

Sistemas Multimedia e Interacción Gráfica - Curso 2006/07

Estructura de un archivo OGG (V)

� Cabecera de configuración– Información necesaria para decodificar

– Configuraciones de codebooks

– Valores de transformaciones en dominio temporal

– Floors

– Residuos

– Mapeo de canales

– Modo

Page 43: 3.- El Sonido.dis.um.es/~jfernand/0607/smig/tema3.pdf3 Sistemas Multimedia e Interacción Gráfica - Curso 2006/07 Generación del sonido El tímpano vibra las partículas de aire

43

Sistemas Multimedia e Interacción Gráfica - Curso 2006/07

Sistemas de Grabación/Reproducción de Audio

� SRS

� Dolby AC-3

� Super Audio CD

� HDCD

� DVD-Audio

Sistemas Multimedia e Interacción Gráfica - Curso 2006/07

SRS

�� El sonido estéreo de dos canales ha alcanzado unas cotas de calidad El sonido estéreo de dos canales ha alcanzado unas cotas de calidad excepcionales y puede reproducir en cierta forma algunos elementos de excepcionales y puede reproducir en cierta forma algunos elementos de movimiento de sonido movimiento de sonido �� SIN EMBARGO, NO SIRVE PARA DISTINGUIR SI EL SIN EMBARGO, NO SIRVE PARA DISTINGUIR SI EL SONIDO NOS VIENE DESDE ATRÁS O POR ARRIBA.SONIDO NOS VIENE DESDE ATRÁS O POR ARRIBA.

�� El sistema SRS es un sistema de reproducción (no de grabación) que aprovecha El sistema SRS es un sistema de reproducción (no de grabación) que aprovecha las grabaciones estéreo para producir un efecto de <<realce>> lateral. El sonido las grabaciones estéreo para producir un efecto de <<realce>> lateral. El sonido parece que adquiere cuerpo al activar un filtro SRS.parece que adquiere cuerpo al activar un filtro SRS.

�� En realidad, el sonido sigue siendo estéreo, ya que es imposible obtener un En realidad, el sonido sigue siendo estéreo, ya que es imposible obtener un efecto de volumen con sólo dos altavoces, pero el oído es más sensible a las efecto de volumen con sólo dos altavoces, pero el oído es más sensible a las altas frecuencias que a las bajas y a los sonidos laterales que a los frontales.altas frecuencias que a las bajas y a los sonidos laterales que a los frontales.

�� Por tanto, el SRS toma las diferencias entre las señales izquierda y derecha y Por tanto, el SRS toma las diferencias entre las señales izquierda y derecha y <<les sube el volumen>>. Esta elevación de volumen de ciertas frecuencias <<les sube el volumen>>. Esta elevación de volumen de ciertas frecuencias hacen que el cerebro crea que viene de los lados, cuando en realidad vienen de hacen que el cerebro crea que viene de los lados, cuando en realidad vienen de frente.frente.

Page 44: 3.- El Sonido.dis.um.es/~jfernand/0607/smig/tema3.pdf3 Sistemas Multimedia e Interacción Gráfica - Curso 2006/07 Generación del sonido El tímpano vibra las partículas de aire

44

Sistemas Multimedia e Interacción Gráfica - Curso 2006/07

DOLBY SURROUND PROLOGIC

�� El sistema El sistema DOLBY SURROUND PROLOGICDOLBY SURROUND PROLOGIC es uno de los es uno de los sistemas de gestión y control de sonido envolvente que más se ha sistemas de gestión y control de sonido envolvente que más se ha difundido a nivel doméstico. El sistema emplea cinco altavoces difundido a nivel doméstico. El sistema emplea cinco altavoces independientes apoyados por un refuerzo de graves.independientes apoyados por un refuerzo de graves.

–– El altavoz frontal se encarga de reproducir los diálogos.El altavoz frontal se encarga de reproducir los diálogos.

–– Los delanteros izquierdo y derecho ofrecen los efectos especiales de Los delanteros izquierdo y derecho ofrecen los efectos especiales de banda sonora.banda sonora.

–– Los traseros izquierdo y derecho apoyan a los delanteros consiguiendo Los traseros izquierdo y derecho apoyan a los delanteros consiguiendo el efecto envolvente.el efecto envolvente.

�� Este sistema es analógico y presenta algunos inconvenientes. Para Este sistema es analógico y presenta algunos inconvenientes. Para solucionar estos inconvenientes los laboratorios Dolby desarrollaron solucionar estos inconvenientes los laboratorios Dolby desarrollaron el DOLBY DIGITAL ACel DOLBY DIGITAL AC--3.3.

Sistemas Multimedia e Interacción Gráfica - Curso 2006/07

Dolby Digital AC-3 (I).

�� Los métodos de tratamiento del sonido en Dolby Digital es a través de la Los métodos de tratamiento del sonido en Dolby Digital es a través de la codificación del audio por medio de algoritmos de compresión y en codificación del audio por medio de algoritmos de compresión y en codificación multicanal.codificación multicanal.

�� Por medio de la codificación multicanal se consigue una mejor Por medio de la codificación multicanal se consigue una mejor percepción de las diferentes frecuencias que se obtienen en un solo percepción de las diferentes frecuencias que se obtienen en un solo sonido.sonido.

�� Los algoritmos de compresión se fundamentan en dos fenómenos Los algoritmos de compresión se fundamentan en dos fenómenos principalmente:principalmente:

–– La curva de sensibilidad del oído.La curva de sensibilidad del oído.

–– El fenómeno de enmascaramiento.El fenómeno de enmascaramiento.

�� Como sabemos, el oído humano detecta sonidos entre 20Hz y 20Khz.Como sabemos, el oído humano detecta sonidos entre 20Hz y 20Khz.

Page 45: 3.- El Sonido.dis.um.es/~jfernand/0607/smig/tema3.pdf3 Sistemas Multimedia e Interacción Gráfica - Curso 2006/07 Generación del sonido El tímpano vibra las partículas de aire

45

Sistemas Multimedia e Interacción Gráfica - Curso 2006/07

Dolby Digital AC-3 (II)

6 CANALES DE AUDIO (5.1)6 CANALES DE AUDIO (5.1)

•• Frontal izquierdo (20Hz a 20Khz).Frontal izquierdo (20Hz a 20Khz).•• Frontal derecho (20Hz a 20Khz).Frontal derecho (20Hz a 20Khz).•• Central (20Hz a 20Khz).Central (20Hz a 20Khz).•• Surround trasero izq. (20Hz a 20Khz).Surround trasero izq. (20Hz a 20Khz).•• Surround trasero der. (20Hz a 20Khz).Surround trasero der. (20Hz a 20Khz).•• Subwoofer de baja frecuencia Subwoofer de baja frecuencia (limitado a graves).(limitado a graves).

Sistemas Multimedia e Interacción Gráfica - Curso 2006/07

Dolby Digital AC-3 (III).

�� Dolby Digital emplea la tecnología de procesado del Dolby Digital emplea la tecnología de procesado del sonido basado en AC3 (Audio Code Number 3) sonido basado en AC3 (Audio Code Number 3) --> > Sistema de codificación digital desarrollado para Sistema de codificación digital desarrollado para almacenar y transmitir señales multicanal digitales.almacenar y transmitir señales multicanal digitales.

�� Este sistema consigue la la separación entre canales Este sistema consigue la la separación entre canales posibilitando que sonidos individualizados lleguen posibilitando que sonidos individualizados lleguen desde múltiples direcciones al oyente.desde múltiples direcciones al oyente.

�� En los CDs y Laser Discs, se emplea audio digital en En los CDs y Laser Discs, se emplea audio digital en formato PCM. En esta codificación, se muestrea la formato PCM. En esta codificación, se muestrea la onda analógica de 16 bits 44.100 veces por segundo.onda analógica de 16 bits 44.100 veces por segundo.

Page 46: 3.- El Sonido.dis.um.es/~jfernand/0607/smig/tema3.pdf3 Sistemas Multimedia e Interacción Gráfica - Curso 2006/07 Generación del sonido El tímpano vibra las partículas de aire

46

Sistemas Multimedia e Interacción Gráfica - Curso 2006/07

Dolby Digital AC-3 (IV).

�� Para almacenar 5.1 canales separados de información, una forma Para almacenar 5.1 canales separados de información, una forma de reducir la cantidad resultante de bits podría ser reduciendo el de reducir la cantidad resultante de bits podría ser reduciendo el número de bits de cuantificación, (es decir, pasar de 16 a 10 bits) número de bits de cuantificación, (es decir, pasar de 16 a 10 bits) pero sin un aumento del nivel de ruido del sistema.pero sin un aumento del nivel de ruido del sistema.

�� DD utiliza algoritmos complejos para calcular la distribución DD utiliza algoritmos complejos para calcular la distribución óptima de los bits sin ninguna degradación audible del sonido.óptima de los bits sin ninguna degradación audible del sonido.

�� Sin embargo, cuanto menos son los bits usados en la codificación Sin embargo, cuanto menos son los bits usados en la codificación para describir una señal de audio, mayor es el ruido. ¿cómo para describir una señal de audio, mayor es el ruido. ¿cómo soluciona esto Dolby Digital?. Los hace de dos forma:soluciona esto Dolby Digital?. Los hace de dos forma:

–– FILTRADO DIGITAL.FILTRADO DIGITAL.–– ENMASCARAMIENTO.ENMASCARAMIENTO.

Sistemas Multimedia e Interacción Gráfica - Curso 2006/07

Super Audio CD (I)

� Evolución del CD (Sony & Philips)� Codificación Direct Stream Digital� Tipos de Super Audio CDs

– 1 capa (lector SACD)– Doble capa (lector SACD)– Híbridos (lector CD)

� Disco multicanal� Protección de contenido

– PSP-PDM– Acceso contenido/disco– Control reproducción

Page 47: 3.- El Sonido.dis.um.es/~jfernand/0607/smig/tema3.pdf3 Sistemas Multimedia e Interacción Gráfica - Curso 2006/07 Generación del sonido El tímpano vibra las partículas de aire

47

Sistemas Multimedia e Interacción Gráfica - Curso 2006/07

Super Audio CD (II)

Sistemas Multimedia e Interacción Gráfica - Curso 2006/07

Comparativa CD - SACDAspecto Super Audio CD CD

Diámetro (mm) 120 120

Grosor (mm) 1’2 1’2

Tamaño pista(micras) 0’74 1’6

Capacidad (Mbytes) 4700 780

Longitud de onda (nm) 650 780

Apertura numérica 0’6 0’45

Codificación Audio DSD PCM Lineal

Frecuencia de muestreo (kHz) 2822’4 44’1

Tamaño unidad sampleo (bit) 1 16

Canales 2,3,3.1,4,4.1,5,5.1 2

Pistas 255 99

Índices 255 99

Tiempo de reproducción estéreo 109 74

Tiempo de reproducción multicanal 70-80 -

Datos adicionales (kbps) 73-900 43’2

Rango de frecuencias (Hz) DC-100000 (DSD) 5-20000

Rango dinámico (dB) >120 96

Page 48: 3.- El Sonido.dis.um.es/~jfernand/0607/smig/tema3.pdf3 Sistemas Multimedia e Interacción Gráfica - Curso 2006/07 Generación del sonido El tímpano vibra las partículas de aire

48

Sistemas Multimedia e Interacción Gráfica - Curso 2006/07

HDCD

� Mejorar calidad CD permitiendo compatibilidad

� Cuantificación 20 bits

� Rango dinámico 120 dB

Sistemas Multimedia e Interacción Gráfica - Curso 2006/07

DVD-Audio: Características

� Audio multicanal con protección anticopia� Reproducción CDs� Niveles de calidad y canales flexibles� Extensibilidad� Contenidos multimedia� Sistema de navegación amigable� Conectividad a Internet� Codificación

– LPCM – MLP

Page 49: 3.- El Sonido.dis.um.es/~jfernand/0607/smig/tema3.pdf3 Sistemas Multimedia e Interacción Gráfica - Curso 2006/07 Generación del sonido El tímpano vibra las partículas de aire

49

Sistemas Multimedia e Interacción Gráfica - Curso 2006/07

Formatos DVD-Audio

Formato Contenido

DVD-Audio (no video) Disco de audio con texto, menús e imágenes opcionales

DVD-Audio (con vídeo) Añade vídeo (subconjunto de la especificación DVD-Vídeo)

DVD-Video Vídeo sin contenido DVD-Audio

Híbrido DVD-Audio y DVD-Vídeo más una capa CD.

Sistemas Multimedia e Interacción Gráfica - Curso 2006/07

DVD-Audio: Estructura de disco

Page 50: 3.- El Sonido.dis.um.es/~jfernand/0607/smig/tema3.pdf3 Sistemas Multimedia e Interacción Gráfica - Curso 2006/07 Generación del sonido El tímpano vibra las partículas de aire

50

Sistemas Multimedia e Interacción Gráfica - Curso 2006/07

DVD-Audio: Codificación

Parámetro Audio

Codificación LPCM o MLP

Frecuencia de muestreo (kHz) 44.1/48/88.2/96/ 176.4/192

Bits por muestra 16/20/24

Canales máximos 6 (@ 96 kHz) o2 (@ 176.4/192 kHz)

Bitrate máximo 9.6 Mb/s

Sistemas Multimedia e Interacción Gráfica - Curso 2006/07

DVD-Audio: Configuraciones

Frecuencia de muestreo (kHz)

Cuantización 2 canales 4 canales 6 canales

44.1/48 16 a 24 LPCM/MLP

96/88.2 16 LPCM/MLP

96/88.2 20 o 24 LPCM/MLP MLP

192/176.4 16 a 24 MLP No

Page 51: 3.- El Sonido.dis.um.es/~jfernand/0607/smig/tema3.pdf3 Sistemas Multimedia e Interacción Gráfica - Curso 2006/07 Generación del sonido El tímpano vibra las partículas de aire

51

Sistemas Multimedia e Interacción Gráfica - Curso 2006/07

DVD-Audio: Tiempos de reproducción

Canales de audio ConfiguraciónTiempo de reproducción

Capa simple Capa doble

2 canales 192kHz, 24bits 120 mins 215 mins

6 canales 96kHz, 24bits 86 mins 156 mins

2 canales 44.1kHz, 16 bits 13 hrs 23.6 hrs

Sistemas Multimedia e Interacción Gráfica - Curso 2006/07

Comparativa de sistemas de audio digital

CD HDCD SACD DVD-Audio

Codificación PCM PCM PDM (Basado en DSD) PCM

Cuantificación 16 bits 20 bits 1 bit 12 / 16 / 20 ó 24 bits

Capacidad 650Mb 650Mb

1,9Gb – Monocapa3,9Gb – Bicapa2,6Gb - Híbrido

4,7Gb – Monocapa8,5Gb – Bicapa17Gb – Bicapa de Doble Cara

Canales 2 (estéreo) 2 (estéreo) Hasta 6 Hasta 6

Respuesta en Frecuencia 5 - 20KHz 5 -22KHz 0 -100KHz 0 - 96KHz (max)

Dinámica 96dB 120dB 120 dB 144dB

Frecuencia de Muestreo (estéreo) 44,1KHz 44,1KHz 2.882,4KHz 44,1 / 88,2 / 176,4KHz

ó48 / 96 / 192KHz

Frecuencia de Muestreo (multicanal) no disponible no disponible 2.882,4KHz 44,1 / 88,2KHz ó

48 / 96KHz

Velocidad de Transferencia de Datos 1,4Mbps 1,4Mbps 2,8Mbps Variable hasta 9,6

Mbps

Page 52: 3.- El Sonido.dis.um.es/~jfernand/0607/smig/tema3.pdf3 Sistemas Multimedia e Interacción Gráfica - Curso 2006/07 Generación del sonido El tímpano vibra las partículas de aire

52

Sistemas Multimedia e Interacción Gráfica - Curso 2006/07

Sonido en Internet (I)Ventajas Desventajas

ArchivosTransportablesdesde el servidoral cliente

a).- Al abrirla página

• Presentación audible mientras el usuario visualiza la página

• La calidad del sonido no se pierde, se reproducen como fueron creados

• Ocupan tiempo antes de presentar la página, esto pueden desesperar al usuario.

• Ocupan espacio de disco duro.• Puede ser que el archivo sea de un

formato que el visualizador no pueda reproducir

b) - A elección

• La pagina no se vuelve lenta• El usuario puede saber si

cuenta con el software necesario para la reproducción

• Dan la opción al usuario de elegir el archivo que desea escuchar cuando el desee

• La calidad del sonido no se pierde, se reproducen como fueron creados

• El usuario tiene que esperar a que el archivo sea transportado en su totalidad, esto implica tiempo

Sistemas Multimedia e Interacción Gráfica - Curso 2006/07

Sonido en Internet (II)

2.-Archivos en tiempo real

a).- Al abrirla página

•La página no se vuelve lenta y casi es visualizada en el momento en que se escucha el audio

•Puede que no se cuente con el software necesario para la reproducción, cosa que se soluciona fácilmente ya que la mayoría de los reproductores son gratuitos y se encuentran con facilidad en la Web•La calidad del sonido varía según el propósito, y la velocidad de la red

b)- A elección•La pagina no se vuelve lenta

•Dan la opción al usuario de elegir el archivo que desea escuchar cuando el desee

•Algunos reproductores tienen la opción de adelantar - regresar o detener en el momento que se desee

• Puede que no se cuente con el software necesario para la reproducción, cosa que se soluciona fácilmente ya que la mayoría de los reproductores son gratuitos y se encuentran con facilidad en la Web• La calidad del sonido varía según el propósito, y la velocidad de la red

Page 53: 3.- El Sonido.dis.um.es/~jfernand/0607/smig/tema3.pdf3 Sistemas Multimedia e Interacción Gráfica - Curso 2006/07 Generación del sonido El tímpano vibra las partículas de aire

53

Sistemas Multimedia e Interacción Gráfica - Curso 2006/07

Inserción de sonido en web

� Comandos HTML<EMBED SRC="BLUES.MID" height="60" width="144" autostart="true" ><

� Atributos – SCR. Localización del archivo – ALIGN. Alinea el objeto en la página (top, middle, bottom,

baseline) – HEIGHT. Altura del objeto – WIDTH. Ancho del objeto – Autostart. Permite decidir la ejecución automática o manual.

� Frontpage– Insertar/Sonido de Fondo– Insertar /Objeto/ Archivo de Sonido

� Dreamweaver (prácticas)

Sistemas Multimedia e Interacción Gráfica - Curso 2006/07

Streaming

� Tecnología de transmisión y emisión de audio/vídeo a través de Internet

� Proceso de streaming– Compresión (con/sin pérdida)

– Troceado

– Envío por Internet

� Protocolos de streaming: – RTSP/UDP

– HTTP

Page 54: 3.- El Sonido.dis.um.es/~jfernand/0607/smig/tema3.pdf3 Sistemas Multimedia e Interacción Gráfica - Curso 2006/07 Generación del sonido El tímpano vibra las partículas de aire

54

Sistemas Multimedia e Interacción Gráfica - Curso 2006/07

Formatos de Streaming (I)� RealMedia/Real Audio

– UNIX/Windows– Múltiples tipos de medios como ficheros separados de forma simultánea (SMIL)– Velocidad adaptada a la conexión del usuario– Buffering, detección y compensación de errores– Multicast– Inicio por petición del usuario– No muy adecuado para sonidos interactivos y bucles de sonido

� Netshow– Windows NT/2000, no soporta SMIL– Todos los medios en un fichero ASF.– Integración con herramientas de Microsoft (Media Player, Media Server, …)

� QuickTime– Mac/Windows– RTSP con Mac OS X Server, HTTP; RTP– Arquitectura de códecs básicos + adicionales que se descargan en segundo plano– Acepta MP3, Flash, MIDI y casi cualquier formato de audio.

� Flash– Streaming Audio MP3, alta integración con Real Media. Animaciones combinando ambas tecnologías

� Beatnik Rich Music Format– Basado HTML– Bandas sonoras y composiciones que cambian por acciones del usuario– Usa MIDI (menos tamaño que Flash)

Sistemas Multimedia e Interacción Gráfica - Curso 2006/07

Formatos de Streaming (II)

� Liquid Audio– Transmisión segura de música por Internet

– Componentes� Liquifier Pro: Codificador calidad CD, protección copia.

Huella digital, letras, créditos.

� Liquid Server: Publicación y alojamiento de Liquid Tracks

� Liquid Player: Reproductor que permite compra de Liquid Tracks en Windows/Mac a través de Internet y visualización de fotos, letras o promociones contenidas en el audio

� Liquid Express: Permite en tiempo real y segura la distribución y gestión profesional de audio

Page 55: 3.- El Sonido.dis.um.es/~jfernand/0607/smig/tema3.pdf3 Sistemas Multimedia e Interacción Gráfica - Curso 2006/07 Generación del sonido El tímpano vibra las partículas de aire

55

Sistemas Multimedia e Interacción Gráfica - Curso 2006/07

Elección del formato adecuado� Sonidos interactivos: Flash, Beatnik� Reproducción continua: RealMedia, MP3, Windows Media, QuickTime� Coste:

– Software cliente– Software servidor– Ancho de banda necesario

� Curva de aprendizaje: RealMedia mucha documentación y herramientas automatizadas.

� Escala de distribución� Fidelidad y compresión de audio: MP3� Rendimiento para ancho de banda reducidos

– Adaptabilidad de conexión� Bueno: RealMedia� Malo: Flash, Shockwave

– Tamaño paquetes� Bueno: Beatnik

� Rendimiento servidor: Eventos en directo, codificación en tiempo real y streaming

– Líderes: RealMedia, WindowsMedia, Shoutcast(MP3)– RM/WM negocian ancho de banda lo que asegura reproducción continua– Subcontratación de distribución de contenidos para transmisiones a gran escala