Title: A1262627150fLIal
1Procesamiento Digital de Imágenes
Compresión de Señales de Audio con MPEG-1
Mtro. Jorge Arturo Pardiñas Mir
2- Digitalización de una señal analógica
- Compresión de señales de audio
- Compresión MPEG
- Codificación Perceptiva
- Codificación en el Dominio de la Frecuencia
- Conmutación de Ventana
- Asignación Dinámica de Bits
- MPEG-1 Layer I
- MPEG-1 Layer II
- MPEG-1 Layer III
3información digital binaria d(t)
señal analógica f(t)
MUESTREO
CUANTIZACIÓN
CODIFICACIÓN
frecuencia de muestreo
4señal muestreada (infinito número de valores
posibles de las muestras)
señal analógica f(t)
MUESTREO
frecuencia de muestreo
5fmuestreo gt 2 fmax
6fm(t)
señal muestreada (infinito número de valores
posibles de las muestras)
señal cuantizada (n valores posibles)
CUANTIZACIÓN
7n 2m n valores m bits
8código digital de m bits ( n 2 m )
fm(t)
0111 0110 0101 0100 0011 0010 0001 0000 1001 1010
.7 .6 .5 .4 .3 .2 .1
-.1 -.2
información digital binaria d(t) (cada muestra
representada con m bits)
señal cuantizada (n valores posibles)
CODIFICACIÓN
9(No Transcript)
10Menor velocidad de transmisión de la señal
digital resultante. Menor cantidad de bits para
su almacenamiento.
11- Eliminación de información redundante.
- Eliminación de información irrelevante.
SIN PÉRDIDAS CON PÉRDIDAS
12Algunos Estándares de Compresión de Señales de
Audio
- Voz telefónica. 64 kbps
- Voz telefónica. 32 kbps
- Voz de banda ancha. 64 kbps
- Voz de banda ancha. 16 kbps
- Voz telefónica. 2.4 kbps
- Voz radio celular digital. 8 kbps
- Audio de Banda Ancha.
- Monofónico 32 y 192 kbps.
- Estereofónico 128-384 kbps
- ITU G.711
-
- ITU G.721
- ITU G.722
- ITU G.728
- LPC-10E
- IS-54
- MPEG-1
13Estándar de la Organización Internacional de
Estandarización (ISO) Generado por el grupo de
trabajo Moving Pictures Experts Group
(MPEG) Objetivo Codificación de video y audio
para medios digitales de almacenamiento hasta
cerca de 1.5 Mb/s Fases MPEG-1, MPEG-2, MPEG-4,
MPEG-7
14MPEG-1 es la primera fase del trabajo del grupo
MPEG, cuyo producto es el estandar ISO/IEC 11172
adoptado a finales de 1992. MPEG-1 se divide en
5 partes 1 Sistemas 2 Video 3 Audio 4
Especificación de Pruebas 5 Implementación en
Software
15ISO/IEC 11172-3
Señales de audio monofónicas y estereofónicas. Ba
sado en un modelo psicoacústico que considera las
caracterÃsticas auditivas del ser humano. Tres
modos de operación (Layers)
16Codificación Perceptiva Codificación en el
Dominio de la Frecuencia Conmutación de
Ventana Asignación Dinámica de Bits
17El oÃdo humano se comporta como si tuviera
filtros internos pasa-banda (bandas
crÃticas) Fenómeno de enmascaramiento un sonido
deja de ser escuchado (percibido) en presencia de
otro de mayor intensidad. Sonido enmascarador
inhibidor. Sonido enmascarado inhibido El
enmascaramiento es más notorio cuando los sonidos
simultáneos pertenecen a una misma banda
crÃtica. También se presenta enmascaramiento
cuando los sonidos se producen en un intervalo de
tiempo pequeño.
18(No Transcript)
19Respuesta en frecuencia del oÃdo en función de la
intensidad del sonido
UMBRAL ABSOLUTO DE PERCEPCIÓN
Cambios en el umbral absoluto de percepción ante
la presencia de un sonido enmascarador
20- El umbral de percepción cambia en el
- tiempo
- El efecto de enmascaramiento depende
- de la presión de sonido, la frecuencia del
- enmascarador y de caracterÃsticas de
- este y del sonido enmascarado
- Tiene mayor poder enmascarador un
- sonido de ruido que un sonido puro (una
- sola frecuencia)
21- El enmascarador puede enmascarar un sonido
- aún antes de producirse el primero.
- Se enmascara un sonido si este se genera dentro
- de cierto tiempo después de la generación del
- enmascarador
22C A N A L D I G I T A L
información digital binaria d(t)
información digital binaria d(t)
23Se identifica y elimina la información redundante
e irrelevante en el dominio de la frecuencia.
La señal fuente se divide en bandas de
frecuencia y estas señales son cuantizadas
independientemente. La señal fuente es
transformada y los coeficientes resultantes son
cuantizados y transmitidos, en lugar de la señal
en el tiempo.
24CODIFICADOR
DECODIFICADOR
banco de filtros de sÃntesis
banco de filtros de análisis
canal de comunicación
decodificadores
codificadores
x1(t)
y1(t)
y1(t)
D/A
A/D
D E M U L T I P L E X O R
x2(t)
y2(t)
y2(t)
M U L T I P L E X O R
D/A
A/D
y3(t)
x3(t)
y3(t)
x(t)
y(t)
A/D
D/A
. . .
. . .
xn(t)
yn(t)
A/D
D/A
yn(t)
ANALISIS
ANALISIS
25x1(t)
A/D
x2(t)
A/D
x3(t)
x(t)
A/D
. . .
xn(t)
A/D
ANALISIS
26(No Transcript)
27La codificación se realiza analizando bloques de
la señal fuente correspondientes a cierto tiempo
o número de muestras (ventana). El tamaño de
los bloques favorece de diferente forma a las
operaciones que se realizan en el proceso de
codificación. La elección del tamaño de un
bloque o ventana, de manera que este pueda
variarse dependiendo de las caracterÃsticas de la
señal que se analiza, proporciona mayor
eficiencia al proceso.
28Se asignan los bits necesarios para la
codificación de acuerdo a la resolución requerida
dependiendo de las caracterÃsticas particulares
de la señal que se cuantiza en ese momento.
Más bits menor ruido de
cuantización Menos bits mayor ruido
de cuantización
29fm(t)
.7 .6 .5 .4 .3 .2 .1
-.1 -.2
La señal varÃa entre 8 niveles de cuantización
La señal varÃa entre 2 niveles de cuantización
se requieren 3 bits
se requiere 1 bit
30Frecuencias de Muestreo de 32, 44.1 y 48
KHz Subdivisión de la señal en 32 subbandas
igualmente espaciadas a través de un banco de
filtros. Filtros de subbanda FIR de 512
coeficientes Ancho de banda de cada subbanda
fmuestreo/64
31Velocidad de 32 kbps (mono) a 448 kbps
(stereo) Análisis frecuencial con FFT de 512
puntos Cada señal de subbanda es de una longitud
de 12 muestras La cuantización se realiza en
base a la velocidad deseada, fija.
32Velocidad de 32 kbps (mono) a 384 kbps
(stereo) Análisis frecuencial con FFT de 1024
puntos Cada señal de subbanda es de una longitud
de 36 muestras La cuantización se realiza en
base a la velocidad deseada, fija.
33información digital binaria d(t)
C A N A L D I G I T A L
información digital binaria d(t)
34Velocidad de 32 kbps (mono) a 320 kbps
(stereo) Análisis frecuencial con FFT de 1024
puntos Se aplica la transformada de coseno
discreto modificada (MDCT) de 6 u 8 puntos a cada
señal de subbanda, obteniéndose el equivalente de
hasta 576 componentes de frecuencia Se codifica
la información de los coeficientes de la MDCT con
Codificación Huffman. Codificación con velocidad
variable
35(No Transcript)
36- INTERNATIONAL ORGANISATION FOR STANDARDISATION
(ORGANISATION INTERNATIONALE DE NORMALISATION) - http//www.iso.ch
- ISO/IEC JTC1/SC29/WG11 / CODING OF MOVING
PICTURES AND AUDIO - http//drogo.cselt.stet.it/mpeg/standards/mpeg-1/m
peg-1.htm - Peter Noll, MPEG Digital Audio Coding, IEEE
Signal Proccesing Mag., vol. 14, no. 5, pp.
59-81, Sep. 1997. - Peter Noll, Wideband Speech and Audio Coding,
IEEE Communications Mag., vol. 31, no. 11, pp.
34-44, Nov, 1993. - Allen Gersho, Advances in Speech and Audio
Compression, Proceedings of the IEEE, vol. 82,
no. 6, pp. 900-918, June 1994. - Karlheinz Brandenburg, MP3 and AAC Explained,
AES 17th International Conference on High Quality
Audio Coding. (http//www.aes.org) - Fraunhofer Institute for Integrated Circuits/
Audio and Multimedia http//www.iis.fhg.de/amm/
index.html - Marco Joel GracÃan Cisneros, Análisis de
algoritmos de compresión de audio MPEG-I e
implementación del decodificador MPEG-I Layer I
en tiempo real usando un DSP, Tesis de MaestrÃa
en Electrónica Industrial, Guadalajara, México
edición de autor, 1998. - Jorge Arturo Pardiñas Mir, Codificador /
Decodificador de voz utilizando la técnica de
filtraje por sub bandas, Tesis de MaestrÃa en
Electrónica Industrial, Guadalajara, México
edición de autor, 1998.
37Procesamiento Digital de Imágenes
Compresión de Señales de Audio con MPEG-1
FIN
Mtro. Jorge Arturo Pardiñas Mir