A1262627150fLIal - PowerPoint PPT Presentation

1 / 37

About This Presentation

Title:

A1262627150fLIal

Description:

INTERNATIONAL ORGANISATION FOR STANDARDISATION (ORGANISATION INTERNATIONALE DE NORMALISATION) ... Explained', AES 17th International Conference on High Quality ... – PowerPoint PPT presentation

Number of Views:32

Avg rating:3.0/5.0

Slides: 38

Provided by: jorgep7

Category:

more less

Transcript and Presenter's Notes

Title: A1262627150fLIal

1
Procesamiento Digital de Imágenes
Compresión de Señales de Audio con MPEG-1
Mtro. Jorge Arturo Pardiñas Mir
2

Digitalización de una señal analógica
Compresión de señales de audio
Compresión MPEG
Codificación Perceptiva
Codificación en el Dominio de la Frecuencia
Conmutación de Ventana
Asignación Dinámica de Bits
MPEG-1 Layer I
MPEG-1 Layer II
MPEG-1 Layer III

3
información digital binaria d(t)
señal analógica f(t)
MUESTREO
CUANTIZACIÓN
CODIFICACIÓN
frecuencia de muestreo
4
señal muestreada (infinito número de valores
posibles de las muestras)
señal analógica f(t)
MUESTREO
frecuencia de muestreo
5
fmuestreo gt 2 fmax
6
fm(t)
señal muestreada (infinito número de valores
posibles de las muestras)
señal cuantizada (n valores posibles)
CUANTIZACIÓN
7
n 2m n valores m bits
8
código digital de m bits ( n 2 m )
fm(t)
0111 0110 0101 0100 0011 0010 0001 0000 1001 1010
.7 .6 .5 .4 .3 .2 .1
-.1 -.2
información digital binaria d(t) (cada muestra
representada con m bits)
señal cuantizada (n valores posibles)
CODIFICACIÓN
9
(No Transcript)
10
Menor velocidad de transmisión de la señal
digital resultante. Menor cantidad de bits para
su almacenamiento.
11

Eliminación de información redundante.
Eliminación de información irrelevante.

SIN PÉRDIDAS CON PÉRDIDAS
12
Algunos Estándares de Compresión de Señales de
Audio

Voz telefónica. 64 kbps
Voz telefónica. 32 kbps
Voz de banda ancha. 64 kbps
Voz de banda ancha. 16 kbps
Voz telefónica. 2.4 kbps
Voz radio celular digital. 8 kbps
Audio de Banda Ancha.
Monofónico 32 y 192 kbps.
Estereofónico 128-384 kbps

ITU G.711
ITU G.721
ITU G.722
ITU G.728
LPC-10E
IS-54
MPEG-1

13
Estándar de la Organización Internacional de
Estandarización (ISO) Generado por el grupo de
trabajo Moving Pictures Experts Group
(MPEG) Objetivo Codificación de video y audio
para medios digitales de almacenamiento hasta
cerca de 1.5 Mb/s Fases MPEG-1, MPEG-2, MPEG-4,
MPEG-7
14
MPEG-1 es la primera fase del trabajo del grupo
MPEG, cuyo producto es el estandar ISO/IEC 11172
adoptado a finales de 1992. MPEG-1 se divide en
5 partes 1 Sistemas 2 Video 3 Audio 4
Especificación de Pruebas 5 Implementación en
Software
15
ISO/IEC 11172-3
Señales de audio monofónicas y estereofónicas. Ba
sado en un modelo psicoacústico que considera las
características auditivas del ser humano. Tres
modos de operación (Layers)
16
Codificación Perceptiva Codificación en el
Dominio de la Frecuencia Conmutación de
Ventana Asignación Dinámica de Bits
17
El oído humano se comporta como si tuviera
filtros internos pasa-banda (bandas
críticas) Fenómeno de enmascaramiento un sonido
deja de ser escuchado (percibido) en presencia de
otro de mayor intensidad. Sonido enmascarador
inhibidor. Sonido enmascarado inhibido El
enmascaramiento es más notorio cuando los sonidos
simultáneos pertenecen a una misma banda
crítica. También se presenta enmascaramiento
cuando los sonidos se producen en un intervalo de
tiempo pequeño.
18
(No Transcript)
19
Respuesta en frecuencia del oído en función de la
intensidad del sonido
UMBRAL ABSOLUTO DE PERCEPCIÓN
Cambios en el umbral absoluto de percepción ante
la presencia de un sonido enmascarador
20

El umbral de percepción cambia en el
tiempo
El efecto de enmascaramiento depende
de la presión de sonido, la frecuencia del
enmascarador y de características de
este y del sonido enmascarado
Tiene mayor poder enmascarador un
sonido de ruido que un sonido puro (una
sola frecuencia)

El enmascarador puede enmascarar un sonido
aún antes de producirse el primero.
Se enmascara un sonido si este se genera dentro
de cierto tiempo después de la generación del
enmascarador

22
C A N A L D I G I T A L
información digital binaria d(t)
información digital binaria d(t)
23
Se identifica y elimina la información redundante
e irrelevante en el dominio de la frecuencia.
La señal fuente se divide en bandas de
frecuencia y estas señales son cuantizadas
independientemente. La señal fuente es
transformada y los coeficientes resultantes son
cuantizados y transmitidos, en lugar de la señal
en el tiempo.
24
CODIFICADOR
DECODIFICADOR
banco de filtros de síntesis
banco de filtros de análisis
canal de comunicación
decodificadores
codificadores
x1(t)
y1(t)
y1(t)
D/A
A/D
D E M U L T I P L E X O R
x2(t)
y2(t)
y2(t)
M U L T I P L E X O R
D/A
A/D
y3(t)
x3(t)
y3(t)
x(t)
y(t)

A/D
D/A
. . .
. . .
xn(t)
yn(t)
A/D
D/A
yn(t)
ANALISIS
ANALISIS
25
x1(t)
A/D
x2(t)
A/D
x3(t)
x(t)
A/D
. . .
xn(t)
A/D
ANALISIS
26
(No Transcript)
27
La codificación se realiza analizando bloques de
la señal fuente correspondientes a cierto tiempo
o número de muestras (ventana). El tamaño de
los bloques favorece de diferente forma a las
operaciones que se realizan en el proceso de
codificación. La elección del tamaño de un
bloque o ventana, de manera que este pueda
variarse dependiendo de las características de la
señal que se analiza, proporciona mayor
eficiencia al proceso.
28
Se asignan los bits necesarios para la
codificación de acuerdo a la resolución requerida
dependiendo de las características particulares
de la señal que se cuantiza en ese momento.
Más bits menor ruido de
cuantización Menos bits mayor ruido
de cuantización
29
fm(t)
.7 .6 .5 .4 .3 .2 .1
-.1 -.2
La señal varía entre 8 niveles de cuantización
La señal varía entre 2 niveles de cuantización
se requieren 3 bits
se requiere 1 bit
30
Frecuencias de Muestreo de 32, 44.1 y 48
KHz Subdivisión de la señal en 32 subbandas
igualmente espaciadas a través de un banco de
filtros. Filtros de subbanda FIR de 512
coeficientes Ancho de banda de cada subbanda
fmuestreo/64
31
Velocidad de 32 kbps (mono) a 448 kbps
(stereo) Análisis frecuencial con FFT de 512
puntos Cada señal de subbanda es de una longitud
de 12 muestras La cuantización se realiza en
base a la velocidad deseada, fija.
32
Velocidad de 32 kbps (mono) a 384 kbps
(stereo) Análisis frecuencial con FFT de 1024
puntos Cada señal de subbanda es de una longitud
de 36 muestras La cuantización se realiza en
base a la velocidad deseada, fija.
33
información digital binaria d(t)
C A N A L D I G I T A L
información digital binaria d(t)
34
Velocidad de 32 kbps (mono) a 320 kbps
(stereo) Análisis frecuencial con FFT de 1024
puntos Se aplica la transformada de coseno
discreto modificada (MDCT) de 6 u 8 puntos a cada
señal de subbanda, obteniéndose el equivalente de
hasta 576 componentes de frecuencia Se codifica
la información de los coeficientes de la MDCT con
Codificación Huffman. Codificación con velocidad
variable
35
(No Transcript)
36

INTERNATIONAL ORGANISATION FOR STANDARDISATION
(ORGANISATION INTERNATIONALE DE NORMALISATION)
http//www.iso.ch
ISO/IEC JTC1/SC29/WG11 / CODING OF MOVING
PICTURES AND AUDIO
http//drogo.cselt.stet.it/mpeg/standards/mpeg-1/m
peg-1.htm
Peter Noll, MPEG Digital Audio Coding, IEEE
Signal Proccesing Mag., vol. 14, no. 5, pp.
59-81, Sep. 1997.
Peter Noll, Wideband Speech and Audio Coding,
IEEE Communications Mag., vol. 31, no. 11, pp.
34-44, Nov, 1993.
Allen Gersho, Advances in Speech and Audio
Compression, Proceedings of the IEEE, vol. 82,
no. 6, pp. 900-918, June 1994.
Karlheinz Brandenburg, MP3 and AAC Explained,
AES 17th International Conference on High Quality
Audio Coding. (http//www.aes.org)
Fraunhofer Institute for Integrated Circuits/
Audio and Multimedia http//www.iis.fhg.de/amm/
index.html
Marco Joel Gracían Cisneros, Análisis de
algoritmos de compresión de audio MPEG-I e
implementación del decodificador MPEG-I Layer I
en tiempo real usando un DSP, Tesis de Maestría
en Electrónica Industrial, Guadalajara, México
edición de autor, 1998.
Jorge Arturo Pardiñas Mir, Codificador /
Decodificador de voz utilizando la técnica de
filtraje por sub bandas, Tesis de Maestría en
Electrónica Industrial, Guadalajara, México
edición de autor, 1998.