Title: La compression MPEG
1La compression MPEG
- A. Quidelleur
- SRC2 Meaux 2008-2009
- Culture Scientifique et Traitement de
lInformation - Numérisation des systèmes audio et vidéo
2Plan
- Rappels sur la vidéo numérique
- Enjeux et principes de la compression vidéo
- Principes de la compression des images basée sur
la DCT - Compression JPEG (rappels) - La compression MJPEG
- La compression vidéo MPEG1 - 2
- Etapes de la compression
- Caractéristiques de MPEG1 et MPEG2
- La compression audio MPEG1 - 2
- La compression MPEG4
3Rappels sur la vidéo numérique
4Définition spatiale de la TV
Application Définition (lignes lignes affichables)
SDTV 720 pixels 576 lignes
HDTV 1920 pixels 1080 lignes
- Entrelacement les images sont constituées de 2
trames, affichées successivement à lécran.
5Les structures déchantillonnage
- Exploitent la plus grande sensibilité de lœil à
la luminance quà la chrominance
Mesure de Y, Cr et Cb
Mesure de Y uniquement
6Les autres formats
Format Structure de base Définition temporelle Définition spatiale (en pixels ? lignes affichables)
SIF 422 25 im/s 360288
CIF 422 29,97 im/s 360288
QCIF 422 29,97 im/s 180144
7Profondeur de codage
Quantification de la luminance (TV num)
Diffusion 8 bits / échantillon
Production 10 bits / échantillon
Quantification de la chrominance (TV num)
8Multiplexage du flux vidéo
9Enjeux et principes de la compression vidéo
10Enjeux
- Occupation spectrale dun signal numérique gtgt
signal analogique ? problèmes pour - Le stockage
- La transmission
- Le temps de traitement
- Ex. 1h vidéo non compressée 1Go, 1h TVHD non
compressée 800 Go - Or linformation numérique est représentée par
une succession de signes . Tous ces signes
sont-ils indispensables ? - La théorie de linformation tente dextraire les
signes pertinents de linformation et
dabandonner la redondance pour réduire le débit
ou la capacité de stockage dun signal.
11Stratégie
- Deux stratégies de réduction de débit
- Sans perte linformation compressée est intègre
? données informatiques - Avec perte après compression, on ne peut
reconstituer intégralement linformation
originale ? suffisant pour laudio et la vidéo.
Meilleure réduction de volume en général. - La compression avec pertes fragilise
linformation transmise. - ? La redondance peut servir à retrouver
linformation malgré les erreurs. Ex répétition
du même signe 10 fois ? 9 pertes de signes
tolérées. - Après compression, les échantillons successifs ne
sont plus liés, pas dinterpolation possible ?
Besoin un code correcteur derreurs. - Cependant, le gain obtenu par compression est
toujours supérieur à la redondance introduite par
le code correcteur derreurs.
12Rapport de compression (ou taux de compression)
- Noté ?1, ce qui signifie réduction dun facteur
?.
13Application à laudio et la vidéo
- Beaucoup de redondance dans les phénomènes
naturels (sons et images non synthétisés). - Vidéo son image
- Dans une vidéo, où se trouve la redondance ?
- Dans le son, redondance temporelle.
- Dans limage, redondance
- spatiale (deux pixels voisins sont généralement
assez semblables) - temporelle (peu de différence entre limage N et
limage N1) - fréquentielle lénergie dune image est
concentrée essentiellement dans les basses
fréquences, tandis que les hautes fréquences
participent peu au sens.
14Application à laudio et la vidéo
- Comment compresser une vidéo ?
- En exploitant la redondance de limage TV
- En utilisant des codages plus adaptés, utilisant
moins de bits - Où compresser ?
- En environnement studio pour lenregistrement
et le stockage uniquement. Inutile pour les
liaisons entre équipements (dautant que
compressions avec perte/décompression successives
dégradent la qualité du signal). - En transmission et en diffusion.
15Comment compresser une vidéo ?
- Corrélation spatiale Dans une image, il y a
beaucoup de plages uniformes ? exploité par la
Transformée en Cosinus Discrète. - Corrélation temporelle Dune image à la
suivante, il y a peu de changements on transmet
uniquement la différence entre images ?
Compensation de mouvement. - Redondance subjective On tient compte de
lacuité visuelle. Les détails fins nont pas
besoin dêtre codés avec autant de précision que
les parties essentielles ? Quantification. - Redondance statistique Certains mots reviennent
plus fréquemment que dautres ? Codage
entropique.
16Principes de la compression des images basée sur
la DCT Compression JPEG (rappels)
17La compression JPEG
- Voir matière Les images informatiques et leurs
traitements - JPEG (Joint Photographic Expert Group) est une
norme ISO de compression dimages fixes avec
pertes, standardisée en 1992. - JPEG prend en compte les failles du systèmes de
perception humaine, de manière à réduire la
quantité dinformation de limage qui sera codée. - Lalgorithme de compression repose sur
- Une transformation mathématique de limage la
DCT (Discrete Cosine Transform) - Un codage à longueur variable le codage de
Huffman - Formats source
- R, V, B en 444
- Y, R-Y et B-Y en 422
18La notion de fréquences dans une image
- Une image peut présenter une fréquence spatiale
horizontale et une fréquence spatiale verticale. - Pour les signaux temporels, on utilise la
transformée de Fourier pour passer dans le
domaine des fréquences. - Pour les images, on peut, entre autres, passer
dans le domaine des fréquences par la Transformée
en Cosinus Discrète (TCD, ou DCT Discrete Cosin
Transform)
19La Transformée en Cosinus Discrète dans la norme
JPEG
- La DCT porte sur des blocs de 8?8 pixels.
Image INA Formation
20La Transformée en Cosinus Discrète dans la norme
JPEG
- La DCT fournit une représentation spectrale
bidimensionnelle ( H et V) du bloc. - Le bloc est décomposé en une combinaison linéaire
de fonctions images de base, de la même
manière que la transformée de Fourier décompose
un signal temporel en une somme de fonctions
sinus et cosinus.
DCT
64 coefficients transformés représentant les
différentes composantes fréquentielles présentes
dans le bloc 8?8
DCT-1
Bloc de 64 pixels représentant les échantillons
damplitude
21La Transformée en Cosinus Discrète dans la norme
JPEG
- Les fonctions de base de la DCT sont
représentées dans le tableau ci-dessous (ici pour
la composante de luminance si le format dentrée
est YCrCb). - Chaque coefficient de la DCT représente la
contribution de limage située à la même place
dans la matrice dans la construction de limage.
Exemple Un extrait de la matrice des
coefficients DCT dun bloc de pixel est le
suivant (0 dans toutes les autres cases)
2 1
3
Cela signifie quil faut superposer 2 images
I0,0, 1 image I1,0 et 3 images I1,0 pour créer le
bloc.
Fonctions de base
22Calcul des coefficients DCT (à titre indicatif)
Où la fonction C() est définie par
23Calcul des coefficients DCT un exemple simple
- Pour lexemple, bloc de taille 4?4.
- Calcul sur la luminance Y
Coefficients Y de luminance du bloc
Coefficients DCT correspondants
0
1
2
3
y
v
0
0
10 5 0 0
0 2 1 0
4 0 0 0
0 0 0 0
1
1
?
2
2
3
3
x
u
24Calcul des coefficients DCT un exemple simple
- Calcul du premier coefficient DCT
5,5
25Calcul des coefficients DCT un exemple simple
- En répétant la formule pour tous les coefficients
DCT, on obtient - En pratique, le calcul est toujours fait par
ordinateur ou par un circuit électronique dédié
!!!
v
0
1
2
3
0
5,5 5,38 1,5 -0,07
4,76 4,52 0,69 -0,84
2 2,50 1 -0,49
2,35 3,66 2,96 0,98
1
2
3
u
26Propriétés de la DCT
- On constate que les coefficients hautes
fréquences portent les informations de détails de
limage. - Ainsi, les blocs des zones homogènes dune image
ont des coefficients non négligeables en BF, et
négligeables en HF (exemple 1) - Seuls les blocs des zones très hétérogènes ont
des coefficients importants en HF (exemple 2)
Exemple 1
Exemple 2
27Application à la compression
- Puisque les hautes fréquences portent
linformation de détail de limage, on va
diminuer leur valeur, voire lannuler. Cest
lopération de quantification. - Limage va être dégradée, mais compte-tenu de
limperfection de lœil humain, cette dégradation
sera peu ou pas perceptible (tout dépendra de la
sévérité de la quantification).
Images INA Formation
28La quantification
- La norme JPEG fournit des tables, qui permettent
de retoucher la valeur des coefficients DCT de
manière à diminuer la valeur de ceux qui
contribuent le moins au sens de limage. - Les coefficients de haute fréquence sont les plus
réduits. Le rapport de compression dépend
directement de la table utilisée.
29Quantification
Image INA Formation
- Des tables de quantification sont définies pour
chaque composante (Y, Cr et Cb). - La quantification est moins sévère pour la
luminance car lœil y est plus sensible.
30Illustration de leffet de la quantification
Images INA Formation
31Illustration de leffet de la quantification
Images INA Formation
32Illustration de leffet de la quantification
Conservation dun unique coefficient la
composante continue (DC)
Image INA Formation
- A retenir Un codeur peut travailler
- À taux de réduction constant (au détriment de la
qualité) - A qualité constante la performance du codeur en
matière de taux de réduction risque dêtre
médiocre. - Ne pas oublier que la nature de limage
intervient sur lefficacité de la compression !
Une image simple peut être de bonne qualité avec
un fort taux de réduction. Pour ce même taux, une
image complexe sera certainement de piètre
qualité
33Le codage
- Les coefficients de la DCT sont balayés en
zig-zag, des basses fréquences vers les hautes
fréquences. - Les suites de 0 sont transmises sous forme
condensée couple (nb de 0 précédant le
coeff non nul, coeff). - Dans lexemple 0 60 0 29 0 16 0 41 0 26 0 23 4
10 2 7 0 15 - Puis codage à longueur variable les valeurs les
plus courantes sont codées par un mot court, les
valeur les plus rares sont codées par un code
long. (Principe du code Morse, ex. e . et
q --.-). - Cest le code de Huffman qui est employé
34Pour résumer algorithme de compression JPEG
- Décomposition en blocs de 8?8 pixels par
composante. - Passage du domaine spatial au domaine fréquentiel
par DCT. - Quantification et seuillage des coefficients DCT.
- Balayage en zig-zag.
- Codage entropique
35Synoptiques fonctionnels dun codeur et dun
décodeur JPEG
36La compression MJPEG
37MJEPG
- Moving JPEG (MJPEG) nest pas une norme !! Cest
un algorithme propriétaire, donc inadaptable dun
appareil à lautre. - MJPEG permet de compresser les images successives
dune vidéo comme si celles-ci étaient chacune
une photo. - Origine Le montage dimages compressées
dépendantes les unes des autres est difficile car
il y a rupture de la séquence. Les monteurs ont
appliqué la compression JPEG individuellement aux
photogrammes constituant une vidéo ? MJPEG .
38Fonctionnalités dun codeur MJPEG
- Afin de garder un débit constant, le signal est
stocké dans une mémoire tampon. - Lorsque la mémoire déborde (par exemple, car
images complexes donc DCT large) on
sous-quantifie les prochaines images en changeant
de table de quantification, voire on supprime
certaines images. - Les tables utilisées sont celles normalisées dans
MPEG.
39La compression vidéo MPEG 1-2
- Etapes de la compression
- Spécificités des normes MPEG1 et MPEG2
40Principe de la compression MPEG
- La compression repose sur la transformation DCT
de limage, comme dans JPEG. - Lalgorithme part du principe que deux images
successives dans une vidéo se ressemblent ? on
peut alors transmettre uniquement les
informations qui ont changé entre les deux
images. - Ainsi, les images dune vidéo peuvent être codées
de deux manières - En intra cest-à-dire, comme une photographie
indépendante des autres images de la vidéo, selon
un algorithme identique à celui de JPEG. - En prédiction on ne transmet que les
différences (compressées) entre limage courante
et limage intra la précédant (ou la suivant).
41La compression MPEG
- Mesure de la différence entre deux images
successives - Image S1 codée en intra.
- Calcul pour chaque bloc de 8?8 pixels lerreur ?
S2-S1. ? est une matrice de 8?8 valeurs. - Si les deux images se ressemblent, les
coefficients de la matrice sont proches. - Calcul de la DCT de la matrice ?.
- Si les deux images se ressemblent, les
coefficients basse fréquence de la matrice ? sont
plus importants que les coefficients haute
fréquence. - Donc on peut les quantifier efficacement (i.e.
sans perdre trop dinformation). - Au lieu de transmettre limage S2, on transmet la
matrice des coefficients DCT de ? quantifiés, qui
est bien moins volumineuse.
42La compression MPEG
- Estimation du mouvement subi par les blocs
- Compensation de mouvement
- Si beaucoup de mouvement,
- S2 est très différente de S1
- Les coefficients de la matrice ? sont très
différentes - Les coefficients DCT haute fréquence de ? sont
non négligeables on ne peut pas les quantifier
sans dégradation importante. - ? Le codeur va estimer le déplacement du bloc
dans limage. - Le codeur ouvre une fenêtre de recherche dans S1
autour du bloc de référence. - Il balaie la fenêtre et calcule ? pour chaque
bloc rencontré dans la fenêtre lerreur
(opération de block matching). - Le bloc de S1 qui minimise lerreur est retenu.
- Le codeur transmet
- Les coefficients DCT quantifiés de la matrice
derreur - Le vecteur de mouvement du bloc.
43Illustration de la Forward Prediction
Image INA Formation
44Illustration de la compensation de mouvement
En réalité, on ne transmet pas un vecteur de
mouvement pour chaque bloc, mais pour chaque
macro-bloc 4 blocs adjacents.
45Les types dimages dune séquence codée en MPEG
- Dans une même séquence vidéo, trois types de
codage des images - Image I en Intra
- Image P (prédite, forward prediction ) par
rapport à une image passée - Image B (bidirectionnelle, forward prediction et
backward prediction) par rapport à une image
passée et une image future. Le codeur transmet la
moyenne des erreurs et transmet les 2 vecteurs. - Le codeur choisit le mode de prédiction le plus
rentable. - A lintérieur dune image P macroblocs I ou P.
- A lintérieur dune image B macroblocs I, P ou
B. - En moyenne, pour un même contenu,
- volume(P) volume(I) / 2
- volume(B) volume(I) / 4
- Mais dépend de lalgorithme utilisé par le
constructeur.
46Le GOP
- Le GOP (Group Of Picture) définit lenchaînement
des images I, P et B dans le flux vidéo. - Le GOP commence toujours par une image I.
- On note GOP(M,N), où M est la distance entre deux
images P et N la distance entre deux images I. - Question Un monteur peut-il travailler sur des
vidéos dont les GOP sont représentés ci-dessous ?
47Réarrangement du GOP
- Si lenchaînement des images contient des images
B, le codage et décodage ne peuvent être
effectués dans lordre darrivée de la séquence
réarrangement préalable des images.
48Synoptique du codeur MPEG
49La compression vidéo MPEG 1-2
- Etapes de la compression
- Spécificités des normes MPEG1 et MPEG2
50Paramètres des normes MPEG
- Structure déchantillonnage
- En théorie, un algorithme de compression MPEG
accepte nimporte quel format en entrée (422,
420, SIF, SDTV, HDTV, ). - La restriction se fait au niveau des profils
(recommandations) décrits dans les normes.
51Paramètres des normes MPEG
Codage en mode image
- Gestion de lentrelacement
- Dans un signal vidéo entrelacé, on peut créer les
macroblocs en mode image ou en mode trame. - ? Image avec mouvement Mode trame préférable
car les trames sont peu cohérentes entre elles - ? Image sans mouvement Mode image plus efficace
car les trames sont fortement corrélées
Codage en mode trame
52La norme MPEG1
- Application lenregistrement
- CD-ROM, disques optiques
- VCD (magnétoscope numérique en Chine)
- Utilisée par la TV numérique aux USA en attendant
la mise au point du MPEG2 - Débit
- Comprime des images animées son stéréo avec un
débit de 1.5Mbit/s - Format dentrée en général, format SIF
- Performances réduites pour un signal entrelacé
(ex. signal TV) - MPEG1 définit
- 3 types dimages I, P, B
- 2 paramètres GOP(M, N)
53La norme MPEG2
- Le norme MPEG2 a été mise au point pour le
stockage et la diffusion de la vidéo numérique. - Cest la norme de compression utilisée dans la
télévision numérique terrestre (TNT ou DVB-T). - A amélioré MPEG1
- En tenant compte de lentrelacement
- En rajoutant des outils de gestion des erreurs de
transmission - Formats dentrée acceptés
- 422, 420, 444
- EDTV, HDTV, futurs formats super HDTV
- RVB et composantes
- Formats informatiques
- Balayage entrelacé ou progressif à lintérieur
dune même image, le codeur peut choisir de
traiter des blocs trame à trame ou en
désentrelacé.
54La norme MPEG2
- Sadapte à diverses qualités dimages en
télévision - 2Mbit/s qualité comparable au VHS
- 3 à 5 Mbit/s qualité comparable au PAL
- 8 à 10 Mbit/s qualité comparable au 422
- Définit
- 4 niveaux (définition des paramètres utilisés)
- 6 profils (applications dédiées)
- 3 types dimages I, P, B
- 2 paramètres M et N
- La donnée dun couple profil/niveau garantit
linteropérabilité des équipements.
55Profils et niveaux de la norme MPEG2
Difficulté technique croissante
CODEC bas coût
TV numérique
Studio
Qualité croissante
56Scalabilité de la norme MPEG2
- La qualité et la résolution sont adaptables au
mode de transmission vidéo. Entre autres - Scalabilité SNR (Signal to Noise Ratio)
- Si le support de transmission est peu robuste, on
peut dégrader la qualité de la vidéo et augmenter
sa résistance au bruit (en gardant le même
débit). - Scalabilité spatiale
- En attendant la migration des postes de TV de la
SDTV à la HDTV, transmission simultanée des 2
qualités - ? MPEG2 exploite la redondance entre le signal
basse définition et le signal haute définition
pour réduire la quantité dinformation transmise.
57Application La chaîne de diffusion de la
télévision numérique
58La compression audio MPEG1 - 2
- Propriétés psycho-acoustiques exploitables pour
la compression - Les compressions audio MPEG 1 et 2
59Le codage perceptuel
- Comme la compression vidéo MPEG utilise les
failles de la vision humaine, la compression
audio MPEG exploite les propriétés de laudition
humaine. - Compression de limage ne coder que
linformation indispensable, dans la mesure où
lœil est un capteur imparfait. - ? Compression du son ne coder que
linformation indispensable, dans la mesure où
loreille est un capteur imparfait.
60Courbe de sensibilité de loreille humaine
- A une fréquence donnée, notre oreille ne peut
percevoir un son quà condition que son niveau de
pression acoustique soit supérieur à un seuil. Le
seuil est différent pour chaque fréquence de la
bande audible.
- Courbe de sensibilité de loreille dans un
environnement calme
seuil
61Le masquage fréquentiel
- Sous leffet dune excitation, le seuil
daudibilité minimum est amplifié au voisinage de
la fréquence du son. - Par conséquence, un autre son de fréquence
proche, émis en même temps, peut être inaudible.
80
Pression acoustique (dB)
60
Son masqueur
40
Son masqué
20
Seuil en environnement calme
Déformation de la courbe seuil de masquage
0
f(Hz)
20
200
2000
20000
1000
5000
500
100
50
10000
62Exploitation du masquage en fréquence pour la
compression
- On ne code pas les sons masqués (inaudibles)
- On adapte la profondeur de codage nombre de
bits minimal pour que N lt seuil daudibilité.
63Exploitation du masquage fréquentiel par les
normes MPEG1 et 2
- Le spectre audible est divisé en 32 sous-bandes.
- Pour chaque sous-bande, on détermine la fréquence
dominante et on en déduit la nouvelle courbe de
seuil daudibilité (à laide de modèles
psycho-acoustiques). - Ces modèles sont sauvegardés dans la ROM des
codeurs. - Dans chaque sous-bande, le codeur choisit le pas
de quantification adapté au niveau du seuil
daudibilité. - Le flux numérique contient les valeurs du pas de
quantification de chaque sous-bande pour que le
décodage soit possible.
64Le masquage temporel
- Loreille nentend pas un son sil est produit
dans un court délai avant ou après un son de même
fréquence de plus grande amplitude. - ? On ne code pas les sons masqués temporellement.
65Le masquage de canal
- Loreille humaine est incapable de détecter la
provenance dun son sil a une fréquence trop
basse. - ? Coder en mono les sons basse fréquence.
66La compression audio MPEG
- Propriétés psycho-acoustiques exploitables pour
la compression - Les compressions audio MPEG 1 et 2
67La compression audio MPEG1
- Fréquences déchantillonnage 32 à 48 kHz
- Débits 32 à 384 kbit/s
- Trois niveaux (layers) sont définis
Niveau Technique Utilisation - Performances
Niveau 1 Masquage fréquentiel Qualité CD
Niveau 2 Masquage fréquentiel Masquage temporel Qualité CD Utilisé dans le DVB-S
Niveau 3 Masquage fréquentiel avec largeur des sous-bandes adaptée Masquage temporel Codage entropique Exploitation de la cohérence entre les voies stéréo MP3
68La compression audio MPEG2
- Fréquences déchantillonnage 16 à 48 kHz
- Débits 8 à 384 kbit/s
- Elle reprend lessentiel de la norme MPEG1 audio.
- Gère les signaux multicanaux jusquà 5 voies
69La compression MPEG4
- Lapproche objet
- Le codage de la vidéo
- Lintégration de la 3D
- Le codage des images de synthèse
- La norme MPEG4 audio
- La description de scène
- Profils et niveaux
70Lapproche objet
- Nouveauté majeure découpe des scènes en
objets - Intérêt MPEG4 se veut une norme de compression
- pour les applications multimédia,
- supportée sur nimporte quel type de support (?
émergence récente de la mobilité) - et gérant linteractivité (possibilité de
modifier la composition dune scène et les objets
dans le flux numérique sans avoir à les décoder)
71Codage de la vidéo le plan alpha
- Un objet est décrit par
- Ses composantes Y, Cr, Cb codées comme en MPEG
1 et 2 (sauf images fixes, cf. supra) - Un plan alpha
- Codé en binaire 1 à lintérieur de lobjet, 0
ailleurs - Ou codé sur 8 bits définit en plus des niveaux
de transparence
72Codage de la vidéo le plan alpha
- Codage dun plan alpha binaire technique du
codage de contour - Lobjet est découpé en blocs 16?16 pixels
- Plusieurs (7) types de BAB (Bloc Alpha Binaire)
sont définis par la norme, en fonction du
mouvement et de la déformation subis dans la
scène - Le codage de chaque type de BAB est défini par la
norme Intra, ou Inter avec compensation de
mouvement - Chaque bloc de lobjet est donc codé suivant son
BAB - Codage dun plan alpha sur 8 bits
- Composante binaire par technique de codage de
contour - Les niveau de gris des blocs intérieurs (
niveaux de transparence) sont ensuite codés par
DCT.
73Codage dune vidéo les sprites
- Sprite une grande image composée de tous les
pixels dun objet donné visibles à un moment ou
un autre de la séquence - Ex. un sprite dobjet fond une vue
panoramique dun paysage sans les personnages
passant au premier plan - Cest une image fixe elle est codée par DCT en
Intra et émise au début du flux MPEG. - Intérêt
- Economie de bits
- Manipulations intéressantes sur la vidéo
74Lintégration de la 3D
- Pour habillage des structures 3D par des images
naturelles (fixes), MPEG4 utilise la technique de
compression par ondelettes, plus efficace que la
DCT. - La compression par ondelettes consiste en une
analyse multi-résolution de limage.
75La compression par ondelettes
- Réduction de la résolution de limage par
décimation - Séparation des détails horizontaux, verticaux, et
bidimensionnels par filtrage
Image originale décimée (smooth) 1 point sur 4
Transformée par ondelettes
Hautes fréquences horizontales
Hautes fréquences verticales
Hautes fréquences bidimensionnelles
Image originale
4 petites images (dimension/2) Les 3 images de
détail contiennent les informations perdues par
la décimation
A ce niveau, pas de pertes
76La compression par ondelettes
- On peut réitérer lopération sur limage décimée
(smooth) plusieurs fois analyse
multicouches . - Limage smooth est plus petite à chaque couche
moins dinformations à coder - On peut quantifier les images de détails et leur
appliquer un codage entropique.
- Intérêt pour la 3D le multicouche permet
dadapter le rendu des détails à la distance de
visualisation (position de lutilisateur dans
lenvironnement 3D).
77Le codage des images de synthèse
- La norme inclut des algorithmes permettant la
description des visage et leur animation. - Elle permet aussi la construction dobjets par
treillis actifs - Les objets sont décrits par un treillis
triangulaire - Le décodeur calcule lévolution de la texture
dune scène à lautre pour chaque triangle par
interpolation
Un treillis
78La norme MPEG4 audio
- Codage des sons naturels
- Débits de 2 à 64 kbit/s
- La norme na pas pu proposer 1 seul algorithme
pour tous les types de sons (musique, parole,
etc. ) - ? Elle inclut plusieurs standards de codage,
adapté à chaque type de signal sonore - Les algorithmes proposés dans la norme MPEG2
audio sont notamment repris. - Synthèse de sons la norme inclut plusieurs
algorithmes de génération de sons (pluie, bruits
de pas, instruments de musique).
79Description de scènes
- Les scènes sont organisées sous forme dune
structure hiérarchique dobjets. - La norme inclut un standard de description de la
scène en flux binaire BIFS (Binary Format for
Scene Description). - Elle permet lutilisation du VRML (langage de
modélisation de la réalité virtuelle) pour
permettre linterface de la 3D et de la vidéo.
80Description de scène un exemple
81Profils et niveaux MPEG4
- 5 profils
- Profils visuels codage visuel des données
naturelles, synthétiques ou hybrides - Profils audio nombre doutils implémentés et le
débit visé - Profils graphiques éléments graphiques et
textuels utilisables dans une scène - Profils de descripteurs de scène types
dinformations pouvant constituer une scène MPEG4
(audio, 2D, 3D) - Profils de descripteurs dobjets outils
disponibles pour décrire un objet (descripteur
dobjet, synchronisation, information sur le
contenu des objets)
82Profils et niveaux MPEG4
83Bibliographie
- Compression Numérique JPEG, DV, MPEG ,
support de cours, INA Formation, mars 2003 - Compression MPEG-1 à MPEG-4 , E. Fert, S.
Jeannin, Techniques de lIngénieur - Traité
Télécommunications - Compression des images nouveaux besoins,
nouvelles technologies , support de cours, J.
Weiss, Supelec, 2000