La compression MPEG - PowerPoint PPT Presentation

About This Presentation
Title:

La compression MPEG

Description:

La compression par ondelettes R duction de la r solution de l image par d cimation S paration des d tails horizontaux, verticaux, ... – PowerPoint PPT presentation

Number of Views:146
Avg rating:3.0/5.0
Slides: 84
Provided by: quid150
Category:

less

Transcript and Presenter's Notes

Title: La compression MPEG


1
La compression MPEG
  • A. Quidelleur
  • SRC2 Meaux 2008-2009
  • Culture Scientifique et Traitement de
    lInformation
  • Numérisation des systèmes audio et vidéo

2
Plan
  • Rappels sur la vidéo numérique
  • Enjeux et principes de la compression vidéo
  • Principes de la compression des images basée sur
    la DCT - Compression JPEG (rappels)
  • La compression MJPEG
  • La compression vidéo MPEG1 - 2
  • Etapes de la compression
  • Caractéristiques de MPEG1 et MPEG2
  • La compression audio MPEG1 - 2
  • La compression MPEG4

3
Rappels sur la vidéo numérique
4
Définition spatiale de la TV
Application Définition (lignes lignes affichables)
SDTV 720 pixels 576 lignes
HDTV 1920 pixels 1080 lignes
  • Entrelacement les images sont constituées de 2
    trames, affichées successivement à lécran.

5
Les structures déchantillonnage
  • Exploitent la plus grande sensibilité de lœil à
    la luminance quà la chrominance

Mesure de Y, Cr et Cb
Mesure de Y uniquement
6
Les autres formats
Format Structure de base Définition temporelle Définition spatiale (en pixels ? lignes affichables)
SIF 422 25 im/s 360288
CIF 422 29,97 im/s 360288
QCIF 422 29,97 im/s 180144
7
Profondeur de codage
Quantification de la luminance (TV num)
Diffusion 8 bits / échantillon
Production 10 bits / échantillon
Quantification de la chrominance (TV num)
8
Multiplexage du flux vidéo
9
Enjeux et principes de la compression vidéo
10
Enjeux
  • Occupation spectrale dun signal numérique gtgt
    signal analogique ? problèmes pour
  • Le stockage
  • La transmission
  • Le temps de traitement
  • Ex. 1h vidéo non compressée 1Go, 1h TVHD non
    compressée 800 Go
  • Or linformation numérique est représentée par
    une succession de  signes . Tous ces signes
    sont-ils indispensables ?
  • La théorie de linformation tente dextraire les
    signes pertinents de linformation et
    dabandonner la redondance pour réduire le débit
    ou la capacité de stockage dun signal.

11
Stratégie
  • Deux stratégies de réduction de débit
  • Sans perte linformation compressée est intègre
    ? données informatiques
  • Avec perte après compression, on ne peut
    reconstituer intégralement linformation
    originale ? suffisant pour laudio et la vidéo.
    Meilleure réduction de volume en général.
  • La compression avec pertes fragilise
    linformation transmise.
  • ? La redondance peut servir à retrouver
    linformation malgré les erreurs. Ex répétition
    du même signe 10 fois ? 9 pertes de signes
    tolérées.
  • Après compression, les échantillons successifs ne
    sont plus liés, pas dinterpolation possible ?
    Besoin un code correcteur derreurs.
  • Cependant, le gain obtenu par compression est
    toujours supérieur à la redondance introduite par
    le code correcteur derreurs.

12
Rapport de compression (ou taux de compression)
  • Noté ?1, ce qui signifie réduction dun facteur
    ?.

13
Application à laudio et la vidéo
  • Beaucoup de redondance dans les phénomènes
    naturels (sons et images non synthétisés).
  • Vidéo son image
  • Dans une vidéo, où se trouve la redondance ?
  • Dans le son, redondance temporelle.
  • Dans limage, redondance
  • spatiale (deux pixels voisins sont généralement
    assez semblables)
  • temporelle (peu de différence entre limage N et
    limage N1)
  • fréquentielle lénergie dune image est
    concentrée essentiellement dans les basses
    fréquences, tandis que les hautes fréquences
    participent peu au sens.

14
Application à laudio et la vidéo
  • Comment compresser une vidéo ?
  • En exploitant la redondance de limage TV
  • En utilisant des codages plus adaptés, utilisant
    moins de bits
  • Où compresser ?
  • En environnement studio pour lenregistrement
    et le stockage uniquement. Inutile pour les
    liaisons entre équipements (dautant que
    compressions avec perte/décompression successives
    dégradent la qualité du signal).
  • En transmission et en diffusion.

15
Comment compresser une vidéo ?
  • Corrélation spatiale Dans une image, il y a
    beaucoup de plages uniformes ? exploité par la
    Transformée en Cosinus Discrète.
  • Corrélation temporelle Dune image à la
    suivante, il y a peu de changements on transmet
    uniquement la différence entre images ?
    Compensation de mouvement.
  • Redondance subjective On tient compte de
    lacuité visuelle. Les détails fins nont pas
    besoin dêtre codés avec autant de précision que
    les parties essentielles ? Quantification.
  • Redondance statistique Certains mots reviennent
    plus fréquemment que dautres ? Codage
    entropique.

16
Principes de la compression des images basée sur
la DCT Compression JPEG (rappels)
17
La compression JPEG
  • Voir matière Les images informatiques et leurs
    traitements
  • JPEG (Joint Photographic Expert Group) est une
    norme ISO de compression dimages fixes avec
    pertes, standardisée en 1992.
  • JPEG prend en compte les failles du systèmes de
    perception humaine, de manière à réduire la
    quantité dinformation de limage qui sera codée.
  • Lalgorithme de compression repose sur
  • Une transformation mathématique de limage la
    DCT (Discrete Cosine Transform)
  • Un codage à longueur variable le codage de
    Huffman
  • Formats source
  • R, V, B en 444
  • Y, R-Y et B-Y en 422

18
La notion de fréquences dans une image
  • Une image peut présenter une fréquence spatiale
    horizontale et une fréquence spatiale verticale.
  • Pour les signaux temporels, on utilise la
    transformée de Fourier pour passer dans le
    domaine des fréquences.
  • Pour les images, on peut, entre autres, passer
    dans le domaine des fréquences par la Transformée
    en Cosinus Discrète (TCD, ou DCT Discrete Cosin
    Transform)

19
La Transformée en Cosinus Discrète dans la norme
JPEG
  • La DCT porte sur des blocs de 8?8 pixels.

Image INA Formation
20
La Transformée en Cosinus Discrète dans la norme
JPEG
  • La DCT fournit une représentation spectrale
    bidimensionnelle ( H et V) du bloc.
  • Le bloc est décomposé en une combinaison linéaire
    de  fonctions  images de base, de la même
    manière que la transformée de Fourier décompose
    un signal temporel en une somme de fonctions
    sinus et cosinus.

DCT
64 coefficients transformés représentant les
différentes composantes fréquentielles présentes
dans le bloc 8?8
DCT-1
Bloc de 64 pixels représentant les échantillons
damplitude
21
La Transformée en Cosinus Discrète dans la norme
JPEG
  • Les  fonctions  de base de la DCT sont
    représentées dans le tableau ci-dessous (ici pour
    la composante de luminance si le format dentrée
    est YCrCb).
  • Chaque coefficient de la DCT représente la
    contribution de limage située à la même place
    dans la matrice dans la construction de limage.

Exemple Un extrait de la matrice des
coefficients DCT dun bloc de pixel est le
suivant (0 dans toutes les autres cases)
2 1
3


Cela signifie quil faut  superposer  2 images
I0,0, 1 image I1,0 et 3 images I1,0 pour créer le
bloc.
Fonctions de base
22
Calcul des coefficients DCT (à titre indicatif)
  • DCT
  • DCT-1

Où la fonction C() est définie par
23
Calcul des coefficients DCT un exemple simple
  • Pour lexemple, bloc de taille 4?4.
  • Calcul sur la luminance Y

Coefficients Y de luminance du bloc
Coefficients DCT correspondants
0
1
2
3
y
v
0
0
10 5 0 0
0 2 1 0
4 0 0 0
0 0 0 0




1
1
?
2
2
3
3
x
u
24
Calcul des coefficients DCT un exemple simple
  • Calcul du premier coefficient DCT

5,5
25
Calcul des coefficients DCT un exemple simple
  • En répétant la formule pour tous les coefficients
    DCT, on obtient
  • En pratique, le calcul est toujours fait par
    ordinateur ou par un circuit électronique dédié
    !!!

v
0
1
2
3
0
5,5 5,38 1,5 -0,07
4,76 4,52 0,69 -0,84
2 2,50 1 -0,49
2,35 3,66 2,96 0,98
1
2
3
u
26
Propriétés de la DCT
  • On constate que les coefficients hautes
    fréquences portent les informations de détails de
    limage.
  • Ainsi, les blocs des zones homogènes dune image
    ont des coefficients non négligeables en BF, et
    négligeables en HF (exemple 1)
  • Seuls les blocs des zones très hétérogènes ont
    des coefficients importants en HF (exemple 2)

Exemple 1
Exemple 2
27
Application à la compression
  • Puisque les hautes fréquences portent
    linformation de détail de limage, on va
    diminuer leur valeur, voire lannuler. Cest
    lopération de quantification.
  • Limage va être dégradée, mais compte-tenu de
    limperfection de lœil humain, cette dégradation
    sera peu ou pas perceptible (tout dépendra de la
    sévérité de la quantification).

Images INA Formation
28
La quantification
  • La norme JPEG fournit des tables, qui permettent
    de retoucher la valeur des coefficients DCT de
    manière à diminuer la valeur de ceux qui
    contribuent le moins au sens de limage.
  • Les coefficients de haute fréquence sont les plus
    réduits. Le rapport de compression dépend
    directement de la table utilisée.

29
Quantification
Image INA Formation
  • Des tables de quantification sont définies pour
    chaque composante (Y, Cr et Cb).
  • La quantification est moins sévère pour la
    luminance car lœil y est plus sensible.

30
Illustration de leffet de la quantification
Images INA Formation
31
Illustration de leffet de la quantification
Images INA Formation
32
Illustration de leffet de la quantification
Conservation dun unique coefficient la
composante continue (DC)
Image INA Formation
  • A retenir Un codeur peut travailler
  • À taux de réduction constant (au détriment de la
    qualité)
  • A qualité constante la performance du codeur en
    matière de taux de réduction risque dêtre
    médiocre.
  • Ne pas oublier que la nature de limage
    intervient sur lefficacité de la compression !
    Une image simple peut être de bonne qualité avec
    un fort taux de réduction. Pour ce même taux, une
    image complexe sera certainement de piètre
    qualité

33
Le codage
  • Les coefficients de la DCT sont balayés en
    zig-zag, des basses fréquences vers les hautes
    fréquences.
  • Les suites de 0 sont transmises sous forme
    condensée couple (nb de  0  précédant le
    coeff non nul, coeff).
  • Dans lexemple 0 60 0 29 0 16 0 41 0 26 0 23 4
    10 2 7 0 15
  • Puis codage à longueur variable les valeurs les
    plus courantes sont codées par un mot court, les
    valeur les plus rares sont codées par un code
    long. (Principe du code Morse, ex.  e  . et
     q  --.-).
  • Cest le code de Huffman qui est employé

34
Pour résumer algorithme de compression JPEG
  • Décomposition en blocs de 8?8 pixels par
    composante.
  • Passage du domaine spatial au domaine fréquentiel
    par DCT.
  • Quantification et seuillage des coefficients DCT.
  • Balayage en zig-zag.
  • Codage entropique

35
Synoptiques fonctionnels dun codeur et dun
décodeur JPEG
36
La compression MJPEG
37
MJEPG
  • Moving JPEG (MJPEG) nest pas une norme !! Cest
    un algorithme propriétaire, donc inadaptable dun
    appareil à lautre.
  • MJPEG permet de compresser les images successives
    dune vidéo comme si celles-ci étaient chacune
    une photo.
  • Origine Le montage dimages compressées
    dépendantes les unes des autres est difficile car
    il y a rupture de la séquence. Les monteurs ont
    appliqué la compression JPEG individuellement aux
    photogrammes constituant une vidéo ?  MJPEG .

38
Fonctionnalités dun codeur MJPEG
  • Afin de garder un débit constant, le signal est
    stocké dans une mémoire tampon.
  • Lorsque la mémoire déborde (par exemple, car
    images complexes donc DCT large) on
    sous-quantifie les prochaines images en changeant
    de table de quantification, voire on supprime
    certaines images.
  • Les tables utilisées sont celles normalisées dans
    MPEG.

39
La compression vidéo MPEG 1-2
  • Etapes de la compression
  • Spécificités des normes MPEG1 et MPEG2

40
Principe de la compression MPEG
  • La compression repose sur la transformation DCT
    de limage, comme dans JPEG.
  • Lalgorithme part du principe que deux images
    successives dans une vidéo se ressemblent ? on
    peut alors transmettre uniquement les
    informations qui ont changé entre les deux
    images.
  • Ainsi, les images dune vidéo peuvent être codées
    de deux manières
  • En intra cest-à-dire, comme une photographie
    indépendante des autres images de la vidéo, selon
    un algorithme identique à celui de JPEG.
  • En prédiction on ne transmet que les
    différences (compressées) entre limage courante
    et limage intra la précédant (ou la suivant).

41
La compression MPEG
  • Mesure de la différence entre deux images
    successives
  • Image S1 codée en intra.
  • Calcul pour chaque bloc de 8?8 pixels lerreur ?
    S2-S1. ? est une matrice de 8?8 valeurs.
  • Si les deux images se ressemblent, les
    coefficients de la matrice sont proches.
  • Calcul de la DCT de la matrice ?.
  • Si les deux images se ressemblent, les
    coefficients basse fréquence de la matrice ? sont
    plus importants que les coefficients haute
    fréquence.
  • Donc on peut les quantifier efficacement (i.e.
    sans perdre trop dinformation).
  • Au lieu de transmettre limage S2, on transmet la
    matrice des coefficients DCT de ? quantifiés, qui
    est bien moins volumineuse.

42
La compression MPEG
  • Estimation du mouvement subi par les blocs
  • Compensation de mouvement
  • Si beaucoup de mouvement,
  • S2 est très différente de S1
  • Les coefficients de la matrice ? sont très
    différentes
  • Les coefficients DCT haute fréquence de ? sont
    non négligeables on ne peut pas les quantifier
    sans dégradation importante.
  • ? Le codeur va estimer le déplacement du bloc
    dans limage.
  • Le codeur ouvre une fenêtre de recherche dans S1
    autour du bloc de référence.
  • Il balaie la fenêtre et calcule ? pour chaque
    bloc rencontré dans la fenêtre lerreur
    (opération de block matching).
  • Le bloc de S1 qui minimise lerreur est retenu.
  • Le codeur transmet
  • Les coefficients DCT quantifiés de la matrice
    derreur
  • Le vecteur de mouvement du bloc.

43
Illustration de la Forward Prediction
Image INA Formation
44
Illustration de la compensation de mouvement
En réalité, on ne transmet pas un vecteur de
mouvement pour chaque bloc, mais pour chaque
macro-bloc 4 blocs adjacents.
45
Les types dimages dune séquence codée en MPEG
  • Dans une même séquence vidéo, trois types de
    codage des images
  • Image I en Intra
  • Image P (prédite, forward prediction ) par
    rapport à une image passée
  • Image B (bidirectionnelle, forward prediction et
    backward prediction) par rapport à une image
    passée et une image future. Le codeur transmet la
    moyenne des erreurs et transmet les 2 vecteurs.
  • Le codeur choisit le mode de prédiction le plus
    rentable.
  • A lintérieur dune image P macroblocs I ou P.
  • A lintérieur dune image B macroblocs I, P ou
    B.
  • En moyenne, pour un même contenu,
  • volume(P) volume(I) / 2
  • volume(B) volume(I) / 4
  • Mais dépend de lalgorithme utilisé par le
    constructeur.

46
Le GOP
  • Le GOP (Group Of Picture) définit lenchaînement
    des images I, P et B dans le flux vidéo.
  • Le GOP commence toujours par une image I.
  • On note GOP(M,N), où M est la distance entre deux
    images P et N la distance entre deux images I.
  • Question Un monteur peut-il travailler sur des
    vidéos dont les GOP sont représentés ci-dessous ?

47
Réarrangement du GOP
  • Si lenchaînement des images contient des images
    B, le codage et décodage ne peuvent être
    effectués dans lordre darrivée de la séquence
    réarrangement préalable des images.

48
Synoptique du codeur MPEG
49
La compression vidéo MPEG 1-2
  • Etapes de la compression
  • Spécificités des normes MPEG1 et MPEG2

50
Paramètres des normes MPEG
  • Structure déchantillonnage
  • En théorie, un algorithme de compression MPEG
    accepte nimporte quel format en entrée (422,
    420, SIF, SDTV, HDTV, ).
  • La restriction se fait au niveau des profils
    (recommandations) décrits dans les normes.

51
Paramètres des normes MPEG
Codage en mode image
  • Gestion de lentrelacement
  • Dans un signal vidéo entrelacé, on peut créer les
    macroblocs en mode image ou en mode trame.
  • ? Image avec mouvement Mode trame préférable
    car les trames sont peu cohérentes entre elles
  • ? Image sans mouvement Mode image plus efficace
    car les trames sont fortement corrélées

Codage en mode trame
52
La norme MPEG1
  • Application lenregistrement
  • CD-ROM, disques optiques
  • VCD (magnétoscope numérique en Chine)
  • Utilisée par la TV numérique aux USA en attendant
    la mise au point du MPEG2
  • Débit
  • Comprime des images animées son stéréo avec un
    débit de 1.5Mbit/s
  • Format dentrée en général, format SIF
  • Performances réduites pour un signal entrelacé
    (ex. signal TV)
  • MPEG1 définit
  • 3 types dimages I, P, B
  • 2 paramètres GOP(M, N)

53
La norme MPEG2
  • Le norme MPEG2 a été mise au point pour le
    stockage et la diffusion de la vidéo numérique.
  • Cest la norme de compression utilisée dans la
    télévision numérique terrestre (TNT ou DVB-T).
  • A amélioré MPEG1
  • En tenant compte de lentrelacement
  • En rajoutant des outils de gestion des erreurs de
    transmission
  • Formats dentrée acceptés
  • 422, 420, 444
  • EDTV, HDTV, futurs formats super HDTV
  • RVB et composantes
  • Formats informatiques
  • Balayage entrelacé ou progressif à lintérieur
    dune même image, le codeur peut choisir de
    traiter des blocs trame à trame ou en
    désentrelacé.

54
La norme MPEG2
  • Sadapte à diverses qualités dimages en
    télévision
  • 2Mbit/s qualité comparable au VHS
  • 3 à 5 Mbit/s qualité comparable au PAL
  • 8 à 10 Mbit/s qualité comparable au 422
  • Définit
  • 4 niveaux (définition des paramètres utilisés)
  • 6 profils (applications dédiées)
  • 3 types dimages I, P, B
  • 2 paramètres M et N
  • La donnée dun couple profil/niveau garantit
    linteropérabilité des équipements.

55
Profils et niveaux de la norme MPEG2
Difficulté technique croissante
CODEC bas coût
TV numérique
Studio
Qualité croissante
56
Scalabilité de la norme MPEG2
  • La qualité et la résolution sont adaptables au
    mode de transmission vidéo. Entre autres
  • Scalabilité SNR (Signal to Noise Ratio)
  • Si le support de transmission est peu robuste, on
    peut dégrader la qualité de la vidéo et augmenter
    sa résistance au bruit (en gardant le même
    débit).
  • Scalabilité spatiale
  • En attendant la migration des postes de TV de la
    SDTV à la HDTV, transmission simultanée des 2
    qualités
  • ? MPEG2 exploite la redondance entre le signal
    basse définition et le signal haute définition
    pour réduire la quantité dinformation transmise.

57
Application La chaîne de diffusion de la
télévision numérique
58
La compression audio MPEG1 - 2
  • Propriétés psycho-acoustiques exploitables pour
    la compression
  • Les compressions audio MPEG 1 et 2

59
Le codage perceptuel
  • Comme la compression vidéo MPEG utilise les
    failles de la vision humaine, la compression
    audio MPEG exploite les propriétés de laudition
    humaine.
  • Compression de limage ne coder que
    linformation indispensable, dans la mesure où
    lœil est un capteur imparfait.
  • ? Compression du son ne coder que
    linformation indispensable, dans la mesure où
    loreille est un capteur imparfait.

60
Courbe de sensibilité de loreille humaine
  • A une fréquence donnée, notre oreille ne peut
    percevoir un son quà condition que son niveau de
    pression acoustique soit supérieur à un seuil. Le
    seuil est différent pour chaque fréquence de la
    bande audible.
  • Courbe de sensibilité de loreille dans un
    environnement calme

seuil
61
Le masquage fréquentiel
  • Sous leffet dune excitation, le seuil
    daudibilité minimum est amplifié au voisinage de
    la fréquence du son.
  • Par conséquence, un autre son de fréquence
    proche, émis en même temps, peut être inaudible.

80
Pression acoustique (dB)
60
Son  masqueur 
40
Son  masqué 
20
Seuil en environnement calme
Déformation de la courbe seuil de masquage
0
f(Hz)
20
200
2000
20000
1000
5000
500
100
50
10000
62
Exploitation du masquage en fréquence pour la
compression
  • On ne code pas les sons masqués (inaudibles)
  • On adapte la profondeur de codage nombre de
    bits minimal pour que N lt seuil daudibilité.

63
Exploitation du masquage fréquentiel par les
normes MPEG1 et 2
  • Le spectre audible est divisé en 32 sous-bandes.
  • Pour chaque sous-bande, on détermine la fréquence
    dominante et on en déduit la nouvelle courbe de
    seuil daudibilité (à laide de modèles
    psycho-acoustiques).
  • Ces modèles sont sauvegardés dans la ROM des
    codeurs.
  • Dans chaque sous-bande, le codeur choisit le pas
    de quantification adapté au niveau du seuil
    daudibilité.
  • Le flux numérique contient les valeurs du pas de
    quantification de chaque sous-bande pour que le
    décodage soit possible.

64
Le masquage temporel
  • Loreille nentend pas un son sil est produit
    dans un court délai avant ou après un son de même
    fréquence de plus grande amplitude.
  • ? On ne code pas les sons masqués temporellement.

65
Le masquage de canal
  • Loreille humaine est incapable de détecter la
    provenance dun son sil a une fréquence trop
    basse.
  • ? Coder en mono les sons basse fréquence.

66
La compression audio MPEG
  • Propriétés psycho-acoustiques exploitables pour
    la compression
  • Les compressions audio MPEG 1 et 2

67
La compression audio MPEG1
  • Fréquences déchantillonnage 32 à 48 kHz
  • Débits 32 à 384 kbit/s
  • Trois niveaux (layers) sont définis

Niveau Technique Utilisation - Performances
Niveau 1 Masquage fréquentiel Qualité CD
Niveau 2 Masquage fréquentiel Masquage temporel Qualité CD Utilisé dans le DVB-S
Niveau 3 Masquage fréquentiel avec largeur des sous-bandes adaptée Masquage temporel Codage entropique Exploitation de la cohérence entre les voies stéréo  MP3 
68
La compression audio MPEG2
  • Fréquences déchantillonnage 16 à 48 kHz
  • Débits 8 à 384 kbit/s
  • Elle reprend lessentiel de la norme MPEG1 audio.
  • Gère les signaux multicanaux jusquà 5 voies

69
La compression MPEG4
  • Lapproche objet
  • Le codage de la vidéo
  • Lintégration de la 3D
  • Le codage des images de synthèse
  • La norme MPEG4 audio
  • La description de scène
  • Profils et niveaux

70
Lapproche objet
  • Nouveauté majeure découpe des scènes en
     objets 
  • Intérêt MPEG4 se veut une norme de compression
  • pour les applications multimédia,
  • supportée sur nimporte quel type de support (?
    émergence récente de la mobilité)
  • et gérant linteractivité (possibilité de
    modifier la composition dune scène et les objets
    dans le flux numérique sans avoir à les décoder)

71
Codage de la vidéo le plan alpha
  • Un objet est décrit par
  • Ses composantes Y, Cr, Cb codées comme en MPEG
    1 et 2 (sauf images fixes, cf. supra)
  • Un plan alpha
  • Codé en binaire 1 à lintérieur de lobjet, 0
    ailleurs
  • Ou codé sur 8 bits définit en plus des niveaux
    de transparence

72
Codage de la vidéo le plan alpha
  • Codage dun plan alpha binaire technique du
    codage de contour
  • Lobjet est découpé en blocs 16?16 pixels
  • Plusieurs (7) types de BAB (Bloc Alpha Binaire)
    sont définis par la norme, en fonction du
    mouvement et de la  déformation  subis dans la
    scène
  • Le codage de chaque type de BAB est défini par la
    norme Intra, ou Inter avec compensation de
    mouvement
  • Chaque bloc de lobjet est donc codé suivant son
    BAB
  • Codage dun plan alpha sur 8 bits
  • Composante binaire par technique de codage de
    contour
  • Les niveau de gris des blocs intérieurs (
    niveaux de transparence) sont ensuite codés par
    DCT.

73
Codage dune vidéo les sprites
  • Sprite  une grande image composée de tous les
    pixels dun objet donné visibles à un moment ou
    un autre de la séquence
  • Ex. un sprite dobjet fond une vue
    panoramique dun paysage sans les personnages
    passant au premier plan
  • Cest une image fixe elle est codée par DCT en
    Intra et émise au début du flux MPEG.
  • Intérêt
  • Economie de bits
  • Manipulations intéressantes sur la vidéo

74
Lintégration de la 3D
  • Pour habillage des structures 3D par des images
    naturelles (fixes), MPEG4 utilise la technique de
    compression par ondelettes, plus efficace que la
    DCT.
  • La compression par ondelettes consiste en une
    analyse multi-résolution de limage.

75
La compression par ondelettes
  • Réduction de la résolution de limage par
    décimation
  • Séparation des détails horizontaux, verticaux, et
    bidimensionnels par filtrage

Image originale décimée (smooth) 1 point sur 4
Transformée par ondelettes
Hautes fréquences horizontales
Hautes fréquences verticales
Hautes fréquences bidimensionnelles
Image originale
4 petites images (dimension/2) Les 3 images de
détail contiennent les informations perdues par
la décimation
A ce niveau, pas de pertes
76
La compression par ondelettes
  • On peut réitérer lopération sur limage décimée
    (smooth) plusieurs fois analyse
     multicouches .
  • Limage smooth est plus petite à chaque couche
    moins dinformations à coder
  • On peut quantifier les images de détails et leur
    appliquer un codage entropique.
  • Intérêt pour la 3D le multicouche permet
    dadapter le rendu des détails à la distance de
    visualisation (position de lutilisateur dans
    lenvironnement 3D).

77
Le codage des images de synthèse
  • La norme inclut des algorithmes permettant la
    description des visage et leur animation.
  • Elle permet aussi la construction dobjets par
    treillis actifs
  • Les objets sont décrits par un treillis
    triangulaire
  • Le décodeur calcule lévolution de la texture
    dune scène à lautre pour chaque triangle par
    interpolation

Un treillis
78
La norme MPEG4 audio
  • Codage des sons naturels
  • Débits de 2 à 64 kbit/s
  • La norme na pas pu proposer 1 seul algorithme
    pour tous les types de sons (musique, parole,
    etc. )
  • ? Elle inclut plusieurs standards de codage,
    adapté à chaque type de signal sonore
  • Les algorithmes proposés dans la norme MPEG2
    audio sont notamment repris.
  • Synthèse de sons la norme inclut plusieurs
    algorithmes de génération de sons (pluie, bruits
    de pas, instruments de musique).

79
Description de scènes
  • Les scènes sont organisées sous forme dune
    structure hiérarchique dobjets.
  • La norme inclut un standard de description de la
    scène en flux binaire BIFS (Binary Format for
    Scene Description).
  • Elle permet lutilisation du VRML (langage de
    modélisation de la réalité virtuelle) pour
    permettre linterface de la 3D et de la vidéo.

80
Description de scène un exemple
81
Profils et niveaux MPEG4
  • 5 profils
  • Profils visuels codage visuel des données
    naturelles, synthétiques ou hybrides
  • Profils audio nombre doutils implémentés et le
    débit visé
  • Profils graphiques éléments graphiques et
    textuels utilisables dans une scène
  • Profils de descripteurs de scène types
    dinformations pouvant constituer une scène MPEG4
    (audio, 2D, 3D)
  • Profils de descripteurs dobjets outils
    disponibles pour décrire un objet (descripteur
    dobjet, synchronisation, information sur le
    contenu des objets)

82
Profils et niveaux MPEG4
83
Bibliographie
  •  Compression Numérique JPEG, DV, MPEG ,
    support de cours, INA Formation, mars 2003
  •  Compression MPEG-1 à MPEG-4 , E. Fert, S.
    Jeannin, Techniques de lIngénieur - Traité
    Télécommunications
  •  Compression des images nouveaux besoins,
    nouvelles technologies , support de cours, J.
    Weiss, Supelec, 2000
Write a Comment
User Comments (0)
About PowerShow.com