Normes de compression vidéo

Transcription

Normes de compression vidéo
Normes de compression vidéo
Riadh ABDELFATTAH
École supérieure de Télécommunications
riadh abdelfattahh@supcom rnu tn
[email protected]
Objectifs du cours
1. Mode de représentation des données vidéo
9
9
9
Image fixe
Graphique et couleur
Image animée et vidéo
2. Norme de compression vidéo
9
9
Fonctionnement des normes de compression MPEG1 et MPEG2
Description des données multimédia avec MPEG4
3 Programmation multimédia
3.
9
9
Langage de description des scènes : VRML
Représentation
p
textuelle des scènes MPEG4
R. ABDELFATTAH
SUP'COM
2
Plan du cours
1. Partie cours (4 séances)
9
9
9
Introduction au mode de représentation des données vidéo
Normes de compression vidéo MPEG1 et MPEG2
La norme multimédia MPEG4
2. Partie pratique (4 séances)
9
9
Le langage VRML
Représentation textuelle des scènes MPEG4 par VRML
R. ABDELFATTAH
SUP'COM
3
Introduction au mode de
représentation
é
t ti d
des données
d
é vidéo
idé
Riadh ABDELFATTAH
École supérieure de Télécommunications
riadh abdelfattah@supcom rnu tn
[email protected]
R. ABDELFATTAH
SUP'COM
4
Plan
1. Introduction
2. Graphiques et images fixes
3. Images animées
3. Conclusion
R. ABDELFATTAH
SUP'COM
5
1. Introduction
Les phénomènes
physiques sont continus
L'ordinateur manipule
des données discrètes
Acquérir, gérer et manipuler
• des chiffres
• du texte
• du son
• des graphiques
• des images
• de la vidéo
Solution ⇒ Numériser l'information
Compromis
p
⇒ stockage,
g , transport,
p , qqualité,, affichage
g et coût
R. ABDELFATTAH
SUP'COM
6
1. Introduction
Normes et Standards
9 Norme
"La norme est un document établi par un consensus et approuvé par un organisme
reconnu, qui, fournit, pour des usages communs et répétés, des règles, des lignes
directrices ou des caractéristiques, pour des activités ou leurs résultats,
garantissant
ti
t un niveau
i
d'ordre
d' d optimal
ti l dans
d
un contexte
t t donné"
d
é" (Eric
(E i S
Sutter).
tt )
• ISO
• CEI
• ITU
Accord long à établir : conflits d’intérêts
9 Standard
Mode d’expression défini par un constructeur, parfois accepté par d’autres constructeurs
Norme de fait, varie selon le “poids” du constructeur, de la communauté
R. ABDELFATTAH
T
Type
N
Normes
St d d
Standards
Texte
html
pdf, rtf
Image
png, jpeg
gif, bmp
Vidèo
quicktime
applevideo
SUP'COM
7
2.
Graphiques et images fixes
2.1 L’image et la résolution
(0, 0)
X
9 Image : Matrice 2D de PIXELs (PICture Element)
Y
Figure 1 : Le repère cartésien d’image
Voir l’exemple sous Matlab
R. ABDELFATTAH
SUP'COM
8
2.
Graphiques et images fixes
2.1 L’image et la résolution
9 Pitch : espace entre deux points lumineux
Figure 2 : Différence entre primitive de l’image et celle de l’écran
R. ABDELFATTAH
SUP'COM
9
2.
Graphiques et images fixes
2.2 La lumière
• La lumière est issue de deux composantes
9 Une onde électromagnétique ondulatoire
9 Un aspect corpusculaire (les photons)
• Caractéristiques
9 Fréquence
9 Intensité
• Vitesse de déplacement : ~ 300000 km/s
• Fréquence : ~ 600'000 Ghz
R. ABDELFATTAH
SUP'COM
10
2.
Graphiques et images fixes
2.2 La lumière
• L'oeil humain :
9 Des cônes perçoivent la lumière
9 3 types : percevoir le bleu, le vert et le rouge
9 Perception entre 400 et 700 nm
9 Si un type de cônes fait défaut : daltonisme
λ (nm)
Figure 3 : Courbe de la sensibilité relative de l’œil humain
au longueurs d’onde composant la lumière blanche
R. ABDELFATTAH
SUP'COM
11
2.
Graphiques et images fixes
2.3 Le codage de la couleur
ƒ Le nombre de couleurs la composant (bits/pixel) :
• Noir & Blanc : 1 bit
• 256 nuances de gris : 8 bits
• 256 couleurs : 8 bits (palette de couleurs)
Les pixels
La palette
R. ABDELFATTAH
SUP'COM
L image
L’image
correspondante
12
2.
Graphiques et images fixes
2.3 Le codage de la couleur
• 232 : 32 bits, on ajoute une quatrième composante sur 8 bits :
9 Le canal alpha
9 Permet de gérer la "transparence"
transparence des points
9 Evitant ainsi les effets de "marches d'escalier" pouvant
apparaître sur des images
R. ABDELFATTAH
SUP'COM
13
2.
Graphiques et images fixes
2.3 Le codage de la couleur
bitmap noir et blanc
en stockant un
n bit
dans chaque case (pixel),
bitmap 256 niveaux de gris
en stockant un
n octet
dans chaque case
.gif
.gif
palette de couleurs
(colormap)
en codant les indices
d’une ppalette de couleurs
sur 8 bits
R. ABDELFATTAH
true color
(RGB: rouge, vert, bleu).
• Chaque pixel est codé sur 24 bits
.gif
(16 millions de couleurs)
.jpg
• Chaque pixel est codé sur 32 bits
information de transparence ou de texture
SUP'COM
14
2.
Graphiques et images fixes
2.4 La sensibilité de l'oeil
Image couleur
l
I
Image
de
d luminance
l i
I
Image
de
d chrominance
h
i
9 beaucoup plus grande aux variations dd'intensité
intensité (luminance)
9 qu'aux variations de couleur (chrominance)
R. ABDELFATTAH
SUP'COM
15
2.
Graphiques et images fixes
2.5 Synthèse de couleurs
La synthèse additive
La synthèse soustractive
La couleur est définie comme
somme pondérée de trois couleurs
La couleur est définie comme
différence pondérée entre le blanc et
trois couleurs
3 couleurs primaires (rouge, vert,
bleu) : Modèle RGB
3 couleurs complémentaires de
rouge, vert, bleu (cyan, magenta,
jaune) : Modèle CMY
C'est le principe de fonctionnement
q
des tubes cathodiques
C'est le principe de fonctionnement
des imprimantes.
p
R. ABDELFATTAH
SUP'COM
16
2.
Graphiques et images fixes
2.5 Synthèse de couleurs
G
0,
255,
B
Black
White
R
( 0,
(255,
Red
Green
Blue
(255,
( 0,
( 0,
0,
255,
0,
0)
0)
255)
Cyan
( 0,
Magenta (255,
Yellow (255,
255,
0,
255,
255)
255)
0)
R. ABDELFATTAH
0))
255)
SUP'COM
17
2.
Graphiques et images fixes
2.5 Synthèse de couleurs
La synthèse additive
La synthèse soustractive
Y
M
C
Extension : le modèle CMYK.
En pratique, le noir n'est pas
tout à fait noir.
Ajout d'une composante "noir pur".
C
CMYK
: Cyan,
C
Magenta, Yellow
ll
BlacK
R. ABDELFATTAH
SUP'COM
18
2.
Graphiques et images fixes
2.6 Format et résolutions d’images
image vectorielle
WMF
EPS
CDR
PCT
DXF
R. ABDELFATTAH
image bitmap
T.4 et T.6
BMP
PSD
PCX
DCP
SUP'COM
GIF
JPEG
TIFF
PNG
19
2.
Graphiques et images fixes
2.6 Format et résolutions d’images
.jpg
.jpg
314 x 397
157 x 199
.jpg
.jpg
40 x 50
79 x 100
R. ABDELFATTAH
SUP'COM
20
2.
Graphiques et images fixes
2.6 Format et résolutions d’images
Dimensions
de ll’image
image
Image en noir
et blanc (Ko)
Image en 256
niveaux de gris (Ko)
Image en
True color (Ko)
320x200
640x480
800x600
1024x768
R. ABDELFATTAH
SUP'COM
21
2.
Graphiques et images fixes
2.6 Format et résolutions d’images
Dimensions
de ll’image
image
Image en noir
et blanc (Ko)
Image en 256
niveaux de gris (Ko)
Image en
True color (Ko)
320x200
7.8
62.5
187.5
640x480
37.5
300
900
800x600
58.6
1024x768
96
R. ABDELFATTAH
1406.2
768
SUP'COM
2304
22
3.
Images animées
¾ Vidéo
• Suite rapide dd'images
images
• Généralement obtenue à partir d'une source vidéo analogique
(caméra, magnétoscope,...)
• Une
U séquence
é
audio
di estt synchronisée
h i é avec les
l images.
i
¾ Animation
• Suite d'images de débit moins important que la vidéo
• Les images ont généralement été produite grâce à un logiciel de
dessin
• L'aspect visuel d'une animation se rapproche donc de celui d'un
dessin animé
• Une animation peut comporter du son
R. ABDELFATTAH
SUP'COM
23
3.
Images animées
3.1 Critères de qualité d’une vidéo ou d’une animation
¾ Nombre d'images (trames) par seconde :
9 Mouvements fluides : afficher plus de 20 images par secondes
(persistance rétinienne 1/15s)
9 Cinéma : 24 images/seconde
9 Télévision : 25 ((France)) ou 30 ((USA,, Japon)
p )
¾ Qualité propre aux images
9 Résolution
9 Nombre de couleurs
R. ABDELFATTAH
SUP'COM
24
3.
Images animées
¾ Vidéo
• Une
U iimage estt découpée
dé
é en lignes
li
:
9 TVHD 16/9 : 1250 lignes
9 TV 4/3 : 625 lignes.
• Une image est composée de deux trames de 312,5
312 5 lignes
(la trame impaire et la trame paire)
• Balayage entrelacé
• Bande passante 5,5Mhz
5 5Mhz
R. ABDELFATTAH
SUP'COM
25
3.
Images animées
3.2 Vidéo analogique
9 Un signal vidéo analogique est composé d’une :
• Information
I f
ti représentant
é t t la
l luminosité
l i ité (brillance)
(b ill
)
Y = 0.30R + 0.59G + 0.11B
Pour la compatibilité avec le noir et blanc, on transmet Y, U et V
• Information représentant la couleur (chrominance)
U=R–Y&V=B–Y
• Information sonore (audio)
• Information de synchronisation
y
R. ABDELFATTAH
SUP'COM
26
3.
Images animées
3.2 Vidéo analogique
9 Modèles de transmission et d’enregistrement
• RGB (câbles séparés : R & G & B)
• S-Vidéo ((deux câbles : luminance & chrominances, même piste)
p )
• Vidéo composite (un seul signal de luminance & chrominance)
(la plus utilisée)
• Vidéo en composante (deux câbles et deux pistes différentes)
9 Exemple : Signal vidéo SECAM
R. ABDELFATTAH
SUP'COM
27
3.
Images animées
3.2 Vidéo analogique
¾ Vidéo analogique : Les standards télé
 1953 NTSC (National Television System Comittee) US, Japon
• 525 lignes, 60 trames/s, 30 images/s
• 480 lignes de vidéo, 45 pour des sous-titres
Â1960 SECAM (SEquentiel Couleur à Mémoire) France
• 625 lignes, 50 trames/s, 25 images/s
 1963 PAL (Phase Alternation by Line) EU
• 625 lignes, 50 trames/s, 25 images/s
 Film
• 24 images/s
 Toutes les lignes d’une trames ne sont pas visualisées (synchronisations) :
En 625 : 576 lignes visibles
En 525 : 480 lignes visibles
R. ABDELFATTAH
SUP'COM
28
3.
Images animées
3.2 Vidéo analogique
¾ Vidéo composite : PAL, SECAM et NTSC
9 Définition
Défi iti : Les
L composantes
t de
d la
l vidéo
idé (luminance,
(l i
chrominance,
h
i
informations de synchronisation, …) sont codées et combinées dans
un même et unique signal avant transmission
9 Conséquences :
• Moins robuste aux interférences
• qualité plus réduite
¾ Vidéo en composante : magnétoscope VHS et cam. Vidéo (S-VHS, Betamax)
9 Définition : Les composantes de la vidéo sont codées séparément
et transmis dans des signaux distincts
9Conséquences :
• Plus robuste aux interférences
• qualité améliorée
R. ABDELFATTAH
SUP'COM
29
3.
Images animées
3.3 Vidéo numérique
• Objectif :
ƒ préserver la qualité lors de copies multiples
ƒ facilité le stockage,
stockage la manipulation et la transmission
• Principe :
ƒ Numériser chacun des signaux vidéo analogiques
9 échantillonner
9 quantifier
9 coder
• Problèmes :
ƒ taille des fichiers immenses
ƒ Exemple : 2 heures de TV numérique (PAL-SECAM):
9 1 944 Gigabits
R. ABDELFATTAH
SUP'COM
30
3.
Images animées
3.3 Vidéo numérique
9 deux étapes pour obtenir un débit utilisable
• l’échantillonnage
• la compression
9 Echantillonnage
• PAL/SECAM
: 720 pixels x 576 lignes
• NTSC
: 720 pixels x 480 lignes
• Luminance Y, Chrominances Cb et Cr
Y
0.299 0.587 0.114 R
Cb = -0.169 -0.331 0.500 V
Cr
-0 419 -0
-0.081
081 B
00.500
500 -0.419
• Profondeur d’échantillonnage : de 8 à 10 bits
R. ABDELFATTAH
SUP'COM
31
3.
Images animées
3.3 Vidéo numérique
9 Conversion analogique numérique 4:2:2 (CCIR 601)
R. ABDELFATTAH
SUP'COM
32
3.
Images animées
3.3 Vidéo numérique
9 Images vidéo numériques (A partir de 1972)
ƒL
L’image
image de luminance numérique fait 720x576 :
• Il y a 720 échantillons de luminance par ligne
• Il y a 576 ligne visibles
ƒ L’image de chrominance numérique fait 360x576 :
• Il y a 360 échantillons de chrominance par ligne
• Il y a 576 ligne
g visibles
ƒ C’est le format 4:2:2
R. ABDELFATTAH
SUP'COM
33
3.
Images animées
3.3 Vidéo numérique
9 Conversion analogique numérique (Norme CCIR 601)
4:2:2
: :
4:2:0
: :0
4:1:1
: :
Fréquence d'échantillonnage
Luminance : 13,5 MHz
Chrominance : 6,75 MHz
Fréquence d'échantillonnage
Luminance :
Chrominance :
Fréquence d'échantillonnage
Luminance :
Chrominance :
Echantillon de luminance
Echantillon de luminance et de
chrominance
R. ABDELFATTAH
SUP'COM
34
3.
Images animées
3.3 Vidéo numérique
9 Conversion analogique numérique (Norme CCIR 601)
4:2:2
: :
4:2:0
: :0
4:1:1
: :
Fréquence d'échantillonnage
Luminance : 13,5 MHz
Chrominance : 6,75 MHz
Fréquence d'échantillonnage
Luminance : 13,5 MHz
Chrominance : 6,75 MHz
une ligne
li
sur 2
Fréquence d'échantillonnage
Luminance :
Chrominance :
Echantillon de luminance
Echantillon de luminance et de
chrominance
R. ABDELFATTAH
SUP'COM
35
3.
Images animées
3.3 Vidéo numérique
9 Conversion analogique numérique (Norme CCIR 601)
4:2:2
: :
4:2:0
: :0
4:1:1
: :
Fréquence d'échantillonnage
Luminance : 13,5 MHz
Chrominance : 6,75 MHz
Fréquence d'échantillonnage
Luminance : 13,5 MHz
Chrominance : 6,75 MHz
une ligne
li
sur 2
Fréquence d'échantillonnage
Luminance : 13,5 MHz
Chrominance : 3,375 MHz
Echantillon de luminance
Echantillon de luminance
l minance et de chrominance
R. ABDELFATTAH
SUP'COM
36
3.
Images animées
3.3 Vidéo numérique
9 Conversion analogique numérique (Norme CCIR 601)
Chrominance
ƒ Format
F
t 4:2:2
4 2 2 (PAL/SECAM)
ƒ Format 4:2:0 (PAL/SECAM)
ƒ Format 4:1:1 (NTSC)
(
)
ƒ Format SIF ou 2:1:0
R. ABDELFATTAH
SUP'COM
37
3.
Images animées
3.3 Vidéo numérique
9 Format de fichiers d’images animées
QuickTime
Q
i kTi
Movies
(fil Quick
(films
Q i k Time)
Ti ) («.mov»)
(
)
AVI
Audio-Video Interleaved (entrelacement
audio-vidéo) («.avi»)
MPEG
Moving Picture Expert Group (groupe
d'experts
p
d'images
g mobiles(«.mpg»)
(
pg )
RealVideo
Produit vidéo de Progressive Networks
GIF 89a
Graphic
Interchange
( animated GIF»)
(«animated
GIF )
R. ABDELFATTAH
SUP'COM
Format
89a
38