Le stockage des données - Département Montefiore

Transcription

Le stockage des données - Département Montefiore
Chapitre 2
Le stockage des données
Ce chapitre est consacré à l’introduction des supports de données :
– les supports magnétiques
– les supports optiques
– CD (laser infrarouge - 780nm)
– DVD (laser rouge - 650nm)
– HD-DVD (laser bleu - 405nm)
– Blu-Ray (laser bleu - 405nm)
– les supports utilisant la technologie holographique
2.1
Le support magnétique
Le principe est d’encoder les informations à partir d’un champ magnétique. La bande magnétique est constituée de pigments (p.ex. oxyde de fer). Par l’intermédiaire d’une tête d’écriture
(un électro-aimant), on induit un champ magnétique qui va « marquer » ces pigments et ainsi
y retenir une information.
Lors d’une lecture, la tête remarquera ces modifications de champs magnétiques. La tension
électrique induite sera traduite et restituera les informations.
2.1.1
Quelques mots au sujet du disque dur
Le disque dur se compose de plusieurs plateaux, chacun d’eux possédant 2 faces (recto et
verso). Chaque face possède sa propre tête. Ces têtes sont toutes solidaires car elles sont fixées
sur le même support.
Chaque face est constituée de plusieurs pistes. Les pistes situées sur un même rayon mais sur
des plateaux différents forment un cylindre. Chaque piste est composée de secteurs.
Trois temps sont utilisés pour mesurer les performances du disque dur :
– Le temps de latence (TLatence )
– Le temps de recherche (TSeek )
– Le temps de transfert (TT ransmission )
20
Structure de l’information
21
Fig. 2.1 – Anatomie d’un disque dur
Fig. 2.2 – Temps remarquables
Ces performances sont toutefois limitées par des contraintes mécaniques et physiques. Différentes technologies existent pour pallier ces problèmes :
– Le stockage des données sur un disque dur s’opérait jusqu’il y a peu de manière “longitudinale”, c’est-à-dire que les bits étaient stockés sur leur longueur (voir figure 2.3). Depuis
quelques années maintenant, Hitachi a mis au point une technique stockant les données
perpendiculairement au plateau.
Dans le cas de l’enregistrement longitudinal, lorsque la densité des bits devient trop importante, un effet physique appelé superparamagnétisme provoque la corruption des bits,
et donc des données. Avec le “Perpendicular recording” (P-Recording), l’effet superparamagnétique réduit, ce qui autorise une densité beaucoup plus élevée, et donc des disques
de capacité plus importante.
– La technologie RAID et ses variations communes (RAID 0, 1, 5, 6, 0+1, etc.)
Malgré tout, à moyen terme voire à court terme, de nouvelles techniques devront voir le jour
car il possède bien d’autres inconvénients :
– Usure relativement rapide
– Résistance aux impuretés
– Consommation forte en énergie
– Taille de certains supports de stockage
Dumont Renaud
Support Compression et Stockage
Structure de l’information
22
Fig. 2.3 – P-Recording
En raison de ces inconvénients, plusieurs pistes sont actuellement suivies :
– Des avancées sur le P-recording, aujourd’hui largement utilisé dans les disques de grande
capactié (>= 1 To). Il s’agit toutefois, comme nous venons de le voir, d’une solution à
très court terme.
– Les SSD (Solid State Disk), à base de mémoire flash ou de DRAM
– L’AFM (Atomic Force Microscope) permettant le stockage de données de l’ordre du nanomètre. Ces recherches existent notamment chez HP (ARS - "Stockage à résolution atomique") et IBM (Millipède), même si le projet semble abandonné chez ce dernier.
AFM
Ce type de support de stockage permettrait 1000 Gbits/in2 (1 inch = 2.54 cm). Le principe
est d’utiliser un réseau de pointes microscopiques qui écrivent et lisent sur un matériau spécifique. Une partie mécanique déplacera le support d’écriture. Ce matériau a la particularité de
posséder deux états selon sa température, l’un servant à l’écriture, l’autre à la lecture.
Une pointe sous tension envoie un faisceau d’électrons qui écrira sur le matériau lorsque la
température sera assez élevée, et après refroidissement, une autre pointe lira sur la surface à
l’aide d’un faisceau plus faible.
Plusieurs problèmes importants restent à résoudre :
– Le mécanisme de déplacement doit avoir une précision de l’ordre du nanomètre
– Le système doit s’utiliser dans une atmosphère fermée pour éviter la dispersion des électrons à la sortie de la pointe
2.2
Support optique
L’année 1980 voit la sortie d’un standard définissant les modalités d’enregistrement et
d’échantillonnage : le Livre rouge. Les normes suivantes formèrent un ensemble appelé les Rainbow Books. Ils diffèrent selon le type de média qu’ils concernent :
– Le livre rouge (CD-DA)
– Le livre jaune (CD-ROM)
Dumont Renaud
Support Compression et Stockage
Structure de l’information
–
–
–
–
–
–
–
Le
Le
Le
Le
Le
Le
Le
livre
livre
livre
livre
livre
livre
livre
23
orange (CD-R, CD-RW)
vert (CD-i)
violet (SACD)
beige (Photo CD)
blanc (VCD, Disques hybrides)
bleu (Enhanced-CD)
pourpre (DoubleDensity CD)
En règle générale, pour les supports optiques, on utilisera le système de fichiers UDF (Universal Disk Format). Descendant de la norme ISO9660, c’est par son intermédiaire qu’il est
possible d’ajouter des fichiers sur un disque après une première gravure (multi-session). Enfin,
ce système de fichiers offre une compatibilité entre les systèmes d’exploitation (DOS, Windows,
Linux, OS/2, Macintosh et UNIX).
2.2.1
Le Compact Disc
2.2.1.1
CD-Rom
Les données sont « incrustées » dans une couche de plastique (polycarbonate) et recouvertes
par une couche d’aluminium (ou d’or, ou d’argent). Le tout est recouvert par une couche de
vernis et par une couche utilisée pour la présentation du disque (label). Ce type de stockage est
durable car aucune partie du lecteur ne touche la surface des données. Il utilise les propriétés
de réfraction de la lumière pour identifier les 1 et les 0 d’après les creux et plats (pits and lands).
Fig. 2.4 – Structure d’un CD-ROM
La structure logique d’un CD se compose de 3 parties :
Dumont Renaud
Support Compression et Stockage
Structure de l’information
24
– La zone Lead-In : il s’agit de la zone la plus proche du centre du disque. Elle contient la
TOC (Table of Content) permettant au lecteur de situer les données sur le disque.
– La zone de données
– La zone Lead-Out : elle contient des données nulles marquant la fin du disque. La technique d’Overburning permet d’écrire des données dans cette zone.
La capacité d’un disque audio varie de 74 à 99 minutes, de 650 à 870 MB. Ces tailles ont été
au départ spécifiée dans les normes dédiées.
Sur un cd audio, chaque seconde occupe 75 secteurs du disque. Ainsi, un cd audio “plein” possède une capacité totale égale à 74x60x75 = 333.000 secteurs. La taille de ces secteurs dépend
du contenu qu’ils renferment, un secteur de données audio nécessitant une correction d’erreurs moins importante (laissant donc place à plus d’information utile) que pour des données
brutes (2353 octets contre 2048). Un disque audio de 74 minutes possède donc une capacité de
783.216.000 octets (746MB) contre 681.984.000 octets (650MB) pour un CD de données.
Des calculs semblables expliquent les différences en termes de capacité pour les disque de
80, 90 et 99 minutes.
2.2.1.2
CD-R
Une couche photosensible (entre le polycarbonate et l’aluminium) est brulée par le laser du
graveur, ce qui permet de reproduire les « trous » présents dans un CD-Rom classique.
Fig. 2.5 – Structure d’un CD-R
– Le laser utilisé pour bruler la couche photosensible est dix fois plus puissant que celui
utilisé pour la lecture.
Dumont Renaud
Support Compression et Stockage
Structure de l’information
25
– La couleur du CD-R varie selon le colorant utilisé pour sa fabrication. Selon ce dernier, la
réflexion sera plus ou moins bonne, ce qui influera sur sa qualité et sa durée de vie.
– On trouve une spirale pré-imprimée sur le CD-R. Elle est nécessaire pour guider le laser
du graveur.
– Deux zones supplémentaires s’ajoutent aux trois déjà présente sur le CD-Rom. La PCA
(Power Calibration Area) permet au graveur de calibrer la puissance du laser pour les
phases d’écriture et de lecture.
– La PMA (Power Memory Area) retient la position des sessions écrites mais non finalisées
(lorsqu’elles le sont, elles sont placées dans la zone de Lead-in).
2.2.1.3
CD-RW
La couche inscriptible est un alliage de plusieurs matériaux (argent, indium, antimoine, et
tellure). Deux couches diélectriques sont insérées entre le polycarbonate, cette couche inscriptible
et la couche métallique réfléchissante. Suivant la température appliquée, diverses réactions ont
lieu au niveau des atomes la composant, ayant pour effet de laisser passer ou non la lumière.
Fig. 2.6 – Structure d’un CD-RW
Le codage de l’information sur un cd :
L’information codée sur un cd-rom utilise le codage EFM, Eight-to-Fourteen Modulation,
traduisant 8 bits en 14. La contrainte de ce codage est que deux bits à 1 ne peuvent être distants
de moins de 2 bits à 0 et ne peuvent être séparés par plus de 10 bits à 0. On note cette contrainte
(2,10). Le codage EFM fait partie de la famille des codes RLL (Run Lenght Limited), et on le
note ici RLL(2,10).
Il existe 267 codes EFM respectant la contrainte (2,10), mais lorsqu’on concatène deux codes
EFM, il peut arriver que le résultat n’y réponde plus. La solution est d’insérer des bits de liaison
Dumont Renaud
Support Compression et Stockage
Structure de l’information
26
Fig. 2.7 – Evolution de la RDS selon les bits de liaison choisis [Immink, 1990]
(Merging bits). Ces bits de liaison seront choisis tels que la valeur absolue de la DSV (Digital
Sum Value) ou RDS (Running Digital Sum) soit la plus proche possible de 0. La RDS est un
“indicateur de qualité de la réflexion” du disque qui, s’il est trop élevé ou trop bas, provoquera
des erreurs de lecture.
2.2.2
Le DVD (Digital Versatil Disc)
Le support de stockage est similaire au CD-Rom, mais le code correcteur d’erreurs est plus
évolué et nécessite moins de bits.
Fig. 2.8 – Comparaison CD - DVD
2.2.2.1
Le DVD DL (Double Layer)
En jouant sur la longueur d’onde du laser du lecteur (ou du graveur) et de la transparence
des couches du disque, on peut lire (graver) plusieurs couches présentes sur le disque.
Le codage utilisé porte le nom d’EFMPlus. Légerement plus performant que l’EFM (gain de
l’ordre de 6%), la différence conceptuelle principale est qu’il n’utilise que 2 bits de liaison1 .
1 Voir “EFMPlus : The coding Format of the Multimedia Compact Disc, K.A.S Immink, IEEE, 1995" pour
plus de précisions
Dumont Renaud
Support Compression et Stockage
Structure de l’information
27
Fig. 2.9 – Structure d’un DVD Double Couche [DaTARIUS Group]
2.2.3
Le HD-DVD
Au lieu d’utiliser le traditionnel laser rouge des graveurs conventionnels, on utilise ici le laser
bleu, dont la longueur d’onde est plus courte.
Le codage utilisé est le ETM (Eight to Twelve Modulation). Il consiste en une table de
correspondance entre les différents octets possibles et leur traduction sous la forme d’une suite
de 12 bits. La contrainte est ici (1,10).
2.2.4
Le Blu-Ray
Il est lui aussi basé sur la technologie du laser bleu. Il possède dès lors une finesse de gravure
égale à celle du HD-DVD. Ce support est plus performant en termes de capacité de stockage
que le HD-DVD car le lecteur utilise une lentille plus évoluée.
Le codage des données utilisé par le Blu-Ray porte le nom de 17PP et s’applique tel qu’illustré
à la figure 2.10.
La victoire du Blu-Ray
Les formats CD, DVD et HD DVD étaient déjà compatibles mais le problème lié à la compatibilité du Blu-ray a été résolu par une lentille universelle mise au point par Philips. En 2007
est apparu un lecteur compatible tout format. Le HD-DVD n’utilisait pas de cartouche alors
que les premiers Blu-Ray en possédaient une. Elle fut supprimée grâce à une technologie mise
au point par TDK (application d’une couche polymère protectrice).
Dumont Renaud
Support Compression et Stockage
Structure de l’information
28
Fig. 2.10 – Codage des informations sur un disque Blu-Ray [Source : Jean-José Wanègue]
Au CES 2007, on annonce des HD-DVD triple couche (51 Go). Mais déjà au CES 2006, on
trouvait un prototype TDK de 100 Go (4 couches). En mai 2006 apparaissait un autre prototype TDK de 200 Go (6*33.3Go). Et au Ceatec 2006, un mini-Blu-Ray de 33 Go pour 8cm de
diamètre (utilisation destinée aux caméscopes numériques).
Les chaines de production pour le HD DVD étaient un peu moins coûteuses, mais la production de Blu-Ray était plus avancée grâce à Sony et la PS3.
Le HD-DVD était soutenu par le DVD-Forum (Organisation de certification de standards) mais
le Blu-Ray avait le soutien d’un plus grand nombre de sociétés d’édition. Le choix (ou l’absence
de choix) était avant tout sujet aux pressions médiatiques.
Hormis la capacité de stockage, les différences sont minimes (différences au niveau des lentilles
utilisées, de la puissance du laser nécessaire, ...). Les deux supports sont compatibles avec les
mêmes formats de compression vidéo et utilisent la même longueur d’onde du laser.
2.2.5
Autres supports
Il existe plusieurs autres supports optiques plus ou moins répandus :
– FMD (Fluorescent MultiLayer Disc) : ce disque utilise les propriétés de fluorescence au
lieu des propriété de la réflexion. D’un point de vue théorique, il pourrait contenir jusqu’à
cent couches.
– DMD (Digital Multilayer Disc) : il est basé sur le FMD. Il peut stocker jusqu’à 21 Go
par couche, mais uniquement sur 2 couches (jusqu’à présent). Cependant, il n’y a plus
d’évolutions depuis 2004.
– VMD (Versatile Multilayer Disc) : Concurrent des HD-dvd et Blu-ray, il utilise encore le
laser rouge et autorise entre 20 et 100 Go par disque. Il permet effectivement jusqu’à 8
couches par face du disque de 4.7 à 6 Go chacune. Il n’a malheureusement pas, pour le
moment, de soutien de la part des industries.
– EVD (Enhanced Versatile Disc) : C’est l’équivalent du dvd en Chine. D’une capacité de
8.5 Go, il utilise encore le laser rouge.
– FVD (Forward Versatile Disc) : Semblable au dvd à Taiwan. Il peut renfermer 6 Go et
utilise lui aussi le laser rouge.
Dumont Renaud
Support Compression et Stockage
Structure de l’information
2.2.6
29
Domaine de Recherche : le support holographique
Un nouveau type de cupport fait de plus en plus parler de lui : le support holographique.
On parle dès lors de HDSS (Holographic Data Storage System).
Les disques conventionnels offrent une lecture à deux dimensions. Avec ce système, il est possible
Fig. 2.11 – Ecriture et lecture sur un support holographique [InPhase]
de stocker les données de façon volumiques, c’est-à-dire dans l’épaisseur même du média. Cette
technique repose sur une propriété des interférences naissant entre deux ondes lors de leur
passage dans un matériau photosensible. Ces interférences provoquent dans le matériau une
série de transformations physiques et/ou chimiques.
Fig. 2.12 – Ecriture et lecture sur un support holographique (II)[InPhase]
L’avantage est que suivant l’angle des rayons utilisés, on peut superposer les informations,
et y accéder de manière indépendante. Pour ce faire, on joue sur l’angle d’incidence du rayon
de référence (Reference Beam).
Par ce procédé, il pourrait être possible de créer des éléments de mémoire vive de 25 Go
l’unité, des disques durs de 1 To (1000 Go) par plateau, ou encore des data warehouse de 1 Po
(1 000 000 Go).
Dumont Renaud
Support Compression et Stockage
Structure de l’information
2.3
30
Ressources
Articles :
Runlength Limited Sequences, K.A.S. Immink, IEEE 1990
EFMPlus : The coding Format of the Multimedia Compact Disc, K.A.S. Immink, IEEE, 1995
Illustrations :
–
–
–
–
EMC Annual Report 2000
DVD Forum, Jean-José Wanègue
CST-Commission Supérieure Technique de l’image et du son
In-Phase Technologies
Ressources Internet :
http://www.dataligence.com/
http://www.storagereview.com/
http://www.vulgarisation-informatique.com/graveur.php
http://www.research.ibm.com/journal/rd/443/ashley.html
http://www.optware.co.jp/english/
http://www.inphase-tech.com/
http://www.nmeinc.com/
Dumont Renaud
Support Compression et Stockage