Le stockage des données - Département Montefiore
Transcription
Le stockage des données - Département Montefiore
Chapitre 2 Le stockage des données Ce chapitre est consacré à l’introduction des supports de données : – les supports magnétiques – les supports optiques – CD (laser infrarouge - 780nm) – DVD (laser rouge - 650nm) – HD-DVD (laser bleu - 405nm) – Blu-Ray (laser bleu - 405nm) – les supports utilisant la technologie holographique 2.1 Le support magnétique Le principe est d’encoder les informations à partir d’un champ magnétique. La bande magnétique est constituée de pigments (p.ex. oxyde de fer). Par l’intermédiaire d’une tête d’écriture (un électro-aimant), on induit un champ magnétique qui va « marquer » ces pigments et ainsi y retenir une information. Lors d’une lecture, la tête remarquera ces modifications de champs magnétiques. La tension électrique induite sera traduite et restituera les informations. 2.1.1 Quelques mots au sujet du disque dur Le disque dur se compose de plusieurs plateaux, chacun d’eux possédant 2 faces (recto et verso). Chaque face possède sa propre tête. Ces têtes sont toutes solidaires car elles sont fixées sur le même support. Chaque face est constituée de plusieurs pistes. Les pistes situées sur un même rayon mais sur des plateaux différents forment un cylindre. Chaque piste est composée de secteurs. Trois temps sont utilisés pour mesurer les performances du disque dur : – Le temps de latence (TLatence ) – Le temps de recherche (TSeek ) – Le temps de transfert (TT ransmission ) 20 Structure de l’information 21 Fig. 2.1 – Anatomie d’un disque dur Fig. 2.2 – Temps remarquables Ces performances sont toutefois limitées par des contraintes mécaniques et physiques. Différentes technologies existent pour pallier ces problèmes : – Le stockage des données sur un disque dur s’opérait jusqu’il y a peu de manière “longitudinale”, c’est-à-dire que les bits étaient stockés sur leur longueur (voir figure 2.3). Depuis quelques années maintenant, Hitachi a mis au point une technique stockant les données perpendiculairement au plateau. Dans le cas de l’enregistrement longitudinal, lorsque la densité des bits devient trop importante, un effet physique appelé superparamagnétisme provoque la corruption des bits, et donc des données. Avec le “Perpendicular recording” (P-Recording), l’effet superparamagnétique réduit, ce qui autorise une densité beaucoup plus élevée, et donc des disques de capacité plus importante. – La technologie RAID et ses variations communes (RAID 0, 1, 5, 6, 0+1, etc.) Malgré tout, à moyen terme voire à court terme, de nouvelles techniques devront voir le jour car il possède bien d’autres inconvénients : – Usure relativement rapide – Résistance aux impuretés – Consommation forte en énergie – Taille de certains supports de stockage Dumont Renaud Support Compression et Stockage Structure de l’information 22 Fig. 2.3 – P-Recording En raison de ces inconvénients, plusieurs pistes sont actuellement suivies : – Des avancées sur le P-recording, aujourd’hui largement utilisé dans les disques de grande capactié (>= 1 To). Il s’agit toutefois, comme nous venons de le voir, d’une solution à très court terme. – Les SSD (Solid State Disk), à base de mémoire flash ou de DRAM – L’AFM (Atomic Force Microscope) permettant le stockage de données de l’ordre du nanomètre. Ces recherches existent notamment chez HP (ARS - "Stockage à résolution atomique") et IBM (Millipède), même si le projet semble abandonné chez ce dernier. AFM Ce type de support de stockage permettrait 1000 Gbits/in2 (1 inch = 2.54 cm). Le principe est d’utiliser un réseau de pointes microscopiques qui écrivent et lisent sur un matériau spécifique. Une partie mécanique déplacera le support d’écriture. Ce matériau a la particularité de posséder deux états selon sa température, l’un servant à l’écriture, l’autre à la lecture. Une pointe sous tension envoie un faisceau d’électrons qui écrira sur le matériau lorsque la température sera assez élevée, et après refroidissement, une autre pointe lira sur la surface à l’aide d’un faisceau plus faible. Plusieurs problèmes importants restent à résoudre : – Le mécanisme de déplacement doit avoir une précision de l’ordre du nanomètre – Le système doit s’utiliser dans une atmosphère fermée pour éviter la dispersion des électrons à la sortie de la pointe 2.2 Support optique L’année 1980 voit la sortie d’un standard définissant les modalités d’enregistrement et d’échantillonnage : le Livre rouge. Les normes suivantes formèrent un ensemble appelé les Rainbow Books. Ils diffèrent selon le type de média qu’ils concernent : – Le livre rouge (CD-DA) – Le livre jaune (CD-ROM) Dumont Renaud Support Compression et Stockage Structure de l’information – – – – – – – Le Le Le Le Le Le Le livre livre livre livre livre livre livre 23 orange (CD-R, CD-RW) vert (CD-i) violet (SACD) beige (Photo CD) blanc (VCD, Disques hybrides) bleu (Enhanced-CD) pourpre (DoubleDensity CD) En règle générale, pour les supports optiques, on utilisera le système de fichiers UDF (Universal Disk Format). Descendant de la norme ISO9660, c’est par son intermédiaire qu’il est possible d’ajouter des fichiers sur un disque après une première gravure (multi-session). Enfin, ce système de fichiers offre une compatibilité entre les systèmes d’exploitation (DOS, Windows, Linux, OS/2, Macintosh et UNIX). 2.2.1 Le Compact Disc 2.2.1.1 CD-Rom Les données sont « incrustées » dans une couche de plastique (polycarbonate) et recouvertes par une couche d’aluminium (ou d’or, ou d’argent). Le tout est recouvert par une couche de vernis et par une couche utilisée pour la présentation du disque (label). Ce type de stockage est durable car aucune partie du lecteur ne touche la surface des données. Il utilise les propriétés de réfraction de la lumière pour identifier les 1 et les 0 d’après les creux et plats (pits and lands). Fig. 2.4 – Structure d’un CD-ROM La structure logique d’un CD se compose de 3 parties : Dumont Renaud Support Compression et Stockage Structure de l’information 24 – La zone Lead-In : il s’agit de la zone la plus proche du centre du disque. Elle contient la TOC (Table of Content) permettant au lecteur de situer les données sur le disque. – La zone de données – La zone Lead-Out : elle contient des données nulles marquant la fin du disque. La technique d’Overburning permet d’écrire des données dans cette zone. La capacité d’un disque audio varie de 74 à 99 minutes, de 650 à 870 MB. Ces tailles ont été au départ spécifiée dans les normes dédiées. Sur un cd audio, chaque seconde occupe 75 secteurs du disque. Ainsi, un cd audio “plein” possède une capacité totale égale à 74x60x75 = 333.000 secteurs. La taille de ces secteurs dépend du contenu qu’ils renferment, un secteur de données audio nécessitant une correction d’erreurs moins importante (laissant donc place à plus d’information utile) que pour des données brutes (2353 octets contre 2048). Un disque audio de 74 minutes possède donc une capacité de 783.216.000 octets (746MB) contre 681.984.000 octets (650MB) pour un CD de données. Des calculs semblables expliquent les différences en termes de capacité pour les disque de 80, 90 et 99 minutes. 2.2.1.2 CD-R Une couche photosensible (entre le polycarbonate et l’aluminium) est brulée par le laser du graveur, ce qui permet de reproduire les « trous » présents dans un CD-Rom classique. Fig. 2.5 – Structure d’un CD-R – Le laser utilisé pour bruler la couche photosensible est dix fois plus puissant que celui utilisé pour la lecture. Dumont Renaud Support Compression et Stockage Structure de l’information 25 – La couleur du CD-R varie selon le colorant utilisé pour sa fabrication. Selon ce dernier, la réflexion sera plus ou moins bonne, ce qui influera sur sa qualité et sa durée de vie. – On trouve une spirale pré-imprimée sur le CD-R. Elle est nécessaire pour guider le laser du graveur. – Deux zones supplémentaires s’ajoutent aux trois déjà présente sur le CD-Rom. La PCA (Power Calibration Area) permet au graveur de calibrer la puissance du laser pour les phases d’écriture et de lecture. – La PMA (Power Memory Area) retient la position des sessions écrites mais non finalisées (lorsqu’elles le sont, elles sont placées dans la zone de Lead-in). 2.2.1.3 CD-RW La couche inscriptible est un alliage de plusieurs matériaux (argent, indium, antimoine, et tellure). Deux couches diélectriques sont insérées entre le polycarbonate, cette couche inscriptible et la couche métallique réfléchissante. Suivant la température appliquée, diverses réactions ont lieu au niveau des atomes la composant, ayant pour effet de laisser passer ou non la lumière. Fig. 2.6 – Structure d’un CD-RW Le codage de l’information sur un cd : L’information codée sur un cd-rom utilise le codage EFM, Eight-to-Fourteen Modulation, traduisant 8 bits en 14. La contrainte de ce codage est que deux bits à 1 ne peuvent être distants de moins de 2 bits à 0 et ne peuvent être séparés par plus de 10 bits à 0. On note cette contrainte (2,10). Le codage EFM fait partie de la famille des codes RLL (Run Lenght Limited), et on le note ici RLL(2,10). Il existe 267 codes EFM respectant la contrainte (2,10), mais lorsqu’on concatène deux codes EFM, il peut arriver que le résultat n’y réponde plus. La solution est d’insérer des bits de liaison Dumont Renaud Support Compression et Stockage Structure de l’information 26 Fig. 2.7 – Evolution de la RDS selon les bits de liaison choisis [Immink, 1990] (Merging bits). Ces bits de liaison seront choisis tels que la valeur absolue de la DSV (Digital Sum Value) ou RDS (Running Digital Sum) soit la plus proche possible de 0. La RDS est un “indicateur de qualité de la réflexion” du disque qui, s’il est trop élevé ou trop bas, provoquera des erreurs de lecture. 2.2.2 Le DVD (Digital Versatil Disc) Le support de stockage est similaire au CD-Rom, mais le code correcteur d’erreurs est plus évolué et nécessite moins de bits. Fig. 2.8 – Comparaison CD - DVD 2.2.2.1 Le DVD DL (Double Layer) En jouant sur la longueur d’onde du laser du lecteur (ou du graveur) et de la transparence des couches du disque, on peut lire (graver) plusieurs couches présentes sur le disque. Le codage utilisé porte le nom d’EFMPlus. Légerement plus performant que l’EFM (gain de l’ordre de 6%), la différence conceptuelle principale est qu’il n’utilise que 2 bits de liaison1 . 1 Voir “EFMPlus : The coding Format of the Multimedia Compact Disc, K.A.S Immink, IEEE, 1995" pour plus de précisions Dumont Renaud Support Compression et Stockage Structure de l’information 27 Fig. 2.9 – Structure d’un DVD Double Couche [DaTARIUS Group] 2.2.3 Le HD-DVD Au lieu d’utiliser le traditionnel laser rouge des graveurs conventionnels, on utilise ici le laser bleu, dont la longueur d’onde est plus courte. Le codage utilisé est le ETM (Eight to Twelve Modulation). Il consiste en une table de correspondance entre les différents octets possibles et leur traduction sous la forme d’une suite de 12 bits. La contrainte est ici (1,10). 2.2.4 Le Blu-Ray Il est lui aussi basé sur la technologie du laser bleu. Il possède dès lors une finesse de gravure égale à celle du HD-DVD. Ce support est plus performant en termes de capacité de stockage que le HD-DVD car le lecteur utilise une lentille plus évoluée. Le codage des données utilisé par le Blu-Ray porte le nom de 17PP et s’applique tel qu’illustré à la figure 2.10. La victoire du Blu-Ray Les formats CD, DVD et HD DVD étaient déjà compatibles mais le problème lié à la compatibilité du Blu-ray a été résolu par une lentille universelle mise au point par Philips. En 2007 est apparu un lecteur compatible tout format. Le HD-DVD n’utilisait pas de cartouche alors que les premiers Blu-Ray en possédaient une. Elle fut supprimée grâce à une technologie mise au point par TDK (application d’une couche polymère protectrice). Dumont Renaud Support Compression et Stockage Structure de l’information 28 Fig. 2.10 – Codage des informations sur un disque Blu-Ray [Source : Jean-José Wanègue] Au CES 2007, on annonce des HD-DVD triple couche (51 Go). Mais déjà au CES 2006, on trouvait un prototype TDK de 100 Go (4 couches). En mai 2006 apparaissait un autre prototype TDK de 200 Go (6*33.3Go). Et au Ceatec 2006, un mini-Blu-Ray de 33 Go pour 8cm de diamètre (utilisation destinée aux caméscopes numériques). Les chaines de production pour le HD DVD étaient un peu moins coûteuses, mais la production de Blu-Ray était plus avancée grâce à Sony et la PS3. Le HD-DVD était soutenu par le DVD-Forum (Organisation de certification de standards) mais le Blu-Ray avait le soutien d’un plus grand nombre de sociétés d’édition. Le choix (ou l’absence de choix) était avant tout sujet aux pressions médiatiques. Hormis la capacité de stockage, les différences sont minimes (différences au niveau des lentilles utilisées, de la puissance du laser nécessaire, ...). Les deux supports sont compatibles avec les mêmes formats de compression vidéo et utilisent la même longueur d’onde du laser. 2.2.5 Autres supports Il existe plusieurs autres supports optiques plus ou moins répandus : – FMD (Fluorescent MultiLayer Disc) : ce disque utilise les propriétés de fluorescence au lieu des propriété de la réflexion. D’un point de vue théorique, il pourrait contenir jusqu’à cent couches. – DMD (Digital Multilayer Disc) : il est basé sur le FMD. Il peut stocker jusqu’à 21 Go par couche, mais uniquement sur 2 couches (jusqu’à présent). Cependant, il n’y a plus d’évolutions depuis 2004. – VMD (Versatile Multilayer Disc) : Concurrent des HD-dvd et Blu-ray, il utilise encore le laser rouge et autorise entre 20 et 100 Go par disque. Il permet effectivement jusqu’à 8 couches par face du disque de 4.7 à 6 Go chacune. Il n’a malheureusement pas, pour le moment, de soutien de la part des industries. – EVD (Enhanced Versatile Disc) : C’est l’équivalent du dvd en Chine. D’une capacité de 8.5 Go, il utilise encore le laser rouge. – FVD (Forward Versatile Disc) : Semblable au dvd à Taiwan. Il peut renfermer 6 Go et utilise lui aussi le laser rouge. Dumont Renaud Support Compression et Stockage Structure de l’information 2.2.6 29 Domaine de Recherche : le support holographique Un nouveau type de cupport fait de plus en plus parler de lui : le support holographique. On parle dès lors de HDSS (Holographic Data Storage System). Les disques conventionnels offrent une lecture à deux dimensions. Avec ce système, il est possible Fig. 2.11 – Ecriture et lecture sur un support holographique [InPhase] de stocker les données de façon volumiques, c’est-à-dire dans l’épaisseur même du média. Cette technique repose sur une propriété des interférences naissant entre deux ondes lors de leur passage dans un matériau photosensible. Ces interférences provoquent dans le matériau une série de transformations physiques et/ou chimiques. Fig. 2.12 – Ecriture et lecture sur un support holographique (II)[InPhase] L’avantage est que suivant l’angle des rayons utilisés, on peut superposer les informations, et y accéder de manière indépendante. Pour ce faire, on joue sur l’angle d’incidence du rayon de référence (Reference Beam). Par ce procédé, il pourrait être possible de créer des éléments de mémoire vive de 25 Go l’unité, des disques durs de 1 To (1000 Go) par plateau, ou encore des data warehouse de 1 Po (1 000 000 Go). Dumont Renaud Support Compression et Stockage Structure de l’information 2.3 30 Ressources Articles : Runlength Limited Sequences, K.A.S. Immink, IEEE 1990 EFMPlus : The coding Format of the Multimedia Compact Disc, K.A.S. Immink, IEEE, 1995 Illustrations : – – – – EMC Annual Report 2000 DVD Forum, Jean-José Wanègue CST-Commission Supérieure Technique de l’image et du son In-Phase Technologies Ressources Internet : http://www.dataligence.com/ http://www.storagereview.com/ http://www.vulgarisation-informatique.com/graveur.php http://www.research.ibm.com/journal/rd/443/ashley.html http://www.optware.co.jp/english/ http://www.inphase-tech.com/ http://www.nmeinc.com/ Dumont Renaud Support Compression et Stockage