déduplication
Transcription
déduplication
déduplication Le b a ba 2 Sommaire 4 Le b a ba de la déduplication 6 Qu’est-ce que la déduplication ? 8 Méthodes de déduplication 10 Exemple de déduplication 3 12 Déduplication, reprise après incident et archivage 14 La déduplication pour tous les budgets 16 18 Quantum DXi4000 et vmPRO 4000 La déduplication pour tous les budgets Quantum NDX-8 et NDX-12 La déduplication pour tous les budgets Quantum RDX 4 Le b a ba de la déduplication La déduplication des données est une innovation technologique qui a transformé la façon dont les données sont protégées dans les entreprises de toutes tailles. Elle peut réduire le volume des données de sauvegarde jusqu’à 90 % et permet donc d’utiliser des périphériques de capacité inférieure, pour une sauvegarde sur disque moins onéreuse. Elle fait en outre fortement baisser le trafic réseau, ce qui favorise une réplication (copie des données) simple et économique vers les sites distants en vue d’une reprise après incident. ...réduire le volume des données de sauvegarde jusqu’à 90% 5 Au final, vous disposez d’une solution complète pour la sauvegarde et la reprise après incident qui permet de réaliser des économies, demande moins de temps de gestion, accélère et facilite la restauration des données. Les pages qui suivent décrivent le fonctionnement de la déduplication, la manière dont elle s’inscrit dans l’infrastructure existante de protection de vos données et son utilisation avec la réplication et la reprise après incident. Elles présentent également les quelques produits leaders du marché, à travers plusieurs gammes de prix, qui tirent parti de cette technologie. STOCKAGE PRIMAIRE Données dédupliquées SAUVEGARDE RÉPLICATION Données dédupliquées 6 Qu’est-ce que la déduplication ? La méthode de sauvegarde la moins efficace consiste à copier régulièrement les données des disques primaires sur des disques de sauvegarde. Pour économiser l’espace disque et donc réduire les coûts, vous pouvez choisir d’écraser les sauvegardes précédentes, mais si vous avez besoin d’une version antérieure d’un fichier (le fichier tel qu’il était avant que vous n’en supprimiez par inadvertance la partie la plus importante, par exemple), vous ne pourrez pas l’obtenir. Les logiciels de sauvegarde standard présentent un certain intérêt puisqu’ils ne sauvegardent que les nouveaux fichiers ou ceux qui ont changé depuis les sauvegardes précédentes (ce que l’on appelle la sauvegarde incrémentielle ou le stockage d’instances uniques). Ils peuvent cependant être tout aussi inefficaces car le seul changement d’un mot dans une phrase peut provoquer la sauvegarde de la totalité du document. La déduplication des données adopte une approche différente. Le logiciel examine le contenu des fichiers et ne stocke que les segments uniques, appelés blocs, qui ne sont pas encore sauvegardés. L’espace de stockage requis s’en trouve donc considérablement réduit par rapport aux processus de sauvegarde classiques. 7 Lorsque vous souhaitez récupérer le fichier sauvegardé tel qu’il se présentait à une date précise, le logiciel le reconstruit, en insérant toutes les modifications là où il le faut, et vous fournit la version demandée. Vous avez l’impression 5 copies du même fichier Données stockées Prenons l’exemple de cinq fichiers Powerpoint identiques stockés sur des ordinateurs différents. La déduplication identifiera le contenu commun et n’en sauvegardera qu’une copie. que le système a sauvegardé le fichier complet à chaque fois, mais, en réalité, il ne l’a fait qu’une fois et a simplement ajouté des éléments par la suite. Cette méthode permet d’économiser beaucoup d’espace disque. 5 fichiers avec des pages de titre différentes Données stockées Imaginez maintenant que chacun des cinq utilisateurs ait modifié la première page de la présentation pour y insérer son nom et sa fonction, par exemple. Le logiciel de déduplication examinera les éléments qui constituent chaque fichier et ne copiera que le contenu unique. 8 Méthodes de déduplication Il existe plusieurs approches de la déduplication, qu’il est possible de combiner de différentes façons. Déduplication logicielle Le logiciel de déduplication s’exécute sur des clients de sauvegarde ou sur des serveurs de médias. La déduplication logicielle réduit le trafic réseau mais peut accaparer les ressources système et cette solution est généralement moins rapide que les appliances matérielles dédiées. Déduplication reposant sur une appliance Les données de sauvegarde sont envoyées à une appliance dédiée, comme le DXi de Quantum, où s’effectue la déduplication à l’aide d’un matériel ainsi que d’un logiciel intégré, conçus pour optimiser ce processus. Cette méthode offre généralement de meilleures performances et n’augmente pas la charge des clients de sauvegarde ni celle des serveurs de médias. De plus, les appliances étant compatibles avec les applications de sauvegarde existantes, une entreprise peut choisir d’utiliser le même logiciel sur tous ses systèmes de sauvegarde, disques et bandes compris. 9 Déduplication basée sur les fichiers Les petits systèmes de déduplication travaillent en général sur chaque fichier séparément. Cette méthode nécessite peu de puissance de traitement mais ne permet pas d’économiser autant d’espace disque que les systèmes plus sophistiqués. Concernant l’exemple de la page 7, la déduplication basée sur les fichiers aurait stocké chaque présentation PowerPoint dans sa totalité, puisqu’elle est capable d’identifier plusieurs instances d’un fichier mais pas d’en analyser le contenu. Déduplication globale Des machines et des réseaux se partagent un pool d’éléments de fichiers. Les plus petits éléments de ce pool commun sont comparés et stockés une seule fois. Cette méthode est celle qui engendre le plus d’économies. 10 Exemple de déduplication Comme pour toute autre technologie, il est important de comprendre les arguments pouvant justifier l’adoption de la déduplication. La sauvegarde sur disque est séduisante, mais, avec la croissance exponentielle des données que nous constatons aujourd’hui, elle peut rapidement devenir très onéreuse. C’est là que la déduplication des données entre en scène. Un système qui vous évite de stocker plusieurs fois les mêmes données mais qui assure l’intégrité de ces données présente un énorme avantage. Vous réduisez vos coûts d’acquisition de matériel, mais aussi de gestion et d’entretien, et ce, éventuellement à l’échelle de plusieurs sites. Cet avantage est encore plus intéressant dans les environnements virtuels. Le taux de déduplication peut même atteindre 100:1 car les fichiers doublonnés, les machines clonées et les machines de test accroissent de façon notable le volume des données redondantes de l’infrastructure. 11 Exemple illustrant les avantages de la déduplication Prenons l’exemple d’une entreprise qui dispose au départ de 3 téraoctets de données et prévoit une croissance annuelle de 40% de ce volume. La direction exige des sauvegardes quotidiennes, la conservation des données les plus récentes pendant 30 jours et celle des sauvegardes mensuelles pendant trois ans. Au terme de ce cycle, la déduplication aura divisé par plus de huit l’espace disque requis... Sauvegardes mensuelles conservées 3 ans 1re année 2e année 3e année 3 4,2 5,9 Capacité disque utilisée, To (compression normale 2:1 lors de la sauvegarde) 5,6 17,1 42,5 Sauvegardes dédupliquées, To (2:1 pour première sauvegarde, 20:1 pour les suivantes) 2,1 3,2 4,8 Données à protéger, To (croissance annuelle de 40 %) ... la déduplication est un outil efficace afin de contrôler de la croissance des données et de faire des économies 12 Déduplication, reprise après incident et archivage Comme nous l’avons vu, la déduplication de vos données importantes rend le stockage des sauvegardes beaucoup plus économique. Cependant, aucun système de sauvegarde n’est complet sans le stockage hors site, qui peut combiner reprise après incident et archivage à long terme. Cette opération est généralement prise en charge par la réplication, qui envoie une copie des données de sauvegarde à un autre site via un réseau WAN, ou par le transport de médias amovibles comme des bandes ou des disques. Ces méthodes peuvent aussi être combinées, en fonction des besoins particuliers de l’entreprise. La réplication est la solution la plus pratique et la plus performante, puisqu’elle est souvent automatisée. Sa consommation de bande passante rendait son utilisation problématique, mais, avec l’arrivée de la déduplication, qui permet de n’envoyer qu’une petite fraction des données brutes, elle est devenue économique et largement répandue. Elle vous permet de disposer chaque jour d’une image hors site de vos données de sauvegarde. 13 Le disque amovible ou la bande est le média classique pour la reprise après incident et reste privilégié pour la rétention des données à long terme ou l’archivage. approche ne s’applique pas lorsque les données doivent être préservées sur le long terme afin de satisfaire les exigences réglementaires d’une administration par exemple. Dans ce cas, le média physique est acheminé régulièrement vers un autre site, une fois par semaine par exemple. À l’issue d’un laps de temps prédéterminé (le cycle de rotation), et quand un nombre suffisant de nouvelles copies ont été faites, le média est réacheminé vers le site d’origine et réutilisé. Cette La bande peut aussi avoir sa place dans la réplication, lorsque les données répliquées vers une baie de disques ou une appliance de protection des données sont transférées vers une librairie en vue d’un stockage à long terme peu onéreux. Ce processus aussi peut être automatisé. La réplication est l’option la plus pratique et la plus performante pour la reprise après incident 14 La déduplication pour tous les budgets Quantum DXi4000 et vmPRO 4000 Les appliances de sauvegarde des séries DXi4000 et vmPRO 4000 sont les produits les plus performants pour les petites et moyennes entreprises. Elles se caractérisent par une capacité native comprise entre 2 et 12 To, les modèles 4601 proposant une évolutivité à la demande qui permet de passer de 4 à 12 To simplement en activant une licence logicielle. Dotées d’architectures similaires, ces appliances combinent hautes performances et coût abordable. Elles sont faciles à installer et compatibles avec les principaux logiciels de sauvegarde du marché. Elles peuvent aussi être connectées à des appliances DXi de taille supérieure dans le datacenter, pour centraliser la protection des données des filiales et faciliter l’archivage sur les librairies. La série vmPRO 4000 constitue une solution complète pour la protection des données des machines virtuelles, avec un logiciel de sauvegarde et une capacité de stockage qui permet de conserver des mois de données. Le logiciel s’exécute sur sa propre appliance virtuelle, rendant inutiles les agents ou les serveurs physiques distincts, et propose en natif une vue de toutes les données de sauvegarde sous la forme d’un système de fichiers. 15 DXi4000 DXi4510 : capacité de stockage de 2 To DXi4601 : capacité évolutive de 4 à 12 To Le modèle DXi4601 propose l’évolutivité à la demande (ou Capacity On Demand :COD) qui permet d’augmenter la capacité de 4 à 12 To par simple activation d’une clé de licence, sans achat ni installation de matériel supplémentaire. Les performances peuvent atteindre 1,7 To/h, soit deux fois plus que ce que proposent les principaux concurrents. Réduction des besoins types d’espace disque de 90 % ou plus grâce à la déduplication. Intégration transparente aux principales applications de sauvegarde du marché, notamment NetBackup et Backup Exec. vmPRO 4000 vmPRO 4510 : capacité de stockage de 2 To vmPRO 4601 : capacité évolutive de 4 à 12 To. Le logiciel de sauvegarde vmPRO et l’appliance DXi4000 composent une solution de stockage tout-en-un, intégrée et optimisée pour les PME et les bureaux distants, à un prix abordable. La capacité de stockage du vmPRO 4601 peut passer de 4 à 12 To par simple activation d’une clé de licence, sans achat ni installation de matériel supplémentaire. Le logiciel vmPRO est une solution complète pour la protection des données, qui simplifie la gestion de la protection des données des machines virtuelles tout en améliorant les performances des sauvegardes et des restaurations. Méthode de sauvegarde reposant sur une appliance virtuelle, qui rend les serveurs supplémentaires et les agents inutiles. Le logiciel vmPRO réduit le trafic réseau et la charge de l’UC jusqu’à 75 %, améliorant ainsi les performances du système. 16 La déduplication pour tous les budgets Stockage NAS NDX-8 et NDX-12 de Quantum La gamme NDX d’appliances NAS de Quantum pour la sauvegarde, la reprise après incident et le stockage primaire répond à tous les besoins de stockage et de protection des données des petites et moyennes entreprises. Les appliances de protection des données NDX-8d et NDX12d utilisent la déduplication côté client pour stocker cinq fois plus de données que les appliances NAS sans déduplication, tout en réduisant le trafic réseau de 90 %. Les opérations sont gérées de façon centralisée via l’appliance NAS et il n’y a pas d’agents logiciels à installer sur les clients dont les données sont sauvegardées. Les appliances NDX-8d et NDX-12d sauvegardent les systèmes Windows, notamment les ordinateurs de bureau, les serveurs, les machines virtuelles, Exchange, SQL Server et SharePoint. Les appliances NAS NDX-8 et NDX-12 de Quantum sont conçues pour le stockage primaire, dotées de processeurs et d’une RAM offrant une puissance supérieure à celle des produits concurrents, et pourvues de disques durs haut de gamme ultrarapides offrant la fiabilité de la technologie RAID. Elles assurent un stockage professionnel adapté au budget des petites et moyennes entreprises. 17 NDX-8d et NDX-12d Appliance de protection des données avec déduplication Protection des données pendant deux ans ou plus et conservation d’un historique plus long qu’avec les bandes ou autres disques Contrôle de la croissance des données permettant jusqu’à 90 % de réduction du volume des données stockées et du trafic réseau grâce à la déduplication Gestion centralisée à partir de l’unité NAS par l’intermédiaire d’une interface simple et facile d’emploi Équipements pourvus en standard du logiciel de déduplication facile d’emploi DATASTOR Shield™ Sauvegarde sans agents – aucun logiciel à installer sur les clients Conçus pour les environnements Windows Stockage NAS NDX-8 et NDX-12 Stockage de qualité professionnelle pour les environnements en réseau Utilisable comme serveur de fichiers ou stockage en attachement direct iSCSI Processeur Intel double cœur i3 cadencé à 3,3 GHz, plus rapide et plus fiable, disques durs haut de gamme et 4 Go de RAM Compatibilité du système d’exploitation Windows Storage Server Disponible en configuration tour ou pour montage en rack 1U 18 La déduplication pour tous les budgets Quantum RDX Les systèmes de stockage avec disques amovibles RDX et RDX 8000 de Quantum sont des solutions d’entrée de gamme pour la protection des données des petites et moyennes entreprises. Ils combinent le meilleur du disque (accès et restaurations rapides) et de la bande (amovibilité pour la reprise après incident et processus de sauvegarde facile à utiliser). Le modèle RDX autonome à cartouche unique inclut un logiciel de sauvegarde très complet qui intègre la déduplication des données pour un seul serveur, alors que le modèle RDX 8000 est une librairie à huit emplacements qui peut être pourvue en option d’une version professionnelle du logiciel de sauvegarde, avec déduplication côté client sans agents pour minimiser le trafic réseau. De type plug-and-play l’un et l’autre, ces modèles seront prêts à l’emploi en quelques minutes. Acceptant des cartouches RDX standard et amovibles en plusieurs capacités interchangeables (actuellement, jusqu’à 1 To de capacité native par cartouche avant déduplication), les systèmes RDX permettent de stocker facilement les données hors site et leur capacité peut augmenter avec le volume des données. 19 RDX 8000 Librairie de disques à huit emplacements stockant jusqu’à 8 To – ressemble à un autoloader mais utilise des cartouches RDX amovibles Stockage des cartouches hors site pour la reprise après incident Disponible avec le logiciel de déduplication facile d’emploi DATASTOR Shield, réduisant ainsi des deux tiers le nombre de cartouches nécessaires (également disponible sans ce logiciel) Connectivité de réseau de stockage iSCSI simple à utiliser Évolutivité hors pair – accepte n’importe quelle cartouche RDX d’une capacité de 160 Go à 1 To – compatible avec les capacités futures ; possibilité d’augmenter instantanément la capacité sans achat de matériel supplémentaire 20 En savoir plus Pour en savoir plus sur la technologie de déduplication des données et sur la protection des données en général, consultez un revendeur compétent de votre région. Il pourra analyser vos besoins de sauvegarde et configurer le système le mieux adapté à votre entreprise. Pour plus de détails sur les produits de déduplication de Quantum mentionnés dans cette brochure, accédez au site www.quantum.com/fr et cliquez sur l’onglet Produits. 21 À propos de Quantum Quantum, spécialiste mondial incontesté de la protection des données et de la gestion des Big Data, offre des solutions de stockage spécialisées pour les environnements classiques, virtuels et Cloud. Plus de 50 000 entreprises de toutes tailles font confiance à Quantum pour les aider à optimiser la valeur de leurs données en les protégeant tout au long de leurs cycles de vie. Avec Quantum, les clients ont l’assurance de pouvoir s’adapter aux évolutions d’un monde en pleine mutation, en conservant plus de données plus longtemps pour se préparer à l’avenir tout en réduisant les coûts. Découvrez comment en visitant www.quantum.com/BeCertain. www.quantum.com/fr • +33.1.41.43.49.00 ©2012 Quantum Corporation. Tous droits réservés. Quantum, le logo Quantum, DXi, Scalar, StorNext et Vision sont des marques de Quantum Corporation et de ses filiales déposées aux États-Unis et dans d’autres pays. Toutes les autres marques appartiennent à leurs propriétaires respectifs. BE CERTAIN ST00899F-v01 Août 2012
Documents pareils
Série DXi6800
La série DXi6800 est constituée d’appliances de déduplication extensibles
destinées aux grandes entreprises recherchant une protection multisite et
multiniveau sûre et facile à gérer, pour une rest...
Série DR d`appliances de déduplication et de
Les appliances DR4300e, DR4300
et DR6300 utilisent les étagères
d’extension Dell PowerVault MD1400
afin d’augmenter la capacité de manière
flexible et fluide. La solution DR4300e
offre une capacité...