Time Navigator d`Atempo - Flash informatique
Transcription
Time Navigator d`Atempo - Flash informatique
Time Navigator d’Atempo Sommaire FI 5/2008 Stephane.Ecuyer@epfl.ch, Faculté IC Introduction À l’heure actuelle avec la croissance quasi exponentielle des données informatiques stockées et du nombre de machines toutes catégories confondues, c’est un challenge de tous les jours que d’assurer l’accès à ces données et le fonctionnement de l’informatique de l’entreprise. Tout service informatique a beau mettre, en fonction de ses moyens, les ressources nécessaires pour assurer cette fonctionnalité, il n’est jamais à l’abri d’une perte de données pouvant amener à de fâcheuses conséquences pour le ou les utilisateurs concernés. Il devient dès lors évident que la mise en place d’outils de sauvegarde est capitale afin de pouvoir assurer l’intégrité et la pérennité de ces précieuses informations, et ce, quelle que soit la stratégie informatique mise en place. J’entends déjà d’ici les cris, Mais il enfonce des portes ouvertes ! Et bien, détrompez-vous... En général, tout système d’exploitation comporte des outils simples permettant la sauvegarde de données (par exemple tar, cpio, dump, etc.). Ceux-ci offrent aux utilisateurs la possibilité de sécuriser leurs données et le système d’un ou de plusieurs postes de travail. Par contre dans un environnement d’entreprise comportant un grand nombre de machines et d’importantes quantités de données, il devient vite impossible d’assurer une protection correcte avec ces outils d’où la nécessité de la mise en place d’une application de sauvegarde offrant l’outillage nécessaire à l’implémentation de plans de sauvegarde dans le cadre de la stratégie globale de protection des données. Je ne pense pas trop m’avancer en disant que pour tout service informatique l’application de sauvegarde des données est le logiciel de confiance par excellence. C’est le Joker qui permet en cas de désastre, qu’il soit mineur ou majeur, de remettre la boutique sur pied avec le minimum d’impact pour le ou les utilisateurs, pour autant que les bonnes stratégies soient en place et validées. En mars 2007, suite à une demande de restauration partielle de projets d’un utilisateur se trouvant hors de la fenêtre de snapshot du serveur NAS, il s’est avéré impossible d’effectuer cette opération avec la solution de sauvegarde en exploitation à cause d’une limitation du module NDMP (Network Data Management Protocol) de restauration. Se retrouver avec des données piégées sur bandes est une situation des plus désagréables, réduisant du même coup la stratégie de sauvegarde mise en place et la confiance dans la solution. suite en page 3 1 Time Navigator d’Atempo Stéphane Ecuyer 2 Des chiffres et des lettres, deuxième saison Martin Ouwehand 5 Remplacement de la solution de sauvegarde EMC Networker par Time Navigator Krassimir Todorov 6 Programme des cours 11 Quarante ans d’expérience dans le supercomputing Jean-Claude Berney 12 Concours de la meilleure nouvelle 12 Appel aux articles pour le FI – spécial été Prochaines parutions no 6 SP 7 8 9 10 délai parution rédaction 05.06.08 26.06.08 28.08.08 25.09.08 30.10.08 27.11.08 24.06.08 26.08.08 16.09.08 14.10.08 18.11.08 16.12.08 FI 5 – 27 mai 2008 – page 1 Des chiffres et des lettres, deuxième saison 10 fois plus nombreux: les messages internes sont donc en moyenne près de 6 fois plus gros que les messages externes. Un autre facteur contribuant à cette différence est le type d’utilisation de la messagerie électronique: en interne, on hésitera moins à se communiquer des versions provisoires de gros documents en ébauche. Ces chiffres, de l’ordre de la dizaine de Gigaoctets, sont à comparer avec le trafic journalier global de l’EPFL, qui se comptera bientôt en milliers de Gigaoctets (voir mathe.epfl. ch/). On peut donc mentionner, si on considère sa part du trafic global, que le spam n’entraîne sans doute pas comme on l’entend parfois dire des coûts importants, qui se situent plutôt dans son filtrage, automatique (MailCleaner) ou manuel (le temps consacré par chacun d’entre nous pour s’en débarrasser). Conclusions En comparant ces chiffres avec ceux d’il y a trois ans, on peut dégager deux tendances bien marquées. En premier lieu, et ce n’est pas une surprise, l’accroissement très important du spam: alors que le nombre de messages finaux et nettoyés du spam arrivant dans les boîtes aux lettres des membres de l’EPFL n’a que peu augmenté (8 messages par personne et par jour en moyenne en 2005, 11 en 2008) le nombre des messages externes entrants a été multiplié par 7 et le nombre de messages rejetés comme spam par MailCleaner a quant à lui été multiplié par 9 ! D’autre part, on constate aussi une forte croissance du nombre de messages envoyés par l’EPFL vers des adresses externes, puisqu’il a été multiplié par 4. n Time Navigator d’Atempo suite de la première page Ayant suivi quelques mois auparavant une intéressante présentation de la solution de sauvegarde Time Navigator (TiNa) de la société Atempo, j’ai repris contact pour la mise en place d’un pilote. J’en profite pour remercier Nicolas Levêque d’Atempo ainsi que l'équipe Storage de Télécom Systems, pour leur patience et leurs conseils judicieux pendant le pilote et la mise en exploitation de TiNa. Ce pilote a été mis en place fin avril 2007 pour une période de 6 mois permettant ainsi de tester et de valider la solution amenant le DIT à faire l’acquisition d’une licence site dont les détails et la durée se trouvent dans l’encart en page 5 de Krassimir Todorov, DIT-SB. Time Navigator d’Atempo Quelques dates En 1991 création de Time Navigator (TiNa) par la société française Quadratec qui devient en 2001 la société franco-américaine Atempo (pour accélérer sa croissance et sa visibilité au niveau international). En 2006 Atempo prend le contrôle de la société Storeactive et de sa technologie CDP (Continuous Data Protection), donnant le produit Live Backup, solution de sauvegarde au fil de l’eau pour machines de bureau et portables (sous Windows et MacOS X). Mi-2007 l’offre s’étoffe avec la sortie d’Atempo Digital Archive (ADA), solution indépendante d’archivage électronique de fichiers et de documents conforme au modèle de référence OAIS (Open Archival Information System). 2008. De son côté, TiNa continue son évolution avec la sortie début mars de cette année de la version 4.2 (qui amène un certain nombre d’améliorations au niveau de l’installation, de l’administration et des performances). L’apport majeur de cette nouvelle version est l’introduction de la technologie CDP dans TiNa, pour le moment dans le module MS-Exchange. Les concepts de TiNa en quelques points Une description détaillée de ce logiciel serait vite fastidieuse. Je me contenterai donc de disserter sur certains points clés. z TiNa offre une solution de sauvegarde multi-environnement (DAS, NAS, SAN) et multi-plateformes intégrant le support des technologies de snapshots (NetApp, Microsoft), de sauvegarde à chaud de bases de données (par ex. Oracle 10g) et applications (par ex. SAP/R3). z TiNa est développé dans le sens d’optimiser la restauration des données. Par défaut pas de multiplexage des flux de sauvegardes, mais une possibilité d’activer un macromultiplexage (bloc de 256MB) dans le cas de sauvegarde simultanée de nombreux clients. Dans le même sens, la technologie de sauvegarde synthétique permettant de recréer une sauvegarde totale à partir des incrémentales de manière hors ligne permet de réduire les fenêtres de sauvegarde et d’optimiser la restauration. z L’utilisateur a une vision globale du cycle de vie de ses données indépendante de la structure de sauvegarde implémentée (snapshot, D2D, D2T, D2D2T) et de la localisation physique de celles-ci. z La notion de Navigation Temporelle qui permet à tout instant à l’utilisateur de se déplacer dans le passé de ses données et de visualiser l’état de celles-ci à la date de son choix. L’association d’une profondeur de champ permet une recherche simple et rapide des données perdues ou supprimées (icônes hachurées). z Un outil de test de restauration locale au serveur ou jusqu’au client permettant en tout temps d’effectuer une validation des données sur les médias et de faire une estimation de temps de restauration. z Possibilité de création de librairie virtuelle, VLS (maximum 6000 cartouches/256 lecteurs) sur disques. z Possibilité de mise en place des stratégies multiples pour une même plate-forme. z Outils graphiques de supervision facilitant le suivi et l’optimisation des sauvegardes. z Administration pouvant être centralisée ou décentralisée via une gestion des droits d’accès des utilisateurs FI 5 – 27 mai 2008 – page 3 Time Navigator d’Atempo ou groupes d’utilisateurs aux différentes ressources et fonctionnalités. z Une fonction d’archivage permettant une gestion facilitée de la conservation des données sur le long terme. z La possibilité d’encryption des données sur le média et à travers le réseau, y compris au travers de firewall. z Enregistrement des données possibles sous différents formats (format TiNa permettant la compression et l’encodage, tar, cpio, raw, sidf ). La commande tina_cart permettant de relire des cartouches au format TiNa sans que Time Navigator ne soit installé sur la machine. Pour les intéressés, vous pouvez trouver une description plus détaillée des concepts de TiNa dans le document suivant: www.supinfo-projects.com/fr/2004/time_navigator/. z Il est souhaitable de prévoir un pool de cartouches spécifique à la sauvegarde du catalogue, ainsi que d’activer la réplication de celui-ci sur disque. De même pour le fichier boot_catalog avec en plus une copie par email. Ceci afin de mettre tous les atouts de son côté en cas d’incident sur le catalogue nécessitant sa restauration. z Prendre le temps de réfléchir à la politique et aux stratégies de sauvegarde à mettre en place. Des questions du type: En combien temps faut-il être à nouveau opérationnel en cas d’incident majeur? quelle profondeur de données est-il acceptable de perdre dans le cas précédent? quelle profondeur faut-il assurer en fonction de … ? que pourrait-il être nécessaire d’archiver et sur quelle durée? la gestion est-elle centralisée ou pas? … peuvent fortement influencer la configuration du serveur et du service de sauvegarde. Points importants z Le catalogue cœur du serveur contient toutes les informations nécessaires à l’exécution de Time Navigator, telle que la configuration des plates-formes, lecteurs, robots, utilisateurs, cartouches, classes, stratégies, etc., ainsi que la description et la localisation de tous les fichiers sauvegardés. Sa taille maximale est actuellement de 32GB (étendu à 128 GB en version 4.2) ce qui peut devenir critique avec une infrastructure de grande taille. Par contre, il est tout à fait possible de configurer plusieurs catalogues travaillant simultanément sur un même serveur. z Les flux de données de et vers les lecteurs de bandes sont régulés à travers du cache en mémoire (64MB min), une taille de 96MB/lecteur est recommandée. z Les opérations NDMP sur de gros volumes sont gourmandes en mémoire, dans ce cas un minimum de 8GB serait indispensable pour éviter au processus de devoir swaper. L’infrastructure de sauvegarde au SIFAC L’infrastructure physique de sauvegarde composée d’un serveur SunFire V240 (bi-proc, mémoire 10GB, disques en miroir 1x72GB + 1x146GB, GigaBit Ethernet) sous Solaris et d’une librairie Overland NEO 4100 (2x SDLT320, 2xSDLT600, 52 slots) avec carte de partition et connectée en SCSI-LVD. La mise en place du pilote TiNa de mai à octobre 2007 a été faite sur cette machine en parallèle du logiciel de sauvegarde (Networker) en exploitation, par le partage de la librairie, l’attribution des 2 lecteurs SDLT600 et de 26 slots. La première priorité était de tester et valider le serveur et le module NDMP nécessaire à la consolidation en cas de désastre des 2 volumes SnapVault (backup sur disque du L’interface d’administration FI 5 – 27 mai 2008 – page 4 Time Navigator d’Atempo L’interface de restauration Remplacement de la solution de sauvegarde EMC Networker par Time Navigator Krassimir.Todorov@epfl.ch, Domaine IT En octobre 2007, après six mois de tests à grande échelle à la Faculté IC, le DIT a acquis des licences pour la solution de sauvegarde ATEMPO Time Navigator. Pendant de longues années deux solutions principales de sauvegarde centralisées ont été proposées et financées par le DIT: NetBackup de Veritas et Networker de EMC (ex Legato). Avec le temps, la solution EMC Networker a commencé à ne plus correspondre à nos besoins. Les Services généraux Informatique de la Faculté IC ont donc évalué et proposé ATEMPO Time Navigator (TiNa) de la société Atempo (http:// www.atempo.com/). Par rapport à EMC Networker, la solution ATEMPO Time Navigator est plus intuitive et bien plus fonctionnelle. Tous les détails techniques sont donnés dans l’article de Stéphane Ecuyer. En outre, cerise sur le gâteau, les conditions négociées et obtenues par le DIT jusqu’en octobre 2012 pour son utilisation et support sont financièrement très intéressantes. Il a été donc décidé de remplacer EMC Networker par ATEMPO Time Navigator. Le but est de proposer comme par le passé deux solutions de sauvegardes. Pour résumer nos conditions d’utilisation, le contrat nous permet le déploiement illimité de toutes les licences standards ATEMPO Time Navigator, excepté les suivantes, qui ne sont pas utiles pour l’EPFL: z Time Navigator Agent for VMS, z Time Navigator Agent for Netware, z Time Navigator Agent for IBM iSeries, z Time Navigator for Terradata, z Time Navigator for Informix. À la différence d’EMC Networker ou Veritas NetBackup, avec nos conditions, tous les logiciels standards ATEMPO Time Navigator pour serveurs et clients peuvent être installés sur un nombre illimité de machines à l’EPFL. Les quantités de données sauvegardées par TiNa sont aussi illimitées. Vous pouvez donc l’installer et l’utiliser partout où vous rencontrez ce besoin. TiNa peut même être utilisé pour des installations de plus petite taille, sauvegardées à ce jour avec Veritas BackupExec, en économisant ainsi les frais d’achat et de support de ce dernier. Pour garantir la migration en douceur vers ATEMPO Time Navigator, le support EMC Networker pour toute l’année 2008 est financé encore en central par le DIT. Passé ce délai, les unités désirant rester sur EMC Networker devront prendre son support sur leur propre budget. Pour vous informer sur ATEMPO Time Navigator, une présentation faite par Stéphane Ecuyer est prévue à la salle de conférence du DIT le jeudi 12 juin 2008 à 10h15. Tous les collaborateurs intéressés sont cordialement invités.n FI 5 – 27 mai 2008 – page 5 Time Navigator d’Atempo cluster NAS NetApp de la Faculté, d’environ 4TB chacun et respectivement 24 et 10 millions de fichiers) et des autres volumes standard du NearStore NetApp. Ce module a la particularité d’offrir 3 niveaux de granularité (FILE, DIR et CLASS) définissant le niveau et la quantité d’objets transmis et maintenus dans le catalogue. Suite à différents essais effectués, la granularité DIR a été retenue pour la consolidation des volumes SnapVault offrant une finesse de restauration suffisante tout en maintenant un catalogue de taille raisonnable. Les autres volumes étant en mode FILE. Cette première phase en route, le pilote continua avec le test de la partie cliente sur les différentes plates-formes en exploitation dans le service y compris la sauvegarde à chaud de la base de données Oracle 10g dédiée à l’enseignement. Durant cette phase pilote, la découverte bien que partielle de ce logiciel a été grandement facilitée par la création d’une librairie virtuelle VLS de quelques dizaines de GB sur disque, permettant ainsi de pouvoir facilement et rapidement tester différentes configurations au niveau des stratégies, du filtrage, de la sauvegarde totale synthétique et diverses autres fonctionnalités liées à l’environnement à sauvegarder. Cette VLS, bien que prévue à d’autres fins, a été un outil de tests précieux. La gestion des flux de données à travers le cache offre une utilisation des plus optimale des lecteurs de bandes, et ce, déjà sans l’activation du macro-multiplexage. Lors d’un travail de restauration, celui-ci étant prioritaire sur les sessions de sauvegardes et si plus d’un lecteur est disponible, la session sera parallélisée permettant une restauration plus rapide. La mise en exploitation définitive a été planifiée et mise en route en février 2008 avec une réinstallation complète du serveur avec un catalogue neuf, tout en conservant en parallèle le catalogue du pilote comme référence de certaines configurations clientes. L’installation de l’ensemble du logiciel (serveur, nœuds de stockage, NDMP Tape Server, client) se fait à travers un installeur unique de très bonne facture, associé à une documentation riche et claire disponible en français et en anglais, qui permet un déploiement rapide et aisé. La politique de sauvegarde en place dans le service ne comportant pas d’archivage à long terme de données utilisateurs (sous la responsabilité des unités), le choix a été fait de ne transférer aucune donnée et de simplement passer les clients dans Time Navigator tout en conservant jusqu’à leur échéance (6 mois pour les systèmes et 12 mois pour les données utilisateurs) les bandes faîtes avec Networker. La licence de site nous donne droit à l’accès aux services de maintenance d’Atempo qui comprennent un site internet (support.atempo.com) ainsi que l’accès au centre européen d’assistance par téléphone ou email, ce du lundi au vendredi de 9 à 18 heures. Les demandes de services faites aussi bien pendant le pilote, qu’ensuite ont chaque fois été traitées avec diligence et compétence dans le cadre de notre niveau de support contractuel. Début 2008, Time Navigator a également été mis en exploitation au service informatique de la Faculté SV avec un serveur sous Windows 2003 Server gérant 2 librairies de bandes dont l’une directement attachée au NearStore du service de fichiers NAS de cette Faculté. Conclusion L’importance de nos infrastructures informatiques et surtout des données que nous y confions est telle, qu’aujourd’hui la protection de cet ensemble constitue un élément essentiel dans le bon fonctionnement de nos activités. La mise en place d’une solution de sauvegarde n’est pas une opération innocente, elle doit pouvoir répondre à vos besoins de protection de données actuels tout en ayant les capacités de s’adapter à l’évolution de vos infrastructures, et ce, pour de nombreuses années. Que votre infrastructure soit relativement modeste ou bien plus conséquente, mais de toute manière toujours en évolution, Time Navigator de par sa flexibilité et ses fonctionnalités répondra à vos attentes de protection de données, vous permettant de dormir sur vos deux oreilles.n Formation Programme des cours organisés par le Domaine IT de l’EPFL Renseignements (les matins des lu, ma & ve) Daniele.Gonzalez@epfl.ch ✆ 021/69 353 14 Fax: 021/69 322 20 Ces cours sont ouverts à tous, membres ou non de l’EPFL. Pour le personnel de l’EPFL, le DIT se charge des frais de cours. Les descriptifs des cours sont sur Internet: dit.epfl.ch/formation Vous pouvez nous atteindre à l’adresse: cours.dit@epfl.ch Renseignements (tous les matins) Josiane.Scalfo@epfl.ch ✆ 021/69 322 44 Fax: 021/69 322 20 CONDITIONS D’INSCRIPTION En cas d’empêchement à suivre le(s) cours, l’élève avertira le Domaine IT au minimum une semaine à l’avance (sauf cas exceptionnel), faute de quoi le DIT se réserve le droit de facturer à son unité les frais occasionnés pour le cours. Une confirmation parviendra à l’élève avant le(s) cours. S’il est déjà complet, l’élève sera informé de suite et son nom placé en liste d’attente. Dès qu’un cours identique sera fixé, il recevra un courriel l’informant des nouvelles dates. Le DIT se réserve le droit d’annuler un cours si le nombre minimum de 4 participants n’est pas atteint ou pour des raisons indépendantes de sa volonté. Aucune compensation ne sera due par le DIT. FI 5 – 27 mai 2008 – page 6