Étude de cas client Projet Hadoop chez SFR: Efficacité
Transcription
Étude de cas client Projet Hadoop chez SFR: Efficacité
Étude de cas client Projet Hadoop chez SFR: Efficacité accrue grâce au projet Hadoop En tant qu’opérateur télécom majeur comptant plus de 21 millions de clients, SFR collecte quotidiennement une quantité énorme de données. L’objectif du projet Hadoop chez SFR était en premier lieu de réduire les coûts d’exploitation de ces données. Au fur et à mesure que le volume de données augmente, il est de plus en plus difficile et coûteux de stocker et traiter les données. En utilisant de façon optimale le cluster Hadoop et les outils puissants de tri et ETL de Syncsort, il est possible de limiter l’investissement dans du nouveau hardware. Un projet qui ne se termine jamais SFR a décidé de lancer le projet Hadoop à la fin de 2013. Dans une première phase, le choix s’est porté sur la distribution Hadoop Cloudera et début 2014, il a été décidé de travailler avec DMX-h de Syncsort pour loader et offloader des données à partir du cluster Hadoop. SFR utilisait déjà l’outil ETL DMX de Syncsort pour quatre autres projets, pour lesquels il avait fait ses preuves. Les très bonnes performances de DMX-h de Syncsort ont ensuite pu être démontrées dans le cadre du Proof of Concept pour le projet Hadoop. “Nous avons toujours un nombre important de processus batch volumineux à traiter en processus batch,” explique François Nguyen, en charge de la division ‘Connaissance Client’ chez SFR. “Cela implique que nous disposons d’une fenêtre de traitement réduite. Nos engagements précédents avec Syncsort se sont révélés très efficaces. Leurs capacités de tri n’ont pas d’équivalent sur le marché, et nous sommes très heureux que Syncsort soit l’un des véritables innovateurs sur le marché Hadoop. Leur mécanisme de tri est incorporé à la distribution Hadoop que nous utilisons. Au cours de l’été 2014, les premières sources de données ont été loadées dans le cluster Hadoop, et davantage de sources seront ajoutées toutes les deux ou trois semaines. “Il ne s’agit pas d’un projet avec un horizon de données déterminé, nous allons continuer à ajouter des sources de données en permanence,” explique François Nguyen. A l’heure actuelle, la division Connaissance Client gère une base de donnéesassez large,qui n’arrête pas de croître. Les données traitées dans le cadre du projet Hadoop sont principalement des données structurées mais on y retrouve également des données semi-structurées provenant de log. En primeur Le projet chez SFR est l’une des premières véritables expériences Big Data et Hadoop sur le marché français. Le projet permettra à SFR de réaliser des économies, grâce à la performance des solutions implementées. De premiers résultats rapides L’une des premières réussites du projet a été la capacité à concrétiser les premières étapes du projet dans le délai et le budget prévus, ce qui est une prouesse compte tenu qu’il s’agit de l’introduction de technologies de pointe. La mise en route aussi rapide du projet est principalement due au fait que SFR n’a pas dû perdre de temps en réglages et a pu commencer à utiliser DMX-h pour manipuler les données sans devoir réaliser de codage supplémentaire. Les résultats seront évalués en permanence au fur et à mesure que de nouvelles sources de données s’ajoutent au cluster Hadoop. Les puissantes capacités de tri de Syncsort DMX-h ont également permis d’optimiser les investissements dans du hardware supplémentaire. L’ENTREPRISE SYNCSORT Syncsort propose des logiciels d’entreprise sûrs et performants. Solutions Big Data dans Hadoop ou applications Big Iron sur mainframes : quels que soient les enjeux de nos clients, nous intervenons dans le monde entier pour accélérer la collecte, le traitement et la diffusion de leurs données, tout en réduisant les coûts et les ressources engagés. C’est pourquoi la majorité des entreprises du Fortune 100 font confiance à Syncsort. Utilisés dans plus de 85 pays, nos produits vous permettent de réaffecter vos charges coûteuses et inefficaces, d’accélérer les traitements dans votre data warehouse et sur votre mainframe, et d’optimiser l’intégration de vos données au Cloud. Pour en savoir plus, rendez-vous sur www.syncsort.fr © 2015 Syncsort Incorporated. Tous droits réservés. Tous les autres noms de produits et marques cités appartiennent à leurs propriétaires respectifs. DMXh-CS-001-0614FR Syncsort, S.A. Tour Egée, La Défense 17, avenue de l’Arche 92671 Courbevoie Cedex Tél. : +33 (0)1 46 67 46 10 www.syncsort.fr