Étude de cas client Projet Hadoop chez SFR: Efficacité

Transcription

Étude de cas client Projet Hadoop chez SFR: Efficacité
Étude de cas client
Projet Hadoop chez SFR:
Efficacité accrue grâce au projet Hadoop
En tant qu’opérateur télécom majeur comptant plus de 21 millions de clients, SFR collecte quotidiennement
une quantité énorme de données. L’objectif du projet Hadoop chez SFR était en premier lieu de réduire
les coûts d’exploitation de ces données. Au fur et à mesure que le volume de données augmente, il est
de plus en plus difficile et coûteux de stocker et traiter les données. En utilisant de façon optimale le
cluster Hadoop et les outils puissants de tri et ETL de Syncsort, il est possible de limiter l’investissement
dans du nouveau hardware.
Un projet qui ne se termine jamais
SFR a décidé de lancer le projet Hadoop à la fin de 2013. Dans
une première phase, le choix s’est porté sur la distribution Hadoop
Cloudera et début 2014, il a été décidé de travailler avec DMX-h
de Syncsort pour loader et offloader des données à partir du
cluster Hadoop. SFR utilisait déjà l’outil ETL DMX de Syncsort pour
quatre autres projets, pour lesquels il avait fait ses preuves. Les
très bonnes performances de DMX-h de Syncsort ont ensuite pu
être démontrées dans le cadre du Proof of Concept pour le projet
Hadoop. “Nous avons toujours un nombre important de processus
batch volumineux à traiter en processus batch,” explique François
Nguyen, en charge de la division ‘Connaissance Client’ chez SFR.
“Cela implique que nous disposons d’une fenêtre de traitement
réduite. Nos engagements précédents avec Syncsort se sont
révélés très efficaces. Leurs capacités de tri n’ont pas d’équivalent
sur le marché, et nous sommes très heureux que Syncsort soit l’un
des véritables innovateurs sur le marché Hadoop. Leur mécanisme
de tri est incorporé à la distribution Hadoop que nous utilisons.
Au cours de l’été 2014, les premières sources de données ont
été loadées dans le cluster Hadoop, et davantage de sources
seront ajoutées toutes les deux ou trois semaines. “Il ne s’agit pas
d’un projet avec un horizon de données déterminé, nous allons
continuer à ajouter des sources de données en permanence,”
explique François Nguyen.
A l’heure actuelle, la division Connaissance Client gère une base
de donnéesassez large,qui n’arrête pas de croître. Les données
traitées dans le cadre du projet Hadoop sont principalement des
données structurées mais on y retrouve également des données
semi-structurées provenant de log.
En primeur
Le projet chez SFR est l’une des premières véritables expériences
Big Data et Hadoop sur le marché français. Le projet permettra
à SFR de réaliser des économies, grâce à la performance des
solutions implementées.
De premiers résultats rapides
L’une des premières réussites du projet a été la capacité à
concrétiser les premières étapes du projet dans le délai et le
budget prévus, ce qui est une prouesse compte tenu qu’il s’agit
de l’introduction de technologies de pointe. La mise en route aussi
rapide du projet est principalement due au fait que SFR n’a pas
dû perdre de temps en réglages et a pu commencer à utiliser
DMX-h pour manipuler les données sans devoir réaliser de codage
supplémentaire.
Les résultats seront évalués en permanence au fur et à mesure que
de nouvelles sources de données s’ajoutent au cluster Hadoop.
Les puissantes capacités de tri de Syncsort DMX-h ont également
permis d’optimiser les investissements dans du hardware
supplémentaire.
L’ENTREPRISE SYNCSORT
Syncsort propose des logiciels d’entreprise sûrs et performants. Solutions Big Data dans Hadoop ou applications
Big Iron sur mainframes : quels que soient les enjeux de nos clients, nous intervenons dans le monde entier pour
accélérer la collecte, le traitement et la diffusion de leurs données, tout en réduisant les coûts et les ressources
engagés. C’est pourquoi la majorité des entreprises du Fortune 100 font confiance à Syncsort. Utilisés dans plus de
85 pays, nos produits vous permettent de réaffecter vos charges coûteuses et inefficaces, d’accélérer les traitements
dans votre data warehouse et sur votre mainframe, et d’optimiser l’intégration de vos données au Cloud. Pour en
savoir plus, rendez-vous sur www.syncsort.fr
© 2015 Syncsort Incorporated. Tous droits réservés. Tous les autres noms de produits et marques cités appartiennent à leurs
propriétaires respectifs. DMXh-CS-001-0614FR
Syncsort, S.A.
Tour Egée, La Défense
17, avenue de l’Arche
92671 Courbevoie Cedex
Tél. : +33 (0)1 46 67 46 10
www.syncsort.fr