Restituer, Analyser et Piloter : Evaluer les opportunits Open Source

Transcription

Restituer, Analyser et Piloter : Evaluer les opportunits Open Source
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
RESTITUER, ANALYSER ET PILOTER : EVALUER LES
OPPORTUNITES OPEN SOURCE
_________
Livre Blanc
_________
SSLL du groupe UMANIS
Ce document est sous licence GNU Free Documentation Licence.
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
SOMMAIRE
1
OBJECTIFS DU DOCUMENT ......................................................................................................... 1
2
OPENBIZZ – QUI SOMMES NOUS ? ............................................................................................. 2
3
INTRODUCTION .............................................................................................................................. 3
3.1
Rappel des principales briques fonctionnelles du SI décisionnel ........................................ 3
3.1.1
Restitution.............................................................................................................................. 3
3.1.2
Analyse .................................................................................................................................. 4
3.1.3
Pilotage .................................................................................................................................. 5
3.2
Les approches décisionnelles BI OpenSource ....................................................................... 5
3.2.1
Les solutions spécifiques ...................................................................................................... 5
3.2.2
Les suites BI .......................................................................................................................... 5
3.3
4
Guide de lecture du document .................................................................................................. 6
LES SOLUTIONS SPECIFIQUES DE RESTITUTION .................................................................... 8
4.1
Rapports statiques ou dynamiques.......................................................................................... 8
4.1.1
iReport – JasperReport ....................................................................................................... 10
4.1.2
BIRT .................................................................................................................................... 15
4.1.3
Synthèse des outils de restitution........................................................................................ 19
4.2
5
5.1
Rapports Ad hoc ....................................................................................................................... 21
LES SOLUTIONS SPECIFIQUES D’ANALYSE MULTIDIMENSIONNELLE ............................... 24
Définitions ................................................................................................................................. 24
5.2
La solution MONDRIAN ............................................................................................................ 27
5.2.1
Mise en œuvre du serveur .................................................................................................. 27
5.2.2
Outils de design du fichier « schema XML » ....................................................................... 29
5.2.3
Outillage d’interrogation et de restitution ............................................................................. 35
5.2.4
JRubik .................................................................................................................................. 37
5.2.5
FreeAnalysis ........................................................................................................................ 39
5.3
La solution PALO...................................................................................................................... 41
5.3.1
Roadmap, évolutions futures ............................................................................................... 42
5.3.2
Mise en œuvre du serveur .................................................................................................. 42
5.3.3
Outillage d’interrogation et de simulation ............................................................................ 44
5.4
6
Synthèse des cubes OLAP ...................................................................................................... 49
LES SOLUTIONS SPECIFIQUES DE PILOTAGE........................................................................ 51
6.1
MarvelIT ..................................................................................................................................... 52
6.1.1
« Roadmap », évolutions futures......................................................................................... 53
6.1.2
Outils disponibles dans la plateforme.................................................................................. 53
6.2
OpenI .......................................................................................................................................... 54
6.2.1
Outils disponibles dans la plateforme.................................................................................. 56
6.3
7
Synthèse des tableaux de bord............................................................................................... 57
LES SUITES BI OPENSOURCE - INDUSTRIALISER LES SID .................................................. 58
7.1
La suite Pentaho ....................................................................................................................... 59
7.1.1
Intégration dans un portail ................................................................................................... 60
7.1.2
Gestion des accès et des utilisateurs .................................................................................. 60
Ce document est sous licence GNU Free Documentation Licence.
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
7.1.3
7.1.4
7.1.5
7.1.6
7.1.7
Outillage dédié..................................................................................................................... 60
Rapports « ad hoc » ............................................................................................................ 65
Outils disponibles dans la plateforme.................................................................................. 67
Outils complémentaires ....................................................................................................... 67
« Roadmap », évolutions futures......................................................................................... 68
7.2
La suite SpagoBI....................................................................................................................... 69
7.2.1
Portail .................................................................................................................................. 70
7.2.2
Gestion des accès et des utilisateurs .................................................................................. 70
7.2.3
Outillage dédié..................................................................................................................... 70
7.2.4
Outils disponibles dans la plateforme.................................................................................. 73
7.2.5
« Roadmap », évolutions futures......................................................................................... 73
7.3
La suite Jasper Server ............................................................................................................. 74
7.3.1
Portail .................................................................................................................................. 75
7.3.2
Gestion des accès et des utilisateurs .................................................................................. 75
7.3.3
Outillage dédié..................................................................................................................... 75
7.3.4
Outils disponibles dans la plateforme.................................................................................. 76
7.3.5
Outils complémentaires ....................................................................................................... 76
7.3.6
« Roadmap », évolutions futures......................................................................................... 76
7.4
OpenReports ............................................................................................................................. 77
7.4.1
Gestion des accès et des utilisateurs .................................................................................. 78
7.4.2
Outils disponibles dans la plateforme.................................................................................. 78
7.4.3
« Roadmap » et évolutions futures...................................................................................... 78
7.5
La suite Vanilla 1.2 (BPM Conseil) .......................................................................................... 79
7.5.1
Portail .................................................................................................................................. 80
7.5.2
Gestion des accès et des utilisateurs .................................................................................. 80
7.5.3
Outillage dédié..................................................................................................................... 80
7.5.4
Outils disponibles dans la plateforme.................................................................................. 91
7.5.5
« Roadmap », évolutions futures......................................................................................... 91
7.6
Synthèse des plateformes ....................................................................................................... 92
8
L’INTEGRATION DES COMPOSANTS OPEN SOURCE ............................................................ 95
9
POUR CONCLURE… .................................................................................................................... 96
Ce document est sous licence GNU Free Documentation Licence.
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
1 OBJECTIFS DU DOCUMENT
Ce livre blanc intitulé « Restituer, Analyser et Piloter : Evaluer les opportunités Open Source » traite
au sein de la chaîne décisionnelle des aspects de reporting, analyse, pilotage et distribution de
l’information.
Nous avons souhaité y orienter la thématique plutôt que d’aborder de manière large mais superficielle
l’ensemble des aspects relevant de la BI.
Ce livre blanc ne traitera donc des autres aspects importants de la chaîne décisionnelle, à savoir les
ETL et base de données. Ceux-ci relevant plus des moyens que des usages.
Il ne traite pas non plus du Datamining pour deux raisons : c’est une étape complémentaire dans la
business intelligence qui n’interpelle pas à ce jour tous les secteurs d’activité et ce sujet mérite à lui
seul une livre blanc dédié.
Quant au processus d’élaboration budgétaire, qui s’apparente à une discipline de la business
intelligence tout en étant au cœur de l’activité opérationnelle, il n’est pas abordé en tant que tel mais
mis en avant sur une des solution OLAP que nous présentons.
Ce livre blanc abordera dans des chapitres dédiés chaque problématique (restitution, analyse,
pilotage et industrialisation) sous l’angle de la MOE (installation, conception, production et
exploitation) et sous l’angle MOA (usages).
Nous y présenterons le panel des outils disponibles au moment de la rédaction. Outils que nous
avons eu l’occasion d’intégrer pour le compte de nos clients ou pour lesquels nous avons complété
notre savoir faire en procédant à des bench sur nos plates formes, avec des environnements de
données significatifs.
C’est pourquoi tous les outils disponibles ne sont pas décrits, certains d’entre eux ne nous semblant
pas capables d’assurer à court ou moyen terme, les besoins qu’ils sont censés adresser. Certains ne
nous étant pas encore suffisamment familier non plus !
Nous présentons en toute objectivité, l’ensemble de notre analyse sur les outils BI Open Source dans
les quelques pages qui suivent.
Bonne lecture !
Ce document est sous licence GNU Free Documentation Licence.
Page 1/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
2 OPENBIZZ – QUI SOMMES NOUS ?
OpenBizz est la Société de Services en Logiciels Libres (SSLL) du groupe UMANIS.
Notre mission est de proposer aux entreprises une alternative logicielle forte en proposant l’intégration
de composants open source dans leur SI, des couches infrastructure (OS, messagerie, LDAP)
jusqu’au couches métiers (BI, CRM, ERP, SOA, GED, ECM, portail collaboratif...).
Nous accompagnons nos clients dans leur réflexion open source, qu’elle relève d’une démarche de
maîtrise des coûts ou d’une volonté d’assurer efficacement l’interopérabilité des composants du SI.
Créé en 1991, Umanis est une société de conseil et d’ingénierie spécialisée en Business Intelligence,
Gestion de la Relation Client (CRM) et en E-Business. Umanis, un des leaders français dans ces
domaines, accompagne ses clients sur la globalité de leurs projets informatiques : conseils,
réalisation, intégration, Tierce Maintenance Applicative et formation
En 2007, le Groupe Umanis a réalisé un Chiffre d’Affaires de 60 millions d’Euros et compte parmi ses
400 clients actifs des grands comptes internationaux, nationaux et régionaux. Avec près de 1000
collaborateurs, Umanis est implanté à Aix en Provence, Lille, Lyon, Metz, Nantes, Paris, Pau,
Toulouse, Tours. Reconnu pour son expertise technologique et fonctionnelle, le Groupe Umanis est
partenaire des plus grands éditeurs de logiciels du marché.
www.openbizz.fr
www.groupeumanis.com
Ce document est sous licence GNU Free Documentation Licence.
Page 2/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
3 INTRODUCTION
3.1
RAPPEL DES PRINCIPALES BRIQUES FONCTIONNELLES DU SI DECISIONNEL
Le thème « Consommer, Analyser et Piloter » est en correspondance avec les pratiques actuelles de
la business intelligence. Ces trois notions correspondent à des usages qui se veulent différent de par
la nature des acteurs et de leur responsabilité dans le dispositif d’entreprise.
Quand on examine les services décisionnels impliqués dans les entreprises, ceux-ci sont déterminés
sous cette triple approche :
3.1.1 Restitution
De plus en plus intégrée dans les dispositifs métiers opérationnels, la consommation d’information
« business intelligence » concerne un large scope d’utilisateurs au sein des entreprises. Basée
directement sur les outils de production ou en aval d’une chaîne décisionnelle (nous de traitons pas ici
des apports de la chaîne décisionnelle ni des alternatives existantes), le besoin reste le même :
Disposer d’informations chiffrées sur son activité, sur un pas temporel. Que ce soit sur des indicateurs
de type flux (volume entre deux dates) ou de type stock (volume à date).
Ces usages s’inscrivent dans un pilotage fin et industrialisé de l’activité rendu nécessaire par
l’envergure de l’activité, la tension de la concurrence ou encore la rationalisation des ressources
disponibles pour maximiser la profitabilité. En cela ils concernent une grande proportion des
personnels de l’entreprise et à tous les niveaux de la chaîne de responsabilité.
Il est commun de distinguer trois modes de restitution, matérialisés par des rapports aux nuances
suivantes :
Rapport statique : il s’agit d’un rapport dont la structure est figée tant en termes de présentation que
du périmètre des données présentées. Il présente l’avantage d’être généré en dehors du temps de
travail de l’utilisateur et d’être consommable instantanément.
Par exemple, l’acheteur logistique d’une plateforme de commerce voudra disposer de manière
hebdomadaire d’un rapport présentant l’évolution de la qualité de service de ses prestataires
logistiques (capacité à délivrer la quantité dans les délais et la qualité attendue) afin de peser sur les
négociations futures ou établir les pénalités.
Rapport dynamique : il s’agit d’un rapport ayant une structure de présentation semi statique au sein
duquel le périmètre des données peut varier. Cela en offrant à l’utilisateur final la possibilité de choisir
les valeurs de paramètres dynamiques intégrés dans le rapport. Cela présente l’avantage indéniable
de disposer d’une grande amplitude sur les rapports finaux puisque à partir d’une même structure de
rapport on pourra par exemple aussi bien générer un rapport de comparaison annuelle qu’un rapport
de comparaison trimestrielle. La notion de paramètre implique cependant d’interroger la BDD ce qui
dégrade l’instantanéité.
Par exemple, un responsable commercial régional travaillant pour une société de service en
recrutement voudra consulter un rapport d’alerte de consommation (nb d’entreprises clientes n’ayant
pas consommé depuis X mois telles offres) en sélectionnant un ou plusieurs codes d’activité INSEE et
tout ou partie des offres de service proposées par sa société.
Ce document est sous licence GNU Free Documentation Licence.
Page 3/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
Rapport Ad hoc : il s’agit d’un rapport librement aménagé par l’utilisateur final. Il aménage les données
qui l’intéressent dans une structure type tableau ou graphique en définissant le périmètre de
consultation de ses axes et indicateurs. Cette approche nécessite que soit mis en place une « couche
métier » (ou semantic layer) d’accès aux données. Cette couche permet de présenter à l’utilisateur
une approche fonctionnelle des données et de leur relation, affranchissant ce dernier de la complexité
des BDD et du langage SQL. Concrètement, les données sont regroupées au sein de thématiques
métiers et reliées entre elles selon cette même logique métier. L’utilisateur n’a plus qu’à sélectionner
ses données et les disposer dans son rapport. La encore, la volonté de l’utilisateur se traduit en une
sollicitation de la base de données avec une performance d’affichage variable selon la complexité de
la demande.
Par exemple, un chargé d’études au sein d’une société de services immobiliers voudra composer un
rapport mettant en scène un nouvel indice illustrant mieux la tendance du marché des bureaux en
IDF.
Pour ces trois aspects de la restitution, l’open source propose des solutions sous formes de
composants intégrés ou non. Nous vous proposons de les découvrir dans la suite du document.
3.1.2 Analyse
Au-delà de l’activité qu’il faut surveiller à tous les échelons opérationnels (pour laquelle les services de
restitution remplissent parfaitement leur rôle), il appartient à certains niveaux de management de
comprendre plus profondément les mécanismes influant sur cette activité. Il s’agit par exemple de
rechercher les causes d’une inflexion afin de mettre en place les mécanismes managériaux,
organisationnels ou décider des investissements en vue de contrôler les facteurs déterminants les
évolutions de l’activité.
Pour cela, le manager doit disposer d’une structure plus souple d’interrogation des données. Il doit
pouvoir de manière libre naviguer dans les données sans à priori initial plus que la simple découverte.
Sa navigation peut se faire de manière croisée (interroger la valeur de son indicateur de satisfaction
client réparti selon la géographie, le temps et décliné par produit par exemple) et de manière
ascendante / descendante en jouant sur le niveau de granularité des axes métiers (vision niveau
mois, Europe, famille de produit puis mois, France, famille de produit en remontant ensuite sur une
consolidation annuelle etc…)
Un des intérêts reconnus réside dans la capacité à trouver rapidement l’origine, la cause d’un
phénomène. Par exemple, l’origine d’une inflexion des ventes constatée à un niveau agrégé (monde,
annuel, gamme de produit) peut être identifiée par une navigation dans les niveaux plus fin de la
géographie, des périodes ou des produits, aboutissant à situer une partie importante du problème au
niveau d’un produit en particulier, d’un mois en particulier et enfin d’une structure commerciale en
particulier.
Cette approche est volontairement théorique et non généralisable. En effet, on trouvera certaines
catégories d’utilisateurs opérationnels qui peuvent profiter des services offerts pour effectuer leur
travail au quotidien. Ca peut être le cas pour un département marketing qui cherchera à comprendre
les résultats de sa campagne et qui pour cela trouvera un intérêt certain à manipuler des données
disponibles dans un format multidimensionnel. En fait, elle peut être considérée comme un
prolongement du reporting ad hoc.
Il est commun d’appeler « moteur OLAP » l’outillage permettant ce service.
Ce document est sous licence GNU Free Documentation Licence.
Page 4/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
Un moteur OLAP (autrement appelé multidimensionnel) permet à l’utilisateur d’accéder à un
environnement fournissant de manière quasi instantanée la valeur des indicateurs au croisement des
axes d’analyses. L’utilisateur sélectionne de manière conviviale les axes, le niveau sur les axes et les
indicateurs qu’il veut y décliner. Ce système offre des fonctions natives de navigation dans le détail ou
dans la consolidation des valeurs.
3.1.3 Pilotage
Les cadres dirigeants ont des besoins complémentaires. La surveillance de l’activité, non plus au
niveau de son delivery opérationnel, mais dans sa capacité à remplir ses objectifs stratégiques,
amène à considérer un outillage spécifique.
Les tableaux de bords du pilote (on entendra les termes associés de KPI, Dashboard, Balanced
scorecard) sont des formats agrégés de présentation de contenu. Ils mettent en scène les indicateurs
clés et les objectifs stratégiques en les confrontant. Très visuel, le tableau de bord permet de savoir
rapidement si l’entreprise est en avance ou en retard sur son plan stratégique.
3.2
LES APPROCHES DECISIONNELLES BI OPENSOURCE
3.2.1 Les solutions spécifiques
Les premiers composants OpenSource diffusés n’avaient pour objectif que de rendre un service. Sont
donc souvent absents de l’approche les notions d’authentification, de définition du périmètre suivant
l’utilisateur.
Ces solutions permettront la production du reporting statique, l’analyse au moyen de cubes OLAP.
Optimisés pour le service à rendre, ces composants stables et pérennes sont les briques essentielles
des suites.
3.2.2 Les suites BI
Les suites vont plus loin, permettant l’agrégation de composants dans un portail dans un premier
temps, puis intégrant la gestion de liens entre eux.
Le portail permettra une gestion centralisée des accès, avec définition du périmètre utilisateur selon
son profil.
Les mécanismes de workflow des portails dédiés vont permettre le reporting de masse.
Les suites offrent en plus les composants dédiés aux utilisateurs non techniques, leur permettant de
définir et de produire le reporting ad-hoc.
Certaines suite sont complétées par des outils techniques, permettant à la MOE la conception des
rapports ou des axes d’analyse des cubes, et facilitant ensuite le déploiement automatisé des fichiers
de configuration directement dans la plateforme mise à disposition des utilisateurs finaux.
Ce document est sous licence GNU Free Documentation Licence.
Page 5/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
GUIDE DE LECTURE DU DOCUMENT
Dans ce document, nous préciserons pour chacun des outils étudiés, les besoins couverts, mais aussi
les contraintes afférentes, en termes de pré requis techniques à la mise en œuvre, les compétences
techniques nécessaires, la conduite de changement possiblement induite.
Nous préciserons la licence, les différences entre celles-ci impliquant parfois des contraintes légales à
respecter.
Selon nos contacts avec les « éditeurs » ou « mainteneurs » des solutions, nous avons indiqué les
développements futurs ou « roadmap » connues.
Un tableau, tel qu’en exemple ci-dessous, reprend une synthèse des éléments abordés et introduit
quelques commentaires et notre retour d’expérience sur la mise en œuvre de la solution.
Type d’item
Item
Nom de l’outil
Description succincte
Public
Services concernés
par l’usage,
population
Pré-requis
-
Pré requis techniques
Compétences nécessaires à la mise
en œuvre ou à l’usage
DESCRIPTION
-
-
Description synthétique de la mise en œuvre
o Complexité de la mise en œuvre de la solution
o Poste de travail ou mode partagé (mode web)
o ….
Description synthétique de l’usage
o Complexité d’appropriation de la solution
o Description de la couverture fonctionnelle
Licence
Notes
Indication du type de licence, du support disponible, des coûts à prévoir (selon
informations disponibles)
Commentaires
Nous conclurons chaque chapitre par une synthèse des outils et leurs indications métier.
Le tableau suivant présente une brève description des distinctions principales entre les différentes
licences open source évoquées dans ce document. Nous n’avons pas souhaité aborder plus
profondément le sujet, de multiples littératures sur le sujet étant déjà disponibles sur le web.
Ce document est sous licence GNU Free Documentation Licence.
Page 6/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
Licences
Description synthétique
GPL
General Public License : Code ouvert, usage libre, modification et évolution du code possible,
distribution libre avec pour seule contrainte de propager le type de licence. (notion de copyleft). GPL
est restrictif quant à l’assemblage de codes logiciels. Seuls les codes logiciels compatibles GNU GPL
peuvent être assemblés.
CPL
Common Public License : La différence essentielle avec la GPL est la liberté offerte aux personnes
ayant apporté des évolutions majeure au produit d’attribuer la licence de leur choix sur ces évolutions.
Cette licence a été mise en place pour la plateforme Eclipse, permettant ainsi à IBM d’en
commercialiser une version propriétaire.
EPL
Eclipse Public License : La différence essentielle avec la GPL est la liberté offerte aux personnes ayant
apporté des évolutions majeure au produit d’attribuer la licence de leur choix sur ces évolutions.
Elle est dérivée de la CPL (Common Public License) originelle qui comportait certaines mentions
favorables à IBM.
MPL
Mozilla Public License : Grandes similitudes avec la licence GPL. Elle est cependant un peu moins
restrictive quant à sa compatibilité avec d’autres licences (dans les cas de mixité de programme). La
notion de copyleft demeure mais seulement sur la partie MPL de l’assemblage
LGPL
Lesser General Public License Grandes similitudes avec la licence GPL. Elle est cependant un peu
moins restrictive quant à sa compatibilité avec d’autres licences (dans les cas de mixité de
programme). La notion de copyleft demeure mais seulement sur la partie LGPL de l’assemblage
NB : rappelons qu’en droit français, seules les licences rédigées en français sont reconnues valides
par le législateur. Or il n’existe pas de traduction « officielle » de la GNU GPL.
Mais, un jugement du 28 mars 2007 (TGI Paris, 3ème chambre, 1ère section, 28 mars 2007,
Educaffix c/ CNRS, Université Joseph Fourier et autres) expose un premier cas de jurisprudence
relative à une licence GNU GPL v2. On lira avec intérêt l’analyse faite de ce jugement par le cabinet
CAPRIOLI à l’URL :
http://www.caprioli-avocats.com/pages/publications/edocs/management-juridique-de-linnovation/edocs-management-juridique-de-l-innovation-premiere-jurisprudence-francaise-relative-aune-licence-GNU-GPL.htm
En Allemagne, la loi allemande a validée en 2004 les principales clauses de la GNU GPL
Pour l’Europe, notons que s’est tenue la conférence « EOLE » (European Opensource Lawyers
Event) le 24 septembre 2008, organisée dans le cadre de la manifestation « Paris, Capitale du libre »
Ce document est sous licence GNU Free Documentation Licence.
Page 7/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
4 LES SOLUTIONS SPECIFIQUES DE RESTITUTION
Plus exactement, le terme restituer représente un moyen plutôt qu’un usage. Il est le moyen
technique, applicatif qui permet la consommation d’information à valeur décisionnelle (i.e., le client
consommateur doit être en mesure de définir (ou choisir) l’action appropriée à la lecture de
l’information qui lui est fournie).
Il est cependant commun de synthétiser sous ce seul terme les usages représentés par la
consommation d’informations statiques, pré paramétrées ou encore ad hoc.
4.1
RAPPORTS STATIQUES OU DYNAMIQUES
Pour rendre disponibles des rapports statiques ou dynamiques auprès des utilisateurs, il faut des
outils offrant des fonctions de conception et de production de rapports.
Pour cet usage, l’open source propose deux composants majeurs que sont Birt et Ireport couplé avec
JasperReport.
Les plateformes BI que nous détaillons au sein du § 7 sur l’industrialisation des Systèmes
d’Information Décisionnelle mettent généralement en œuvre IReport ou BIRT. La plateforme Pentaho
intègre en plus une solution dédiée, alternative à Birt et JasperReport.
Les critères permettant d’évaluer des services BI sont nombreux et peuvent être déclinés sur un
niveau de précision tel qu’il ne contribuerait pas à leur lisibilité dans le cadre de ce livre blanc. Nous
nous satisferons d’un niveau de présentation agrégé de ces critères afin de positionner chacune des
offres de manière claire.
Pour les rapports statiques ou dynamiques, les fonctions importantes sont listées dans le tableau
suivant
Fonction majeure
Description
Capacité à intégrer des fonctions de
traitement des données (arithmétiques,
statistiques, date, texte, numériques …)
Les données brutes ainsi que des données valorisées (issues de calculs sur
les données brutes) peuvent être stockées en BDD. Ceci implique une
anticipation par les utilisateurs finaux sur les données à restituer, ainsi
qu’une intervention de la MOE.
Pour d’autres types d’indicateurs (indicateurs non linéaires) ou pour
répondre à un besoin immédiat, les outils de restitutions doivent intégrer des
fonctions de traitement de données.
Mise en forme (rupture, groupement, saut de
page, tri, mise en forme conditionnelle, entête
et pied de page)
Pour rendre l’information visible, s’assurer qu’elle sera perçue à sa juste
valeur, celle-ci doit être lisible. De même pour être partagée, communiquée
vers des tiers, le rendu doit être structuré. Il est donc important de considérer
les capacités de mise en forme des outils. Aérer l’information, mettre en
évidence les groupements, professionnaliser l’aspect sont autant de points
importants
Vision de l’information (Liste, Tableau croisé,
Graphes à barre, radar, histogramme …)
La représentation de l’information impacte considérablement la rapidité
d’appréhension et de digestion d’une information. Selon ce que sont censées
illustrer les données, ou encore le nombre d’entrées qu’elles présentent, le
Ce document est sous licence GNU Free Documentation Licence.
Page 8/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
Fonction majeure
Description
choix d’un format de restitution adapté doit être possible.
Mise à disposition (formats d’exports, mail,
portail web, envoi en masse, planification…) –
La disparité des environnements accessibles aux utilisateurs nécessite de
prévoir une distribution selon plusieurs formats ou moyens
Sécurité (droits sur les rapports, droits sur les
données avec filtre data en fonction de
l’utilisateur permettant de distribuer un même
rapport avec des périmètres données
différents…)
Le caractère confidentiel des données pour des raisons de management, de
concurrence ou autre nécessite d’apporter des moyens pour restreindre les
informations offertes selon les prérogatives du consommateur
Paramétrabilité (invites utilisateurs - saisie
libre/ référentiel, invite en cascade,..) –
Coupler un rapport statique avec des paramètres permet de le rendre
dynamique. L’utilisateur n’est pas contraint à consulter un périmètre figé
mais peut jouer sur les paramètres pour afficher un périmètre différent (en
terme de période, produit, zones de marché etc…)
Fonctions avancées (filtre récapitulatif,
indicateurs en ligne, accès multisource, audit
d’utilisation…)
Sans être primordiales, un certain nombre de fonctions avancées peuvent
rendre de grands services aux MOE ou MOA
Capitalisation (enregistrement de requêtes, de
modèles, de vues réutilisables…) –
Utile pour augmenter la productivité des ressources et ainsi favoriser les
personnels (MOE ou MOA) à consacrer leur temps à des tâches à plus forte
valeur ajoutée
Les outils présentés sont articulés autour de deux besoins différenciés :
•
•
La conception du rapport (format, logo, présentation des données, extraction des données,…) qui
implique une connaissance technique du format de stockage des informations.
La production du rapport qui sera généré à la demande (avec éventuellement une précision
apportée au périmètre ou au format de sortie) ou bien automatisée (le périmètre est définitivement
déterminé, ainsi que les destinataires et le format de sortie)
Conception du rapport
Dans le reporting statique, cette tâche de conception est assignée à une équipe technique qui va
mettre en place la connexion à la base, élaborer les requêtes SQL, concevoir graphiquement le
canevas du rapport.
Cette première étape va être réalisée au moyen d’un outil graphique déployé sur le poste client, au
moyen d’une interface graphique Java.
Les outils présentés produisent un fichier au format « xml » contenant les éléments nécessaires à
l’extraction des données, leur transformation éventuelle avant le positionnement dans le document à
produire.
Production du rapport
La production du rapport final met en œuvre des librairies Java qui vont parcourir le fichier au format
« xml » produit par l’outil d’élaboration. A la rencontre d’un champ à remplir, l’outil de production
exécute la requête SQL associée, puis l’alimente avec les données extraites.
Il est possible de planifier l’exécution de ce rapport, ou bien de l’intégrer à un portail BI, permettant à
l’utilisateur de définir des paramètres.
Ce document est sous licence GNU Free Documentation Licence.
Page 9/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
4.1.1 iReport – JasperReport
La conception du rapport se fera au moyen de l’outil iReport, une interface dédiée à la conception de
rapports JasperReport.
La restitution, se fera depuis JasperReport, sous forme de librairies intégrées dans un portail BI. Cette
intégration permet la définition d’accès aux bases de données dans le portail et donne la capacité à
l’utilisateur final de compléter la définition du périmètre des données du rapport à produire.
4.1.1.1
Conception par IReport
iReport permet la composition du rapport. Les éléments graphiques, les zones de données, sont
définis simplement par « glisser-déposer ». L’utilisateur indique les paramètres de connexion à la
base de données pour valider les données et le rendu final du rapport.
L’interface est simple et intuitive. Elle intègre un « query designer » qui permet de construire
graphiquement une requête. Les clés sont automatiquement reconnues et les jointures s’opèrent sous
forme de lien automatique.
Lorsque que la requête est constituée, les champs remontés peuvent être placés dans les zones de
restitution avec la souris.
On choisit les paramètres de mise en page, puis on lance la compilation. Dans un premier temps,
celle-ci produit un fichier « .java » à partir du descripteur « .jrxml ». Ensuite, ce « programme » est
exécuté en utilisant les librairies JasperReport et les paramètres d’accès aux bases de données.
L’exécution de ce programme génère le rapport final.
Il est possible d’ajouter du code Java dans le document pour produire la conversion de type de
données ou pour ajouter des opérateurs sur des champs remontés. Cette capacité permet
l’optimisation de la mise en forme ou l’ajout de champs calculés.
Un plugin permet un interfaçage direct avec JasperServer, la plateforme BI de JasperSoft dont iReport
et JasperReport sont deux outils. Grâce à ce plugin, le déploiement du format du rapport validé est
immédiat depuis iReport.
Un autre plugin permet de consulter les rapports installés dans la plateforme BI SpagoBI. Il en permet
la modification, à partir du moment où le fichier « .jrxml » a été déployé précédemment dans la
plateforme.
iReport ne peut gérer qu’une seule source de données SQL pour toutes les requêtes du rapport.
Une deuxième requête peut être utilisée pour produire le graphe, indépendamment de la première
utilisée pour la restitution de données sous forme de tableau.
Ce document est sous licence GNU Free Documentation Licence.
Page 10/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
Ci-dessous une copie d’écran de conception sous iReport.
L’interface iReport est un client « lourd » sous Java. Aucune compétence technique complexe n’est
requise pour cette installation, il faudra juste veiller à disposer d’une Java Virtual Machine installée sur
le poste de développement.
Les connexions aux bases de données se feront au moyen de drivers JDBC (pendant Java des
connecteurs ODBC sur les plates formes Microsoft), qui devront être installés dans le répertoire des
librairies de l’outil.
Pour aller plus loin dans la conception de rapports, des compétences en langage Java pourront être
utiles, afin de développer des méthodes de remplissage de champs ou de transtypage de données.
Ce document est sous licence GNU Free Documentation Licence.
Page 11/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
Item
CONCEPTION
iReport v3.0.0
Permet la conception graphique d’un rapport. Produit un fichier de définition au format « jrxml »
Public
- MOE : Permet la
conception de reporting
généré par les librairies
JasperReport
- Utilisateurs : Il est
possible
de
l’utiliser
comme outil de production
de rapports.
Pré-requis
-
Client « lourd » supposant une JVM
Paramètres de connexion à la base de données
Langage SQL (pour la conception de requêtes)
Langage Java (pour affiner la conception)
Langage XML (pour comprendre le fichier « jrxml »
produit)
DESCRIPTION
-
-
Interface graphique sous Java, indépendante de la plate forme. Elle permet de produire un rapport et/ou un fichier de
description au format « jrxml », utilisable dans une plate forme.
o
Interface intuitive
o
Mode visualisation permettant de pré visualiser le rapport final
Conception en mode « drag & drop »
o
Les outils et les champs de formats différents se glissent et se dépose sur la page de conception
La définition de la connexion à la base de données est extérieure au fichier de conception produit.
Licence
Notes
Licence LGPL
Documentation et exemples accessibles depuis le site de JasperForge
Librement téléchargeable sans coût de licence
Supports et formations payants (proposés par les SSLL)
Les paramètres de connexion à la base de données sont extérieurs à la définition du rapport.
Ce document est sous licence GNU Free Documentation Licence.
Page 12/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
4.1.1.2
Production par JasperReport
JasperReport se présente sous forme de librairies Java, accessible depuis une application ou un
projet J2EE.
Le fonctionnement est « transparent » pour l’utilisateur final, l’interface intègre les librairies
d’exécution.
Elles présupposent l’usage d’une interface (outil Java, portail ou plateforme BI) qui va permettre la
définition des paramètres de connexion aux données et le mode de production du rapport.
Item
PRODUCTION
JasperReport v3.0.0
Librairie de production du rapport défini au moyen de « iReport » (cf. ci-dessus)
Public
- Utilisateurs : Génère le
rapport à partir du fichier
de conception « jrxml »
transmis en paramètre
Pré-requis
-
JVM
Paramètres de connexion à la base de données
Langage SQL (pour la conception de requêtes)
Langage Java (pour affiner la conception)
Langage XML (pour comprendre le fichier « jrxml »
utilisé)
DESCRIPTION
-
-
La librairie JasperReport permet de produire les fichiers de reporting conçu depuis iReport.
o
Intégrée dans un portail ou une plateforme BI :
ƒ
celui-ci fournit les paramètres de connexion à la base de données
ƒ
il est possible de planifier l’exécution de la production
ƒ
il est possible de permettre à l’utilisateur d’affiner le périmètre sur lequel construire le rapport
Exécution transparente pour l’utilisateur final, leur mise en œuvre ne demande aucune connaissance particulière. Elles
doivent être accessibles (dans le chemin des librairies) à l’application qui les utilise.
o
Les rapports sont d’un niveau de qualité correct, le rendu graphique s’améliorant à chaque évolution de la
librairie
Licence
Il existe une version GPL et une version commerciale.
-
Notes
-
Les librairies ne sont accessibles à l’utilisateur final qu’au travers une interface java, sous forme
d’une application ou d’un portail BI.
Pas d’utilisation en mode « stand alone »
Production des graphes gérée par une librairie externe JFreeChart sous licence LGPL
Ce document est sous licence GNU Free Documentation Licence.
Page 13/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
Schématisation des composants mis en œuvre dans la production du fichier « jrxml »
4.1.1.3
Restitution
Ce document est sous licence GNU Free Documentation Licence.
Page 14/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
4.1.2 BIRT
L’interface BIRT (Business Intelligence Reporting Tools) est conçue sous Eclipse. A l’origine projet de
la fondation Eclipse, la société ACTUATE en est maintenant co-sponsor. La solution permet, par
« glisser-déposer », de composer un rapport. Tous les composants graphiques sont présents et
comme avec iReport, le rapport se construit de manière intuitive.
4.1.2.1
Conception sous BIRT
Cette solution n’intègre pas de « query designer », outil permettant de construire graphiquement les
requêtes. Elle permet par contre d’ajouter des filtres sur les données
Le transtypage de données y est plus intuitif. Il n’est pas nécessaire de produire du code Java pour
obtenir ce résultat. Il peut être obtenu par choix de fonctions aux noms explicites, à appliquer sur les
données insérées dans le rapport.
La solution permet l’usage de plusieurs sources de données, l’utilisation de plusieurs requêtes
différentes, autant pour des données restituées sous forme de tableau que sous forme de graphiques.
Ce document est sous licence GNU Free Documentation Licence.
Page 15/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
Item
CONCEPTION
BIRT v2.3.0
Interface graphique sous Eclipse, permettant la conception de rapports au format BIRT
Public
MOE : conception de
reporting au format BIRT
Utilisateurs :
Il
est
possible
de
l’utiliser
comme outil de production
de rapports.
Pré-requis
-
Client Eclipse en Java, nécessitant l’installation
d’une JVM
Paramètres de connexion à la base de données
Langage SQL (pour la conception de requêtes)
Langage Java (pour affiner la conception)
DESCRIPTION
-
-
Interface graphique sous Eclipse, indépendante de la plate forme. Elle produit un fichier de description au format
« rptdesign »
o
Interface intuitive
o
Mode visualisation permettant de pré visualiser le rapport final
Conception en mode « drag & drop »
o
Les outils et les champs de formats différents se glissent et se déposent sur la page de conception
o
Les images (logo,…) ainsi que la définition de la connexion à la base de données sont inclus dans le fichier
de conception produit
Licence
Notes
EPL (Eclipse Public Licence)
Librement téléchargeable sans coût de licence
-
Tous les éléments sont inclus dans le fichier « rptdesign »
La librairie de génération du graphe est propre à BIRT
La société ACTUATE est co-sponsor du projet BIRT sous Eclipse. Cette société participe activement
aux développements de BIRT Report et propose des produits non OpenSource additionnels suivants :
Actuate BusinessReport Studio : Portail décrit par Actuate comme permettant la conception de
rapports « adhoc » et leur visualisation.
Actuate BIRT Designer & BIRT Designer Professional : Version « professionnelle » de BIRT
Report
Actuate Information Objects : Permet la conception de vues métiers par la MOE, mis à disposition
des utilisateurs de données fonctionnelles.
Ce document est sous licence GNU Free Documentation Licence.
Page 16/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
4.1.2.2
Production sous BIRT Report
La production se fait par l’usage de librairies paramétrées dans le fichier de description du rapport
final. Les images, les accès aux bases de données étant définies dans ce fichier de description, la
conception d’une application Java autonome exploitant les librairies et le fichier est simplifiée.
Item
PRODUCTION
BIRT v2.2.0
Affichage du rapport final et production de différents types d’export
Public
Utilisateurs : Affichage
du rapport généré dans
l’outil de conception ou
dans le portail
Pré-requis
-
JVM
Paramètres de connexion à la base de données
Langage SQL (pour la conception de requêtes)
Langage Java (pour affiner la conception)
Langage XML (pour comprendre le fichier «
rptdesign » utilisé)
DESCRIPTION
-
Les librairies BIRT permettent de produire les fichiers de reporting conçu depuis BIRT.
o
Intégrée dans un portail ou une plateforme BI :
ƒ
ƒ
-
il est possible de planifier l’exécution de la production
il est possible de permettre à l’utilisateur d’affiner le périmètre sur lequel construire le rapport
Exécution transparente pour l’utilisateur final, leur mise en œuvre ne demande aucune connaissance particulière. Elles
doivent être accessibles (dans le chemin des librairies) à l’application qui les utilise.
Les rapports sont d’un niveau de qualité correct, le rendu graphique dans certains formats d’export pourrait être
amélioré
Licence
Notes
EPL (Eclipse Public License)
Rapport figé ou pré paramétré
Rapports dynamiques permettant des interactions avec l’utilisateur
Schématisation des composants mis en œuvre dans la production du fichier « rptdesign »
Ce document est sous licence GNU Free Documentation Licence.
Page 17/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
4.1.2.3
Restitution
Ce document est sous licence GNU Free Documentation Licence.
Page 18/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
4.1.3 Synthèse des outils de restitution
La solution JasperReport fait partie des premiers composants BI. Il a bénéficié d’apports de toute la
communauté depuis l’année 2000. Sa conception en deux parties distinctes, d’un côté l’interface de
conception iReport, de l’autre les librairies de production, le rendent flexible et intégrable dans de
nombreux projets.
On le retrouvera donc dans toutes les plateformes BI, de SpagoBI à Pentaho en passant par
JasperServer.
Une des limitations est qu’il est nécessaire de lui fournir les images et logos décrit dans le fichier de
conception, ainsi que l’accès aux bases de données.
BIRT est lui aussi architecturé autour de librairies de production, mais son interface de conception et
la production d’un descripteur autonome en permettent un usage autonome.
Pour BIRT, seul le fichier de description est nécessaire, les images et le paramétrage d’accès aux
données étant inclus dans celui-ci.
Le choix des outils entre BIRT et JasperReport sera donc guidé par l’usage :
• Pour un rendu comparable, BIRT sera privilégié comme outil autonome.
• Pour l’intégration dans un portail ou un développement spécifique, on préférera Jasper,
dont les paramétrages sont plus accessibles.
• Si de multiples sources de données doivent être agrégées dans le même rapport, on
utilisera la solution BIRT, Jasper n’intégrant pas cette fonctionnalité.
• S’il est nécessaire d’avoir des rapports dynamiques contenant des interactions avec
l’utilisateur, la solution BIRT sera plus adaptée.
D’un point de vue des critères, le tableau suivant présente les points forts des deux solutions
Fonction majeure
iReport / JasperReport
Birt
Capacité à intégrer des fonctions de
traitement des données (arithmétiques,
statistiques, date, texte, numériques …)
Les fonctions disponibles
sont celles offertes par la
BDD sous jacente – peu
de limite
Les fonctions disponibles peuvent être gérées
par Birt indépendamment des fonctions fournis
par la BDD.
La
programmation
procédurale est aussi
intégrable
La programmation
intégrable
procédurale
est
aussi
Mise en forme (rupture, groupement, saut de
page, tri, mise en forme conditionnelle, entête
et pied de page) –
Toutes
ces
caractéristiques de mise
en forme sont prises en
compte nativement dans
iReport.
Toutes ces caractéristiques de mise en forme
sont prises en compte nativement dans Birt
Vision de l’information (Liste, Tableau croisé,
Graphes à barre, radar, histogramme …)
La vision de l’information
est
totalement
paramétrable lors de la
conception du rapport.
La vision de l’information est totalement
paramétrable lors de la conception du rapport.
Mise à disposition (formats d’exports, mail,
portail web, envoi en masse, planification…) –
Export possible en PDF,
HTML, XLS, CSV, Txt,
RTF, ODF.
Export possible en PDF, HTML, XLS, DOC,
PPT, POSTSCRIPT.
Ce document est sous licence GNU Free Documentation Licence.
Un rapport Birt peut être conçu de manière
dynamique pour un usage sous forme de
dashboard.
Parfaitement intégrable à un portail pour la
Page 19/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
Fonction majeure
iReport / JasperReport
Birt
Parfaitement intégrable à
un portail pour la diffusion
de masse.
diffusion de masse.
La mise à jour au sein d’un portail n’est pas un
modèle de simplicité.
Un simple remplacement
de
la
librairie
JasperReport permet de
prendre en charge les
nouvelles fonctionnalités.
Sécurité (droits sur les rapports, droits sur les
données avec filtre data en fonction de
l’utilisateur permettant de distribuer un même
rapport avec des périmètres données
différents…)
Essentiellement
gérée
par le portail, dans la
conception
il
faudra
simplement spécifier les
éléments paramétrables.
Essentiellement gérée par le portail, dans la
conception il faudra simplement spécifier les
éléments paramétrables.
Paramétrabilité (invites utilisateurs - saisie
libre/ référentiel, invite en cascade,..)
La
gestion
des
paramètres est intégrée à
iReport ce qui permet, à
l’exécution du rapport, de
proposer un invite pour
sélectionner le ou les
paramètre(s).
La gestion des paramètres est intégrée à BIRT
et dispose de plusieurs options comme la saisie
libre, la liste déroulante, la sélection multiple et
la gestion des paramètres en cascade. La
gestion des paramètres sert également à rendre
le rapport dynamique à l’image des dashboards.
Pour une gestion des
paramètres encore plus
poussée il faudra utiliser
les fonctions du portail.
Fonctions avancées (filtre récapitulatif,
indicateurs en ligne, accès multisource, audit
d’utilisation…)
Beaucoup de points sont
déjà gérés par le portail.
iReport pêche tout de
même quand il s’agit de
l’accès multi source ou
plutôt multi requête.
Les rapports secondaires
peuvent éventuellement
palier à ce problème.
Capitalisation (enregistrement de requêtes, de
modèles, de vues réutilisables…) –
Essentiellement géré par
le portail.
Ce document est sous licence GNU Free Documentation Licence.
Intégré dans un portail, une autre dimension de
paramétrabilité peut être utilisée.
Beaucoup de points étant déjà gérés par le
portail, Birt offre la capacité d’accès multi
source, les jointures entre plusieurs source de
données et des fonctions de calcule entre des
champs de base de données différentes, et tout
ceci au sein du même rapport en plus de la
gestion des rapports secondaires.
Essentiellement géré par le portail.
Page 20/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
4.2
RAPPORTS AD HOC
Pour qu’un utilisateur puisse créer son propre rapport, en supposant (ce qui représente la majorité des
cas) qu’il n’a pas la connaissance pratique des modalités d’interrogation SQL des données, il a besoin
qu’une représentation métier de ces données lui soit présentée.
Concrètement, stockage relationnel ne veut souvent pas dire grand-chose pour un utilisateur métier.
Pourquoi aurais je besoin de comprendre les contraintes techniques, de volumétrie, d’atomicité, de
cardinalité et pleins d’autres bonnes raisons qui ont poussé les MOE à répartir les données dans des
tables distinctes ? Surtout quand cette répartition signifie que je dois comprendre la notion de jointure
entre les tables afin d’associer mes données entre elles…
Donc pour permettre une certaine liberté aux utilisateurs quant à leur besoin en terme de reporting,
les couches métiers sont une réponse efficace (pour faire une analogie avec les éditeurs historiques,
on parlera anciennement de « catalogue » chez Cognos puis de « framework », d’ « univers » pour
Business Objects ou encore d’ « infomap » chez Sas)
Ce genre de service n’est pas offert à tous les utilisateurs, il n’est pas forcément non plus mis en
place au sein de toutes les entreprises, certaines préférant que la DSI contrôle l’ensemble de la
production des rapports mis à disposition des utilisateurs.
Les critères déterminants pour qualifier la pertinence des technologies des éditeurs sur cet aspect
sont globalement les mêmes que ceux déterminés pour les rapports statiques.
Sauf qu’ils s’appliquent différemment.
Par exemple, la présence de fonctions de calculs nécessaire pour travailler les données, s’adressant
à des utilisateurs ne peut plus être implémentée à l’aide de requêtes SQL ou de procédures type
pgSQL (spécifique base PostgreSQL).
Elle doit devenir graphique, c'est-à-dire permettre à l’utilisateur de sélectionner une fonction présentée
de manière littérale pour qu’il l’applique sur la donnée choisie.
La couche métier, dont la conception est assurée par la MOE, doit offrir des fonctionnalités
élémentaires et d’autres de confort
Ce document est sous licence GNU Free Documentation Licence.
Page 21/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
Outillage
Critères
Description
Outil de conception de la vue
métier
Fonctions de design métier de la BDD
Importation des tables, renommage des champs
techniques, classement de l’information en
dossiers, création de jointure libre ou semi
automatisé, gestion des boucles
Capacité à créer de nouvelles
données calculées (à partir de celles
importées de la base et offertes
ensuite aux utilisateurs) – présence de
fonctions de traitement des données
(arithmétiques,
statistiques,
date,
texte, numériques …)
Les données brutes, une partie des données
valorisées peuvent être stockées en BDD mais
tout ne peut être reporté sur la base. Pour des
raisons d’anticipation (le process de modélisation
et d’alimentation demeurant peu flexible) comme
pour des contraintes naturelles (indicateurs non
linéaires). Il est donc vital que la valorisation des
données, leur préparation puisse aussi être prise
en charge par les outils de restitution. Ainsi les
fonctions de traitement de données ont leur utilité
dans les outils
Sécurité (droits sur les données)
Le caractère confidentiel des données pour des
raisons de management, de concurrence ou
autre nécessite d’apporter des moyens pour
restreindre les informations délivrées
Fonction de contrôle des utilisateurs
Afin de préserver la disponibilité des
infrastructures, il est important de limiter
certaines actions utilisateurs. Notamment les
produits cartésiens ou les requêtes trop
complexes.
Outil de création des rapports Ad
hoc
Capacité à intégrer des fonctions de
traitement
des
données
(arithmétiques,
statistiques,
date,
texte, numériques …)
Mise en forme (rupture, groupement,
saut de page, tri, mise en forme
conditionnelle, entête et pied de page)
pour rendre l’information visible, s’assurer qu’elle
sera perçue à sa juste valeur, celle-ci doit être
lisible. De même pour être partagée,
communiquée vers des tiers, le rendu doit être
structuré. Il est donc important de considérer les
capacités de mise en forme des outils. Aérer
l’information,
mettre
en
évidence
les
groupements, professionnaliser l’aspect sont
autant de points importants
Vision de l’information (Liste, Tableau
croisé, Graphes à barre, radar,
histogramme …)
La représentation de l’information impacte
considérablement la rapidité d’appréhension et
de digestion d’une information. Selon ce que sont
censées illustrer les données, ou encore le
nombre d’entrées qu’elles présentent, il convient
mieux de sélection un format de vision différent.
Les outils doivent donc être dotés de modes de
représentation différents
Mise à disposition (formats d’exports,
mail, portail web, envoi en masse,
planification…) –
L’utilisateur créant son rapport peut souhaiter le
mettre à disposition des autres utilisateurs. La
disparité des environnements accessibles aux
utilisateurs nécessite de prévoir une distribution
selon plusieurs formats ou moyens
Ce document est sous licence GNU Free Documentation Licence.
Page 22/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
Outillage
Critères
Description
Paramétrabilité (invites utilisateurs saisie libre/ référentiel, invite en
cascade,..) –
De même, l’utilisateur peut souhaiter rendre
dynamique le rapport qu’il vient de créer. Il y
ajoute alors des paramètres permettant de faire
varier le périmètre de consultation des données
affichées dans le rapport.
Fonctions
avancées
(état
d’avancement
de
la
requête,
annulation de requête,
application
d’une mise en forme différente sur le
résultat d’une requête
Sans être primordiales, un certain nombre de
fonctions avancées peuvent rendre de grands
services aux utilisateurs.
Capitalisation
(enregistrement
de
requêtes, de modèles, de vues
réutilisables…)
Utile pour augmenter la productivité des
ressources et ainsi favoriser les personnels à
consacrer leur temps à des tâches à plus forte
valeur ajoutée
Il n’existe pas de composants dédiés au reporting ad hoc. Ce service est offert de manière intégré par
les différentes plates formes BI, Pentaho », « SpagoBI », « JasperServer » et « BPM Conseil » que
nous présentons à partir du chapitre 7 sur l’industrialisation des SID.
Ce document est sous licence GNU Free Documentation Licence.
Page 23/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
5 LES SOLUTIONS SPECIFIQUES D’ANALYSE
MULTIDIMENSIONNELLE
5.1
DEFINITIONS
Les cubes OLAP permettent à un utilisateur de « naviguer » au travers de ses données. Pour ce faire,
un axe d’analyse, appelé « mesure » va être défini, puis analysé suite à un croisement avec des
données organisées sous forme de dimensions.
Par exemple, on souhaite produire une analyse sur les coûts de transport de produits. Ceci
constituera la « mesure » du cube. Les pays expéditeurs et destinations seront deux dimensions
possibles. La période de temps (en mois ou années) constituera une autre dimension.
On pourra alors étudier l’évolution des coûts de transports sur une période en mois pour tous les
pays. Ou bien produire une analyse de ces coûts entre deux pays, entre deux continents (résultat
d’une agrégation des dimensions unitaires de pays). Ou bien, en mixant les deux dimensions
d’analyse, entre plusieurs continents sur plusieurs périodes.
Cet exemple sera repris et commenté dans nos études des solutions.
Les cubes sont classés en deux grandes familles :
• les cubes ROLAP dont l’implémentation en OpenSource est la solution MONDRIAN
• les cubes MOLAP dont l’implémentation en OpenSource est la solution PALO
Les cubes ROLAP (OLAP basé sur une structure Relationnelle) permettent d’accéder directement aux
données physiques contenues dans les tables relationnelles. Les outils présentent les données
regroupées selon des vues métier, organisées autour des mesures et des dimensions.
Il devient possible de passer d’une vue « globalisée » par les axes, présentant des résultats agrégés,
à une vue unitaire des données. Cette navigation, d’une vision globale à une vision unitaire, s’appelle
le « drill through » ou le « drill down ».
La limite d’usage de cette méthode apparaît lors de sa mise en œuvre sur une base de volumétrie
importante. L’outil interroge la base à chaque demande d’analyse.
Les cubes MOLAP (OLAP optimisé pour l'analyse Multidimensionnelle) accèdent à des données
préalablement agrégées selon les mesures et les dimensions. Il n’est donc pas possible à priori de
descendre vers les données unitaires.
Sa mise en œuvre implique au préalable une extraction des données selon les axes de mesure et de
dimensions définis par les besoins d’analyse.
Cette méthode d’analyse, basé sur un sous ensemble de données limité, permet des temps de
réponses élevés sur une base de volumétrie importante.
Il existe aussi des solutions Hybrides (HOLAP) permettant une première analyse optimisée des
données par un cube MOLAP, puis en cas de besoin d’analyse plus fine, d’accéder aux données au
travers d’un cube ROLAP. A notre connaissance, aucune solution de ce type n’est représentée dans
le monde de l’Open Source.
Utiliser une solution multidimensionnelle implique deux types d’outils :
Un composant permettant le design du cube (définition des axes, des indicateurs, des modalités
d’alimentation, de la sécurité…)
Un client permettant à l’utilisateur d’exploiter les données fournies au travers du cube. (client web ou
lourd, add in excel …)
Ce document est sous licence GNU Free Documentation Licence.
Page 24/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
Dans la suite du document nous vous présentons les deux solutions opensource éligibles au titre de
moteur OLAP :
9 la solution Mondrian : les différents composants pour le design du cube et les différents
composants clients permettant sa lecture,
9 la solution Palo et ses différents clients.
Pour l’analyse au moyen de cubes OLAP, les fonctions importantes sont listées dans le tableau
suivant.
Nous indiquerons en fin de chacune des études sur les deux grandes solutions OpenSource,
l’avancée des réalisations sur les fonctions majeures.
Outillage
Type
Fonction majeure
Description
Outil
de
design
(conception)
du
moteur OLAP
Tout type OLAP
Déclaration des sources
de données, des axes et
indicateurs, de colonnes
calculées
supplémentaires
Fonctions bien évidemment primordiales. C’est surtout
le confort apporté à ces fonctions de conception que
nous évaluons au travers de ce critère
Tout type OLAP
Sécurité – gestion des
accès aux données
Toujours la même problématique de confidentialité des
données. Elle peut être implémentée par des filtres
relatifs aux profils des utilisateurs ou par la constitution
de vues sur les cubes
Tout type OLAP
Mode de consolidation
des indicateurs
Selon la nature de l’indicateur, sa consolidation sur
l’axe temps ne prend pas la même forme. Au-delà de
la simple somme, Il peut être nécessaire d’agréger la
dernière valeur disponible sur la période (notamment
pour les indicateurs de type stock), la valeur minimale
ou maximale de l’indicateur sur la période
Gestion des dimensions
récursives
Permet de traiter un axe d’analyse dont le nombre de
niveau hiérarchique n’est pas fixe (les filiations sont
déclarées au sein d’une même table de manière
récursive). Cela reste cependant une fonctionnalité
avancée présente dans peu de solutions OLAP
Gestion avancée de la
dimension temps
Capacité native à comparer les indicateurs d’une
période de temps à la même période précédente (que
ce soit sur un pas mensuel, annuel, en cumul depuis le
début de l’année – YTD - , en cumul depuis le début du
trimestre – QTD – etc…)
Elaboration d’un rapport
Avec les possibilités de mises en forme classiques des
rapports, formats d’exports disponibles, canaux de
diffusion etc…
Modalités d’alimentation
full ou différentiel
Un cube MOLAP stockant les données, les modalités
d’alimentation deviennent primordiales. Avoir le choix
entre les deux modes est utile selon le contexte
d’utilisation de ces cubes, la volumétrie, et la fenêtre
de
chargement
disponible.
On
distinguera
l’alimentation full (à chaque alimentation du cube,
l’intégralité des données sont rechargées) et le mode
différentiel (mécanisme permettant de n’alimenter que
les nouvelles données ou celles modifiées depuis la
dernière extraction) -
MOLAP
Ce document est sous licence GNU Free Documentation Licence.
Page 25/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
Outillage
Type
Fonction majeure
Description
MOLAP
Accès au détail
Le cube MOLAP stockant ses données, il est courant
de ne pas intégrer les données de niveau de détail
issues de la BDD. Dans certains contextes métier il est
intéressant de pouvoir naviguer dans des indicateurs
agrégés puis d’obtenir les enregistrements unitaires
constitutifs de la valeur de l’indicateur sur un
croisement donné.
Exemple marketing classique : Les équipes utilisent le
cube MOLAP pour naviguer et identifier une population
spécifique sur laquelle ils souhaitent positionner une
offre. Dans le cadre du mailing ils ont besoin des
clients sous jacent avec leur coordonnées. Il faut
pouvoir à partir de la cellule sélectionnée dans le cube
accéder à la population qui a permis de construire
cette valeur.
Implémentation
des
normes XML/A ou MDX
MDX est le langage de requête multidimensionnel,
comme SQL l’est pour les bases relationnelles.
XML/A est une norme d'échange au format XML/SOAP
permettant d'interroger un cube au travers d'un
WebService sur le protocol HTTP. Elle permet de
changer de fournisseur OLAP sans modification de
l'interface de navigation.
Outil de consultation
Navigation (drill down,
slice and dice)
Un aspect essentiel d’un cube pour l’utilisateur, à la
découverte d’information, est la fluidité. Il faut donc
aisément pouvoir inverser des axes, les imbriquer
entre eux, descendre d’un clic dans la hiérarchie,
remonter dans l’agrégation aussi simplement etc…
Vision de l’information
(Liste, Tableau croisé,
Graphes à barre, radar,
histogramme …)
– La représentation de l’information impacte
considérablement la rapidité d’appréhension et de
digestion d’une information. Selon ce que sont censées
illustrer les données, ou encore le nombre d’entrées
qu’elles présentent, il convient mieux de sélection un
format de vision différent. Les outils doivent donc être
dotés de modes de représentation différents
Filtre, couche
Un rapport, même issu de la consultation d’un cube, ne
présente que deux dimensions. L’ajout d’une couche
permet d’obtenir une superposition du rapport en
couches déclinées sur les valeurs d’un axe d’analyse
permettant un effet « 3eme » dimension.
La notion de filtre est primordiale pour permettre de
délimiter le périmètre des autres axes non affichés à
l’écran
Ajout de calcul
Mise
en
rapports
Possibilité d’ajouter des colonnes calculées dans le
rapport à l’écran dans le but entre autres de comparer
les données entre elles.
forme de
Ce document est sous licence GNU Free Documentation Licence.
pour rendre l’information visible, s’assurer qu’elle sera
perçue à sa juste valeur, celle-ci doit être lisible. De
même pour être partagée, communiquée vers des
tiers, le rendu doit être structuré. Il est donc important
de considérer les capacités de mise en forme des
outils. Aérer l’information, mettre en évidence les
groupements, professionnaliser l’aspect sont autant de
points importants
Page 26/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
5.2
LA SOLUTION MONDRIAN
La solution MONDRIAN est développée en OpenSource depuis 2001 sous licence CPL et se présente
sous la forme d’un ensemble de librairies Java. Elles permettent la représentation de données
relationnelles dans un cube ROLAP, grâce à un fichier XML décrivant les axes de mesures et les
dimensions.
La mise en œuvre du serveur intègre la conception de ce fichier de description, préalable à
l’interrogation des données grâce à un outil client.
Item
ANALYSE
Mondrian v3.0
La solution MONDRIAN est une implémentation Java de cubes ROLAP
Public
MOE : Définition d’un
cube ROLAP grâce à des
librairies JAVA
Pré-requis
-
JVM
XML (configuration)
DESCRIPTION
-
La solution MONDRIAN se présente sous la forme d’un ensemble de librairies Java qui permettent la représentation de
données relationnelles dans un cube ROLAP
o
o
Licence
Notes
La configuration de l’accès aux données relationnelles se fait depuis un fichier .xml
La définition de la structure du cube (axes, indicateurs) peut se faire au moyen des outils de modélisation «
CubeDesignor », « Schema workbench» ou « FreeAnalysis Schema Designer »
Common Public License - v 1.0
Depuis la version 1.2 un système d’agrégation de tables à fait son apparition pour l’optimisation du
temps de réponse des requêtes mais sa mise en place reste complexe
5.2.1 Mise en œuvre du serveur
Comme explicité plus haut, le serveur MONDRIAN repose sur l’implémentation ROLAP. Il permet
donc d’interroger directement une base relationnelle, au travers de la définition d’un « schéma »
précisant les axes de mesures et les dimensions.
Ce schéma se présente sous forme d’un fichier « .xml », configurant le mode d’accès aux données.
Ce fichier peut être modélisé au moyen des outils suivants :
« CubeDesignor », outillage conçu par Pentaho, mais désormais abandonné
« Schema Workbench », outillage conçu conjointement par Pentaho et Jasper. Remplaçant de
« CubeDesignor »
« FreeAnalysis Schema Designer », outillage conçu par BPM
Un cube Mondrian peut également être implémenté dans une plate-forme telle que Jasper, Pentaho
ou SpagoBI. L’interrogation se fera alors à travers l’outil « JPivot », en mode web.
Ce document est sous licence GNU Free Documentation Licence.
Page 27/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
Ci-dessous le schéma d’architecture nous permet de comprendre les mécanismes mis en œuvre :
1. l’outil client transmet une requête au format MDX au serveur MONDRIAN
2. après validation du format de la requête, celui-ci utilise le schéma XML correspondant aux
données à traiter afin de transmettre une demande formatée à la couche de requêtage SQL
3. la couche de requêtage accède à la base physique et extrait les données correspondantes
à la requête
4. les résultats sont transmis à l’outil client.
Ce document est sous licence GNU Free Documentation Licence.
Page 28/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
5.2.2 Outils de design du fichier « schema XML »
5.2.2.1
Schema Workbench
Aussi appelé « Jasper Workbench », cet outil permet de définir les axes du cube ROLAP dans le
fichier de description XML. Il se connecte via des drivers JDBC aux bases relationnelles et permet de
définir les mesures, les dimensions.
Item
ANALYSE
Schema Workbench v3.0.3
Interface graphique sous Eclipse, permettant de concevoir l’interrogation d’un cube OLAP Mondrian
Public
MOE : Définition du
cube, ajout de mesures
pré calculées, export de la
définition du cube en XML
Pré-requis
-
JVM
Paramètres de connexion à la base de données
Langage SQL (pour la conception de requêtes)
Langage Java (pour affiner la conception)
Langage XML (pour comprendre le fichier « xml »
utilisé)
Langage MDX (pour la conception de la requête)
DESCRIPTION
-
-
Schema Workbench est une application JAVA permettant de construire des cubes ROLAP Mondrian
o
Définition et visualisation de la connexion, des mesures, des dimensions et des cubes
o
Ajout de colonnes pré calculées (manuelle)
o
Ajout de fonctions définis par l’utilisateur (manuelle)
o
Gestion de cubes virtuels permettant une limitation du périmètre de données observées.
o
o
Importation et exportation de cube Mondrian
Publication directement dans la plateforme Pentaho avec cette version
Mis en œuvre par la MOE, demande des connaissances en base de données et en cube OLAP
o
Connexion à la base et construction du cube
Licence
Notes
CPL (Common Public License) v 1.0
Anciennement appelé Jasper Workbench le projet est soutenu par Pentaho.
Ci-dessous une copie d’écran de l’interface de « Schema Workbench ». Des icônes permettent de
positionner facilement les axes et mesures.
Une fois l’outil connecté à la base relationnelle (ici PostgreSQL), celui-ci intègre automatiquement les
méta données de la base, rendant disponibles dans l’interface les noms des tables physiques et leurs
colonnes.
Ce document est sous licence GNU Free Documentation Licence.
Page 29/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
Ce document est sous licence GNU Free Documentation Licence.
Page 30/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
5.2.2.2
Pentaho CubeDesigner
Pentaho possédait sa propre interface de définition d’un cube ROLAP, « Pentaho Cube Designer ».
Item
ANALYSE
Pentaho CubeDesigner v0.7.2.0
Interface graphique sous Eclipse, permettant de concevoir un cube OLAP Mondrian
Public
MOE : Construction du
cube, publication du cube
sur la plateforme ou
export XML
Pré-requis
-
JVM
Paramètres de connexion à la base de données
Langage SQL (pour la conception de requêtes)
Langage Java (pour affiner la conception)
Langage XML (pour comprendre le fichier « xml »
utilisé)
Langage MDX (pour la conception de la requête)
DESCRIPTION
-
Pentaho CubeDesigner est un client lourd JAVA permettant de construire un cube ROLAP Mondrian.
Tout se regroupe en un gigantesque assistant de création de cubes simples
o
o
-
Gestion des jointures supplémentaires de façon transparente
Publication du cube directement dans la plateforme Pentaho ou export en fichier XML
Exécution pour l’utilisateur final, demande des connaissances en base de données et en cube OLAP
o
Connexion à la base, choix des tables, créations des mesures et des dimensions, publication sur la plateforme
Pentaho
Licence
Notes
NC
Utilisation en mode « stand alone » sauf pour la publication
Plus simple que Schema Workbench ou FreeAnalysis Schema Designer pour la création de cube OLAP
Mondrian il est aussi plus limité.
Ce projet a été abandonné au profit de « Schema Workbench » décrit plus haut.
Ce document est sous licence GNU Free Documentation Licence.
Page 31/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
5.2.2.3
FreeAnalysis Schema designer
Conçu par la société BPM Conseil « FreeAnalysis Schéma designer » assiste la démarche de
définition des axes et des mesures du cube. Dédié principalement à leur plateforme BI Portal que
nous illustrons plus bas il permet également d’exporter le schéma ainsi créé au format Mondrian
(fichier XML).
Notons également qu’une extension vers les cubes MOLAP est déjà prévue, mais non totalement
implémentée actuellement.
Item
ANALYSE
Free Analysis Schema Designer v0.80
Interface graphique sous Eclipse, permet de définir l’accès à un cube ROLAP ou MOLAP
Public
MOE : Construction du
cube, ajout de mesures
pré calculées, publication
du cube sur la plateforme
ou export XML
Pré-requis
-
Client « lourd » supposant une JVM
Paramètres de connexion à la base de données
Langage XML (pour comprendre le fichier « fasd »
produit)
Langage MDX (pour édition de requête MDX
manuelle ex colonne calculé)
DESCRIPTION
-
-
Free Analysis Schéma Designer est un client lourd JAVA permettant de construire un cube OLAP
o
Définition et visualisation de la connexion, des mesures, des dimensions et des cubes
o
Ajout de colonnes pré calculées (assistant dédié)
o
Ajout d’agrégations sur les colonnes (assistant dédié)
o
Gestion des cubes virtuels
o
Importation et exportation de cube Mondrian
o
o
Publication du cube directement dans la plateforme FreeAnalysisWeb
Gestion des agrégations
L’exécution par le concepteur, demande des connaissances en base de données et en cube OLAP
o
o
Licence
Notes
Connexion à la base, choix des tables, créations des dimensions et des mesures, enregistrement et publication
sur la plateforme BPM.
Possibilité de « drag and drop » pour certains éléments
Free Analysis Schema Designer Public License (licence MPL avec des clauses supplémentaires)
Utilisation en mode « stand alone » sauf pour la publication
Plus conviviale que Workbench pour la création de cube OLAP Mondrian
Certains éléments sont encore en phase de développement surtout concernant les cubes MOLAP.
Ce document est sous licence GNU Free Documentation Licence.
Page 32/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
Ci dessous un exemple de l’interface de construction du cube
Ce document est sous licence GNU Free Documentation Licence.
Page 33/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
5.2.2.4
FreeAnalysis Schema designer Web
FreeAnalysis Schéma designer Web est le pendant web de « FreeAnalysis Schema Designer ». Cet
outil est dédié à la plateforme BI Portal de BPM et permet de définir le schéma d’interrogation d’un
cube Mondrian, puis de l’exporter dans le référentiel de la plateforme.
Item
ANALYSE
Free Analysis Schema Designer Web
Interface graphique Web, permet la construction d’un cube ROLAP
Public
MOE : Construction du
cube, ajout de mesures
pré calculées, publication
du cube sur la plateforme
Pré-requis
-
Paramètres de connexion à la base de données
Langage XML (pour comprendre le fichier « fasd »
produit)
Langage MDX (pour édition de requête MDX
manuelle ex colonne calculé)
DESCRIPTION
-
-
Free Analysis Schema Designer Web est le pendant Web du client lourd Free Analysis Schema Designer
o
Définition et visualisation de la connexion, des mesures, des dimensions et des cubes
o
Publication du cube directement dans la plateforme FreeAnalysisWeb
L’exécution par l’utilisateur final, demande des connaissances en base de données et en cube OLAP
o
o
Licence
Notes
Connexion à la base, choix des tables, créations des dimensions et des mesures, publication sur la plateforme
BPM.
Drag and drop des dimensions et des mesures pour créer le cube
NC
Permet la définition du schéma d’accès à un cube Mondrian, depuis la plateforme FreeAnalysis
Ce document est sous licence GNU Free Documentation Licence.
Page 34/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
5.2.3 Outillage d’interrogation et de restitution
La solution « JRubik » permet, à l’instar des librairies JPivot en mode web, de présenter les axes et
les dimensions d’analyse, afin que l’utilisateur puisse les combiner depuis une interface. L’outillage
sert essentiellement à l’analyse, l’intégration dans un tableau de bord n’étant possible que suite à un
export des données vers Excel.
Une présentation graphique « simplifiée » permet une représentation des données plus synthétique.
L’export de ce graphique se fait de la même manière que les données du cube travaillées par
l’utilisateur.
« FreeAnalysis » va plus loin et propose également l’ajout de colonnes calculées avec outre les
opérateurs classiques les fonctions valeur absolue (« absolute »), moyenne (« average »), max et min
disponibles.
5.2.3.1
JPivot
Cette librairie permet d’extraire et de présenter les données d’une base relationnelle au travers d’une
représentation sous forme de cube OLAP. La présentation se fait en mode web, intégrable dans un
portail ou des pages dédiées.
Item
ANALYSE
JPivot
Librairie java permettant l’accès aux données d’un cube ROLAP depuis une interface web
Public
Utilisateur : Extraire les
données d’un cube OLAP
au moyen de requête
MDX
Pré-requis
-
Langage MDX (pour le requêtage manuel)
Navigateur Web
DESCRIPTION
-
JPivot est une librairie Java permettant la connexion et l’interrogation d’un cube Mondrian
o
A partir d’une définition d’accès à un cube existant
o
L’utilisateur dispose d’une interface web lui permettant d’effectuer des analyses sur les « mesures » définies
dans le « schéma XML »
o
o
Fonctions de choix des axes à afficher
Fonctions de slice et dice, drill down
Licence
Notes
GPL
L’interface est simplifiée et statique. Il y manque nativement quelques fonctions de type « tableur »
(ajout de colonnes calculées). Malgré tout, cette interface est présente dans pratiquement toutes les
solutions proposant les analyses de données sur cubes ROLAP.
Ce document est sous licence GNU Free Documentation Licence.
Page 35/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
Ci-dessous une copie d’écran de données restituées sous forme de cube.
On distingue les icônes permettant l’accès à la définition des axes à afficher, ainsi que les fonctions
de graphes simplifiés.
Les exports Excel permettent de compléter les informations produites par l’ajout de colonnes
calculées.
Ce document est sous licence GNU Free Documentation Licence.
Page 36/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
5.2.4 JRubik
JRubik est une interface Java permettant la manipulation de données représentées sous forme de
cube ROLAP.
L’interface reprend la présentation offerte par JPivot, en ajoutant une ergonomie plus aboutie par la
gestion d’onglets. Il devient possible d’avoir une représentation des données au format « tableur »,
complétée par la visualisation de la requête MDX générée.
Item
ANALYSE
JRUBIK v0.9.4
Application permettant l’accès aux données d’un cube ROLAP depuis le poste de travail
Public
Utilisateurs : Extraire les
données d’un cube OLAP
au moyen de requête
MDX
Pré-requis
-
JVM
Langage MDX (pour le requêtage manuel)
DESCRIPTION
-
-
JRubik est une application Java autonome permettant la connexion et l’interrogation d’un cube Mondrian
o
A partir d’un cube existant
o
L’utilisateur dispose d’une interface graphique lui permettant d’effectuer des analyses sur les « mesures »
définies dans le « schéma XML »
o
o
Fonctions de choix des axes à afficher
Fonctions de slice & dice, drill down
La complexité réside dans l’installation et la mise en œuvre du cube Mondrian
Licence
Notes
GPL
Cet outil est le pendant « client lourd » des librairies JPivot vues plus haut. Nous ferons donc les mêmes
remarques que celles indiquées alors.
Ce document est sous licence GNU Free Documentation Licence.
Page 37/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
Ci-dessous, un exemple de mise en œuvre de l’application sur notre cube de données.
Les données fonctionnelles sont présentées dans la vue hiérarchique de gauche. Le choix des axes et
mesures se fait par « glisser-déposer ».
L’outil permet lui aussi un export graphique et sous Excel.
Ce document est sous licence GNU Free Documentation Licence.
Page 38/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
5.2.5 FreeAnalysis
FreeAnalysis est la solution développée par BPM Conseil pour accéder au cube. Nous avons vu
précédemment l’outillage dédié « FreeAnalysis Schéma designer » de la solution. Il s’agit maintenant
d’interroger le cube et de produire les analyses correspondantes.
Item
ANALYSE
FreeAnalysis v1.25
Interface graphique sous Eclipse, permet d’interroger un cube
Public
Utilisateurs : Navigation
dans le cube, « drag and
drop » des dimensions,
ajout
de
colonnes
calculées, génération de
graphes et export sous
forme de rapports
Pré-requis
-
Client « lourd » supposant une JVM
Paramètres de connexion à la base de données
Langage MDX (pour édition de requête MDX
manuelle)
DESCRIPTION
-
-
FreeAnalysis est un client lourd JAVA permettant de naviguer dans un cube OLAP
o
Visualisation du cube, des mesures et des dimensions (assistant de connexion dédié)
o
Gestion des dimensions et des mesures en « drag and drop »
o
Filtrage des dimensions avant présentation des données du cube
o
Visualisation des dimensions sous forme d’organigramme
o
Edition de requêtes MDX manuelles
o
Gestion des graphes automatiques
o
o
Export sous forme de rapports aux formats HTML, PDF, Excel
Ajout des colonnes calculées mais limité en nombre de fonctions
Exécution pour l’utilisateur final, ne demande aucune connaissance particulière.
o
Ouverture d’un fichier « *.freeanalysis » ou « *.fasd » mais aussi importation depuis le référentiel et accès direct
au cube et aux fonctionnalités
Licence
Notes
Freeanalysis public License (licence MPL avec des clauses supplémentaires)
Utilisation en mode « stand alone »
Ce document est sous licence GNU Free Documentation Licence.
Page 39/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
Ci-dessous une copie d’écran réalisée sur la mise en œuvre de l’outil d’analyse sur notre définition de
cube Mondrian :
On notera les accès immédiats aux grandes fonctionnalités au moyen d’icones dédiées.
Ce document est sous licence GNU Free Documentation Licence.
Page 40/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
5.3
LA SOLUTION PALO
Après avoir étudié les solutions pour le cube ROLAP Mondrian, nous abordons maintenant le cube
MOLAP OpenSource « Palo ». Cette solution est éditée par la société allemande « JEDOX ».
Rappelons ici que les cubes MOLAP permettent la représentation de données relationnelles, mises en
forme spécifiquement pour répondre à une problématique d’analyse croisée sous plusieurs axes.
Un cube MOLAP existe donc physiquement (à l’inverse d’un cube ROLAP qui n’est qu’une
représentation fonctionnelle de données réelles) et nécessite une première étape de construction (par
son alimentation).
Item
ANALYSE
PALO OLAP Server v2.5
PALO est un cube MOLAP, optimisé pour une visualisation sous un tableur
Public
MOE : Agréger dans un
cube MOLAP les données
d’une base relationnelle,
afin
d’en
permettre
l’analyse en mode tableur.
Pré-requis
-
JVM
Serveur Windows ou Linux
XML (configuration des données à extraire)
DESCRIPTION
-
-
PALO est un serveur de cube, optimisé pour un tableur. Il ne dispose donc pas d’outil de visualisation.
Pour ce faire, on utilisera « web-palo » et « Palo client » ou bien les plugins Excel et OpenOffice.
o
Le serveur étant installé, il doit être l’alimenté
o
o
Un ETL dédié est fourni avec la solution
Il est possible de mettre en œuvre des jobs Talend ou Kettle pour l’alimenter.
Le serveur alimenté, on connectera les clients mentionnés pour produire les analyses.
Licence
Notes
GPL
Le serveur est sous licence GPL, mais pas le plugin Excel.
La version 1.0 limitait l’usage à un seul utilisateur
Pour rester dans le domaine OpenSource, il reste la solution du plugin OpenOffice.
Suite à l’installation du serveur, celui-ci doit être alimenté par extraction et mise en forme des
données. Cette étape est assurée au choix par un ETL fourni par JEDOX ou par les ETL génériques
Talend ou Kettle.
Notons que cette étape structurante nécessite une bonne connaissance du cube attendu et produit.
La documentation reste actuellement limitée, malgré la richesse fonctionnelle de la solution.
Ce document est sous licence GNU Free Documentation Licence.
Page 41/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
5.3.1 Roadmap, évolutions futures
Une des grandes originalités de cette solution OpenSource, réside dans sa fonction write back :
L’utilisateur a la possibilité de renseigner ses propres valeurs dans le cube au croisement des
occurrences d’axes qu’il a sélectionnées. Cela permet donc de mettre en perspective des valeurs
prévisionnelles avec la réalisation de la société dans le temps.
On pense donc naturellement au processus d’élaboration budgétaire. C’est d’ailleurs ce qu’affirme la
société JEDOX, qui se positionne clairement sur cet aspect métier du contrôle de gestion.
Enfin, La solution de JEDOX est utilisée par SAP pour l’élaboration du reporting sur les données
gérées par l’ERP.
JEDOX est donc devenu un « partenaire naturel » de SAP.
Le cube se transforme alors en un cube HOLAP, permettant une première analyse sur les données
agrégées dans un cube MOLAP, puis une analyse plus fine par accès direct aux données sources.
Cet aspect est actuellement réservé à l’intégration dans SAP.
Sa disponibilité en OpenSource ne nous a pas été communiquée
La société JADOX travaille également sur une interface utilisateur pour la conception du processus
d’alimentation.
Cette évolution, ainsi que quelques autres sont attendues pour la fin de l’année 2008.
5.3.2 Mise en œuvre du serveur
Ci-dessous un exemple de représentation graphique de l’extraction effectuée sous Talend Open
Studio afin de répondre au besoin d’analyse de l’évolution des coûts de transports :
Ce document est sous licence GNU Free Documentation Licence.
Page 42/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
Une alternative à l’utilisation de Talend est de définir un « schéma d’alimentation », à l’instar du
« schéma d’interrogation » produit au chapitre précédent pour le cube MONDRIAN. Le schéma
d’alimentation produit va être mis en œuvre par l’ETL fournit par la société JEDOX. A son lancement,
« ETL-client » va lire ce fichier d’extraction, se connecter à la base relationnelle et alimenter le cube
PALO.
L’alimentation peut être planifiée et ainsi alimenter le cube PALO.
Cependant ce procédé nécessite de manipuler un fichier XML. L’évolution de la structure du cube
impliquera une définition de plus en plus complexe par le fichier XML.
La même fonctionnalité pourrait être obtenue plus aisément en utilisant les capacités d’alimentation de
cubes PALO par les ETL KETTLE ou TALEND.
L’outil « IMP :Palo » de la société Cubeware offre une interface utilisateur sous Windows, permettant
l’accès aux données relationnelles, leur extraction et agrégation afin d’alimenter le cube MOLAP. Par
contre, cet outil ne permet pas de produire un « schéma d’extraction » autonome. Les procédures
d’alimentation devront être exécutées par cet outil.
Schéma fonctionnel de l’ETL Client
Ce document est sous licence GNU Free Documentation Licence.
Page 43/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
5.3.3 Outillage d’interrogation et de simulation
La société JEDOX fournit un plugin Excel avec le serveur PALO. Ce plugin est complété par un
serveur de publication web de feuilles Excel compilées, accessibles ensuite depuis l’intranet de
l’entreprise. Cette solution ne nécessite pas l’installation du plugin sur les postes utilisateurs.
La société « Tensegrity Software GmbH » fournit un ensemble d’outils et une API, nécessaires à
l’interrogation des cubes PALO. Cet ensemble est dénommé JPalo.
5.3.3.1 Plugin Excel et OpenOffice
JEDOX fournit un plugin Excel, complément du tableur permettant l’extraction des données et leur
mise en forme pour la production du rapport final.
Il existe un plugin OpenSource pour le tableur de la suite OpenOffice
Ces plugins permettent l’interrogation et la construction de rapport depuis un tableur.
Item
ANALYSE
Plugins Excel et OpenOffice
Suite à l’installation des plugins dans les tableurs, il est possible de manipuler le cube PALO directement
Analyse
Utilisateurs :
des données agrégées
depuis un tableur Excel
ou OpenOffice.
Ces outils permettent de
produire
des
représentations
graphiques depuis les
données extraites
Public
Pré-requis
-
Connaissance des tableurs
DESCRIPTION
-
Depuis un tableur, permet alimenter les cellules avec les données agrégées présentes dans le cube.
-
o
La gestion des droits est faite sur le serveur (voir outillage Eclipse décrit précédemment)
o
Poste de travail ou mode partagé (mode web)
Après définition du login/mot de passe, l’utilisateur alimente les cellules depuis le cube
Possibilité de modifier les axes en utilisant les fonctions « copier-coller »
o
Licence
Notes
5.3.3.2
Propriétaire pour le plugin Excel, GPL pour le plugin OpenOffice
Les plugins ont le même usage et les mêmes propriétés
Les limitations sont liées aux différences des tableurs
La migration de Microsoft Office vers la suite OpenOffice est à étudier plus globalement que pour ce
seul usage.
Palo Worksheet Server
« Worksheet Server » est une solution de publication de documents Excel. Le serveur peut s’installer
sous Linux comme sous Windows, et permet de publier les feuilles et classeurs produits sous Excel
dans un intranet.
L’installation sous Windows 2003 Server est simple.
Ce document est sous licence GNU Free Documentation Licence.
Page 44/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
Lors du premier accès aux pages Excel compilées et déployées, il est nécessaire de définir les
utilisateurs autorisés à y accéder.
Ci-dessous un exemple d’analyse des marges, limitée à l’année 2007 pour les Pays-Bas. Il est
possible de définir des zones modifiables par l’utilisateur, afin de permettre une prévision.
5.3.3.3
Excel Designer
« Excel Designer » est la feuille Excel permettant la compilation (au format XML) du classeur Excel à
publier.
Suite à la compilation du classeur, le fichier XML généré sera déployé sur « Worksheet Server » pour
permettre la visualisation et les analyses prévisionnelles.
Le lien avec le serveur PALO, présent dans la feuille Excel, est conservé dans la page générée et
publiée. La fonction « write back » est intégrée, permettant les analyses prévisionnelles.
Ce document est sous licence GNU Free Documentation Licence.
Page 45/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
5.3.3.4
web-palo
La société Tensegrity fournit « web-palo », interface web qui permet de visualiser mais aussi de
modifier les données pour réaliser des simulations dans une vue du cube PALO.
Cette interface permet aussi d’accéder à d’autres cubes accessibles par le protocole XMLA. On peut
donc visualiser les cubes de SAP BW, de MS SQL Server 2000/2005 et de Mondrian.
Item
ANALYSE
WEB-PALO v2.0
Permet la consultation en mode web des données agrégées dans le cube MOLAP Palo Server
Public
Utilisateurs : L’accès en
mode web au serveur
PALO
permet
la
consultation
et
la
modification (fonction «
write-back ») des données
Pré-requis
-
Serveur TOMCAT
Serveur PALO
Navigateur internet
DESCRIPTION
-
-
L’installation se compose d’une application java J2EE à déployer dans un serveur Tomcat
o
Les droits d’accès à l’interface se configurent directement sur le serveur web
o
o
Les cubes (PALO, Mondrian, SAP ou Microsoft Analysis Services) peuvent être accédés
Le poste de travail ne nécessite qu’un navigateur pour accéder aux données
Navigation dans le cube à partir de l’interface web
o
Permet de modifier les axes et les mesures d’analyse par simple « drag & drop »
Licence
Notes
A clarifier par l’éditeur Tensegrity Software
L’interface ne permet pas l’ajout de colonnes calculées à l’instar d’un véritable tableur
Il est possible de modifier ou de filtrer les valeurs des cellules afin de faire des analyses prévisionnelles
Par « glisser-déposer », il est possible de modifier les axes d’analyse de nos coûts de transport.
L’interface permet aussi (suivant les droits attribués à l’utilisateur connecté) de modifier les données
affichées.
Ce document est sous licence GNU Free Documentation Licence.
Page 46/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
5.3.3.5
Palo client
La société Tensegrity fournit « Palo client », application sur plate-forme Eclipse permettant
d’interroger les cubes PALO ainsi que les bases accessibles par le protocole XMLA, soit SAP BW, MS
SQL Server 2000/2005 et Mondrian.
Item
ANALYSE
PALO Client v2.0
Permet la consultation en mode « client lourd » des données agrégées dans un cube par le langage MDX
Public
Utilisateurs : L’accès au
serveur PALO permet la
consultation
et
la
modification (fonction «
write-back ») des données
Pré-requis
-
JVM
Serveur PALO
DESCRIPTION
-
L’application réalisée se compose d’une application Eclipse
o
o
-
Les cubes (PALO, Mondrian, SAP ou Microsoft Analysis Services) sont accessibles
Le poste de travail ne nécessite que l’installation d’une JVM
Navigation dans le cube à partir de l’application
o
o
Licence
En accès « administrateur » permet de gérer les droits d’accès
Permet de modifier les axes et les mesures d’analyse par simple « drag & drop »
A clarifier par l’éditeur Tensegrity Software
Ce document est sous licence GNU Free Documentation Licence.
Page 47/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
Item
ANALYSE
Notes
L’interface ne permet pas l’ajout de colonnes calculées à l’instar d’un véritable tableur
Il est possible de modifier ou de filtrer les valeurs des cellules afin de faire des analyses prévisionnelles
On obtient une vue du cube, identique à sa visualisation en mode web :
5.3.3.6
Palo Java API
La solution de Tensegrity est complétée par les API « Palo Java API » permettant le développement
d’application Java.
5.3.3.7
myBIQ, solution de CPM
« myBIQ » est une solution OpenSource dédiée aux cubes PALO pour l’élaboration budgétaire et plus
vastement le CPM (Corporate Performance Management). Elle permet la consolidation de données et
se présente sous forme de tableaux de bord adressables à une direction générale.
La société éponyme fournit des cubes PALO pré structurés pour l’extraction des axes et indicateurs
nécessaires dans une interface dédiée. Depuis celle-ci, il est alors possible de comparer des
évolutions de marges, des volumes, des résultats de filiales, ….
L’alimentation des cubes se fait au moyen de « Pentaho Data Integration », l’ETL anciennement
nommé Kettle qui possède lui aussi un connecteur PALO.
Ce document est sous licence GNU Free Documentation Licence.
Page 48/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
5.4
SYNTHESE DES CUBES OLAP
Les deux familles de cubes ROLAP et MOLAP représentées par Mondrian et par Palo possèdent
toutes deux leur propre outillage d’interrogation.
Le choix de l’une ou l’autre solution doit être fait selon les besoins des utilisateurs finaux et la capacité
d’intégration des équipes techniques. Pour Mondrian, un gros effort doit être fait par celles-ci pour
appréhender les mécanismes de fonctionnement et d’intégration ainsi que l’écriture de schéma de
description.
Des solutions de modélisation de ces schémas existent, mais restent encore peu intuitives. On verra
plus bas que « BPM Conseil » et « Pentaho » ont axé des efforts de développement dans ce sens.
Pour Palo, l’effort se situe dans la création de scripts d’alimentation, l’usage étant simplifié par les
interfaces, en mode web ou en mode tableur.
Fonction majeure
MONDRIAN (JPalo, JRubik)
PALO (web-palo, plugins Excel et
OOffice)
Déclaration des sources de données, des
axes et indicateurs, de colonnes
calculées supplémentaires
La conception du « schema XML » se fait
avec l’un des outils dédiés présentés plus
haut.
La définition des sources de données
se fait dans l’ETL utilisé. Soit fourni
par Jedox, soit Talend ou Kettle.
Sécurité –
données
Cette fonctionnalité n’existe pas dans les
outils clients. Elle sera gérée par le portail
et permettra de donner un accès à
l’intégralité d’un cube.
Les outils clients doivent se
connecter au serveur Palo par
identifiant/mot de passe limitant
l’accès à un périmètre autorisé.
gestion
des
accès
aux
Il est possible de définir le périmètre
d’accès aux données à un utilisateur au
moyen d’un cube virtuel. Ce dernier est un
sous élément d’un cube sur un périmètre
plus large, limité au choix des dimensions
et des mesures.
Un cube virtuel ne peut actuellement pas
proposer un sous-ensemble de données
dans une dimension ou une mesure.
Un cube virtuel peut par contre proposer
une vue agrégée de plusieurs cubes.
Mode de consolidation des indicateurs
Les fonctions d’agrégation « sum »,
« count »,
« distinct-count »,
mathématiques « min », « max » et de
statistiques « avg », sont disponibles.
Les fonctions d’agrégation « sum » et
« count » sont disponibles
Gestion des dimensions récursives
Cette fonctionnalité n’existe pas
Cette fonctionnalité n’existe pas
Gestion avancée de la dimension temps
Ces fonctions sont disponibles à condition
d’être conçues à l’origine dans le cube lors
de sa définition.
Par son ETL dédié, PALO propose
un mode d’agrégation automatisé
lors de l’extraction des données.
Elaboration d’un rapport
Mise en forme succincte
depuis les outils clients.
Aucune mise en forme par défaut.
Doit être assurée par l’utilisateur
après export dans un outil tiers
(tableur, document texte)
directement
Peut être amélioré en passant par un
tableur externe.
Ce document est sous licence GNU Free Documentation Licence.
Page 49/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
Fonction majeure
Modalités
différentiel
d’alimentation
MONDRIAN (JPalo, JRubik)
full
PALO (web-palo, plugins Excel et
OOffice)
ou
Uniquement alimentation « full »
dans la version 1.5 du serveur
Accès au détail
Implémentation des normes XML/A ou
MDX
Le
détail
est
limité
à
la
« profondeur » de l’extraction. Le
serveur en version 1.5 n’accède
jamais directement aux données de
la base relationnelle. (sauf sur SAP
depuis
l’implémentation
du
connecteur)
Les deux modes sont disponibles :
soit le cube est interrogé directement en
MDX,
soit on y accède
webservice en XML/A
au
les
d’un
Navigation (drill down, slice and dice)
Fonctionnalité fournie
JPivot, JRubik.
clients
Fonctionnalité fournie par les clients
et depuis un tableur.
Vision de l’information (Liste, Tableau
croisé, Graphes à barre, radar,
histogramme …)
Les
outils
clients
proposent
la
représentation des données au moyen de
quelques graphiques de base.
Aucune sortie possible depuis le
client web.
Filtre, couche
L’outillage client propose l’application de
filtres
L’outillage client propose l’application
de filtres
Ajout de calcul
Uniquement lors de la définition du
schéma d’un cube. Pas à l’usage, sauf si
l’utilisateur l’exporte dans Excel (il perd
cependant le côté dynamique de la
consultation)
Fonctionnalité des tableurs
Mise en forme de rapports
Simplifiée depuis JPivot
Ce document est sous licence GNU Free Documentation Licence.
par
travers
Le client « web-palo » utilise le
protocole XML/A pour se connecter
aux différents cubes, dont PALO.
Toutes les fonctionnalités offertes par
les tableurs Excel et OOffice sont
disponibles.
Page 50/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
6 LES SOLUTIONS SPECIFIQUES DE PILOTAGE
Les tableaux de bord permettent à une direction métier d’avoir accès à des données totalement
agrégées, lui présentant des tendances, des écarts par rapport aux objectifs fixés.
Suite à la remontée de ces indicateurs, une analyse plus fine pourra être élaborée par des
opérationnels plus impliqués localement.
Les mots clés rencontrés dans cette forme de reporting sont « KPI » (Key Performance Indicators),
« dashboards », « tableaux de bord synthétiques ».
Dans les plateformes SpagoBI, JasperServer et Pentaho décrites au chapitre suivant, des tableaux de
bord synthétiques sont implémentés au moyen de développements spécifiques.
Pentaho propose ainsi des pages JSP configurées au moyen de fichiers en XML.
SpagoBI produit des tableaux de bord en flash à partir de script « groovy »
JasperServer dans sa version Pro intègre un designer de dashboard dynamique interne au portail
facilitant la mise en place de ceux-ci.
BPM Conseil propose une solution dédiée au suivi des indicateurs clés. On se reportera avec intérêt
au chapitre présentant cette plateforme et son outil dédié aux KPI, « FreeMetrics ».
Ces solutions ne comportent pas d’outillage dédié à la production de tableau de bord.
L’outillage dédié est obtenu par la mise en œuvre des outils OpenI ou de MarvelIT. BPM Conseil
propose un outil dédié à la gestion des KPI, solution la plus aboutie actuellement en OpenSource
dans ce domaine.
MarvelIT est une solution volontairement simplifiée, n’ayant pas d’autre fonction que de remonter des
données synthétiques sous forme de graphiques, à des utilisateurs qui ne souhaitent pas connaître le
détail des données.
OpenI va plus loin en présentant les résultats de requêtes XMLA sous forme de graphiques.
L’utilisateur pourra également poursuivre l’analyse grâce à JPivot.
Pour une plateforme plus complète, il faudra mettre en œuvre les solutions décrites au chapitre 7
Ce document est sous licence GNU Free Documentation Licence.
Page 51/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
6.1
MARVELIT
MarvelIT est une société américaine basée sur la côte ouest d’Amérique du Nord, à Poway non loin
de San Diego.
Elle édite une solution Open Source qui permet depuis une interface web, de consulter des tableaux
de bord sous forme de graphique. Les graphismes peuvent être imbriqués, permettant ainsi une
navigation au travers des données agrégées graphiquement.
Les graphes sont basés sur JasperReport/JFreeReport et permettent les types de restitution compris
dans la librairie.
Dans le graphe de gauche présenté en exemple, la jauge illustre que le volume de marge, indicateur
stratégique, est en avance par rapport aux objectifs.
Dans le graphe de droite présenté en exemple, les volumes de ventes sont répartis par tranches
d’âge. Il est possible, en cliquant sur un segment en couleur, d’obtenir un nouveau graphique
présentant, pour cette tranche d’âge, la répartition des produits vendus en sous catégories.
Les utilisateurs finaux n’ont accès qu’à une visualisation et à la navigation au travers des graphiques.
Ce document est sous licence GNU Free Documentation Licence.
Page 52/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
A un autre niveau d’utilisation, il est possible de changer de base de données, permettant ainsi de
produire des comparaisons d’indicateurs sur des SID (Système d’information décisionnel) différents.
Pour les développeurs, tous les paramètres de configuration sont accessibles en mode web, une
fonctionnalité fort appréciée pour la maintenance et le développement. Cela permet d’éviter l’accès
direct au serveur, nécessaire à la modification des divers fichiers de configuration au format XML.
Item
PILOTAGE
Dash v2.12
Présentation graphique d’indicateurs
Public
Utilisateurs : Accès à
des données agrégées,
présentées sous forme de
graphiques
Pré-requis
-
Plate forme Tomcat 5
Langage SQL
DESCRIPTION
-
-
La solution repose sur un portail de type JSR168, permettant la gestion de portlets
o
Déploiement de l’archive sur le portail
o
o
Définition des formats graphiques et des requêtes d’extraction des données nécessaires
Administration simplifiée directement depuis les portlets
Utilisation
o
Accès en mode web aux indicateurs et graphiques
o
o
Couvre les besoins de reporting synthétique
Semblable à un reporting de masse, accessible à la demande en mode web
Licence
Notes
6.1.1
GPL
Parmi les évolutions attendues, il y a le portage sur les autres portails JSR 168 tels que Liferay et
WebSphere.
Il manque à la solution, une capacité d’export vers le format PDF ou HTML afin de permettre
l’impression des graphiques souhaités.
« Roadmap », évolutions futures
Les évolutions prévues intègrent une interface de configuration des rapports, qui se formatent
actuellement avec du code « xml » saisi manuellement.
Il est prévu également d’utiliser d’autres moteurs de rendu graphique que JFreeChart utilisé
actuellement.
Les développeurs ont également prévus de valider l’intégration de MarvelIT avec tous les portails
compatibles à la norme JSR168.
Enfin, MarvelIT a prévu de créer une version payante, sans faire disparaître toutefois la version
librement téléchargeable.
6.1.2 Outils disponibles dans la plateforme
Les outils « JasperReport » et « JFreeChart » sont les composants techniques de la solution. Pour
aller plus loin, voir leur analyse individuelle en supra.
Ce document est sous licence GNU Free Documentation Licence.
Page 53/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
6.2
OPENI
« OpenI » est une solution légère, facilement déployable sous Tomcat ou JBoss, pour peu que l’on
sache administrer ce type de serveur.
L’objectif de la solution est de présenter un portail simplifié, présentant les résultats de requêtes
XMLA (accès aux données du cube Mondrian ou Microsoft Analysis Services) sous forme de
graphiques dans la page d’accueil de l’utilisateur. Un « clic » sur un graphique permet d’accéder aux
données extraites du cube et de poursuivre l’analyse grâce à JPivot.
La gestion des utilisateurs se fait au moyen des « projets », pour lesquels deux profils sont définis,
l’administrateur du projet qui pourra gérer les sources de données et les utilisateurs, l’autre profil
concernant les utilisateurs.
Un « super administrateur » permet de gérer l’ajout, la suppression des projets.
Item
PILOTAGE
OPENI v2.0
Présentation graphique d’analyses sur hyper cubes
Utilisateurs :
Présentation
graphique
des résultats de requêtes
XMLA
Public
Pré-requis
-
Plate forme Tomcat 5
Langage SQL
Langage XMLA
Langage XML
DESCRIPTION
-
-
La solution repose sur un portail de type JSR168, présentant les résultats de requêtes XMLA sur les hyper cubes
implémentant cette technologie :
o
SAP
o
o
Mondrian
Microsoft Analysis Services
Utilisation
o
o
Accès en mode web aux résultats graphiques
Par sélection, accès aux données et à un navigateur JPivot pour parcourir l’ensemble des données remontées
Licence
Licence OPLv1.0 (Licence Mozilla adaptée par la société Loyalty Matrix )
Notes
Projet « à surveiller », qui redémarre suite à une longue période d’inactivité.
Le projet « OpenI » a été lancé en 2005. Sponsorisé par la société « Loyalty Matrix », il a été repris
par la société « Responsys » lors de l’absorption de la société à l’origine du projet.
En aout 2008, le projet reprend après une année d’interruption.
A noter que ce projet est la première intégration de JPivot avec Mondrian.
De part sa « simplicité », il reste une solution simple et élégante, mais malgré tout limitée à la
restitution de données extraites d’un cube OLAP.
Ce document est sous licence GNU Free Documentation Licence.
Page 54/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
Ci-dessous une copie d’écran de l’interface de visualisation d’un cube Mondrian depuis la plateforme.
Ce document est sous licence GNU Free Documentation Licence.
Page 55/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
L’onglet « chart » permet d’avoir accès à une représentation graphique de l’extraction de données
souhaitée par l’utilisateur.
6.2.1 Outils disponibles dans la plateforme
Les outils « JasperReport », « JFreeChart » et « JPivot » sont les composants techniques de la
solution. Pour aller plus loin, voir leur analyse individuelle en supra.
Ce document est sous licence GNU Free Documentation Licence.
Page 56/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
6.3
SYNTHESE DES TABLEAUX DE BORD
Les solutions proposée par MarvelIT et d’OpenI se différencient dans les besoins qu’elles adressent et
les solutions qu’elles proposent.
MarvelIT s’est surtout intéressée aux « dashboards » permettant d’obtenir des graphiques imbriqués
dynamiquement ou l’accès aux données sous jacentes aux représentations.
Le principal intérêt de cette solution est sa légèreté. Son autre avantage est de simplifier la création
de ce type de rapports, complexes sous Pentaho ou SpagoBI.
OpenI propose une solution simple d’accès aux cubes OLAP grâce au langage XMLA. L’émergence
du langage JBDC4Olap remettra peut être en cause l’intérêt pour cette solution légère.
On verra plus bas que BPM Conseil propose un outil dédié à la gestion des KPI « FreeMetrics ». On a
vu que les autres solutions ne proposent pas la gestion de workflow autour des indicateurs, ni de
créer des alertes en cas d’atteinte d’un seuil.
Ce document est sous licence GNU Free Documentation Licence.
Page 57/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
7 LES SUITES BI OPENSOURCE - INDUSTRIALISER LES SID
Les Systèmes d’Informations Décisionnelles (abrégées SID) seront industrialisés au moyen de
plateforme.
Ces solutions complètent les outils vus précédemment individuellement ou les portails dédiés aux
« dashboards ». Elles sont plus lourdes à mettre en œuvre mais permettent une industrialisation de la
production et de la consommation.
L’accès aux différents outils et aux périmètres de données peut être défini par utilisateur ou par
groupes utilisateurs.
L’accès à la plateforme s’intègre généralement dans un processus d’authentification partagé par
d’autres applications permettant ainsi l’implémentation du SSO.
La plateforme comprendra souvent une interface de gestion de l’ETL, la configuration d’accès aux
données, le paramétrage des destinataires avec la mise en place de tâches planifiées.
) Les plateformes s’articulent autour de portails permettant une centralisation des accès et un
niveau plus fin de définition des périmètres de données accédées. Le portail peut s’intégrer dans
l’intranet de l’entreprise et permettre un accès centralisé aux différentes applications web.
) Les accès centralisés rendent possible la gestion du SSO et agrègent des outils complémentaires
à la conception et la production de rapports.
Représentation des données au travers d’une couche d’abstraction permettant la conception de
reporting « adhoc »
Planification de la production des rapports, indépendamment des mécanismes de planification de
l’infrastructure.
)
La consommation des rapports passant par une interface centralisée, le suivi de cette
consommation pourra être mesuré. Cela renseignera les équipes techniques sur l’usage des outils et
pourra permettre la mise en place d’une facturation sur le volume consommé.
Ce document est sous licence GNU Free Documentation Licence.
Page 58/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
7.1
LA SUITE PENTAHO
Pentaho est une plateforme BI, éditée par la société éponyme basée à Orlando, créée par des
consultants ayant évolués précédemment autour des solutions BI proposées par IBM, Business
Objects, Oracle, Cognos, SAS et Hyperion.
La plateforme regroupe les briques OpenSource nécessaires à l’extraction des données (ETL par
Kettle), leur mise en forme et leur restitution.
Item
INDUSTRIALISER
PENTAHO v1.7.0
La plate forme Pentaho permet d’agréger les outils BI de restitution et d’analyse exposés plus haut. Elle permet nativement
de définir les accès aux bases de données pour JFreeReport et de permettre la planification et l’envoi de rapport. Pour les
autres types de rapport, quelques fichiers de configuration restent à modifier.
Public
MOE :
Gestion des
accès,
répartition
en
profils « concepteur » ou
« utilisateur »
Planification
de
la
diffusion des rapports pré
paramétrés
Utilisateurs : Conception
simplifiée de rapports pré
paramétrés
Conception de rapports
« ad-hoc »
Analyse par JPivot de
cubes ROLAP Mondrian
Pré-requis
-
JVM
Serveur Tomcat ou JBoss
Mécanisme d’authentification centralisé (LDAP,
lemonLDAP,…)
DESCRIPTION
-
A partir d’un seul environnement web, avoir accès aux composants BI les plus aboutis :
o
Dans l’extraction des données (pilotage de Kettle)
o
Dans la conception et la production de rapports
o
Dans l’analyse des données en ROLAP (Mondrian)
o
Dans l’exécution d’algorithmes de data mining (Weka)
Licence
Notes
Pentaho BI Platform -> GPLv2
Pentaho Data Integration (Kettle) -> LGPL
JFreeReport -> LGPL
Pentaho Analysis Services (Mondrian) -> CPL
Pentaho Data Mining (WEKA) -> GPL
Utilise le portail JBoss Portal essentiellement
Ce document est sous licence GNU Free Documentation Licence.
Page 59/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
7.1.1 Intégration dans un portail
La plateforme Pentaho est nativement intégrée dans « JBoss Portal ». Une intégration dans
« Liferay », autre portail répondant à la norme JSR168 existe apparemment, mais sans
documentation explicite de mise en œuvre.
7.1.2 Gestion des accès et des utilisateurs
Les utilisateurs sont répartis en deux groupes de « concepteurs » et d’ « utilisateurs ».
L’authentification se fait directement dans la plateforme Pentaho, sans reposer sur les fonctionnalités
apportées par le portail. Dans la version commerciale, il est fourni une console d’administration des
utilisateurs.
En mode « Communauté », la gestion se fait au moyen d’un fichier de configuration.
7.1.3 Outillage dédié
7.1.3.1
Conception de rapports
La conception de rapport se fait depuis une interface graphique dédiée, « Pentaho Report Designer ».
Item
CONCEPTION
Pentaho Report Designer v1.7.0
Client Java permettant la conception graphique d’un rapport de type JFreeReport pour Pentaho. Produit un fichier de
description au format « *.report » ou « *.xaction + *.xml »
Public
Permet
la
MOE :
conception de reporting
généré par les librairies
JFreeReport
Pré-requis
-
Client « lourd » supposant une JVM
Paramètres de connexion à la base de données
Langage SQL (pour la conception de requêtes)
Langage Java (pour affiner la conception)
Langage XML (pour comprendre les fichiers « xml
», « report », « xaction » produit)
DESCRIPTION
-
-
Interface graphique sous Java, indépendante de la plate forme. Elle produit un fichier de type « *.report » (résultat de
l’agrégation d’un fichier « *.xaction » et d’un fichier « xml »)
o
Interface simpliste
o
Positionnement des éléments en X-Y
o
o
Mode visualisation permettant de pré visualiser le rapport final sous plusieurs formats
Publication direct sur la plateforme Pentaho
Conception en mode « drag & drop »
o
o
Licence
Les outils et les champs de formats différents se glissent et se déposent sur la page de conception
La définition de la connexion à la base de données est interne au fichier de conception produit
MPL (Mozilla Public License) v1.1
Ce document est sous licence GNU Free Documentation Licence.
Page 60/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
Item
Notes
CONCEPTION
Les paramètres de connexion à la base de données sont internes à la définition du rapport dans le
fichier report ou xaction.
Les images ne sont pas intégrées dans le « report » ou dans le « xaction » (chemin indiqué dans le
fichier)
Production des graphes gérée par la librairie JFreeChart sous licence LGPL
Ce document est sous licence GNU Free Documentation Licence.
Page 61/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
7.1.3.2 Conception des fichiers « xaction »
Les fichiers « xaction » vont compléter les fichiers de définition du format et des données du rapport à
produire.
Le fichier « xaction » contient en effet des actions qui vont se dérouler lors de la création du rapport.
On peut alors voir ce dernier comme un « patron » décrit dans le « xml », complété lors de sa
génération par des éléments provenant d’une extraction de données, réalisées avant la diffusion.
Pentaho Design Studio est l’environnement de « développement » de Pentaho.
Cet outil permettra la mise en place complète des actions à effectuer via la configuration avancée des
fichiers « xaction ».
Item
ENVIRONNEMENT DE DEVELOPPEMENT
Pentaho Design Studio 1.7.0
Interface graphique sous Eclipse, permet la configuration avancée des fichiers « xaction »
Public
MOE :
Configuration
des actions à effectuer,
paramétrage avancée des
éléments à exécuter
Pré-requis
-
Client « lourd » supposant une JVM
Paramètres de connexion à la base de données
Langage SQL (pour le requêtage SQL)
Langage JavaScript (pour affiner la conception)
Langage MDX (pour le requêtage MDX)
Langage XML (pour comprendre le fichier «
xaction »)
DESCRIPTION
-
-
Suite à l’accès à la liste des éléments du serveur :
o
Visualisation de l’ensemble des fichiers et plus particulièrement des fichiers « xaction » paramétrable au travers
de quatre onglets
ƒ
Onglet « General », première phase du paramétrage permet de donner entre autre un titre, une
description, une icône et de gérer le niveau de log
ƒ
Onglet « Define Process », cœur de la configuration du « xaction ». Permet de gérer les valeurs
d’entrées sorties, le paramétrage et la succession des processus ainsi que la planification et l’envoi de
masse.
ƒ
Onglet « XML Source », permet de visualiser le contenu du fichier XML paramétré. La modification
manuelle du fichier dans cet onglet est possible.
ƒ
Onglet « Test », permet de tester le processus créé
Aspect MOE :
o
Solution nécessitant une bonne connaissance de l’outil et du mécanisme des fichiers « xaction »
Licence
Notes
EPL
Outil très complet permettant un paramétrage très poussé des actions au sein de la plateforme Pentaho.
Ce document est sous licence GNU Free Documentation Licence.
Page 62/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
Ci dessous un exemple de l’interface de configuration des fichiers « xaction »
Cette fonctionnalité est employée lors de la « diffusion de masse » permettant ainsi de redéfinir le
périmètre d’une requête selon le profil d’un utilisateur.
Cela permet aussi de personnaliser le rapport définitif avec un entête, un pays … selon le destinataire.
On retrouvera ces fichiers « xaction » dans toutes les formes de reporting gérées par Pentaho. Pour
compléter les méthodes qu’il contient, il est nécessaire d’utiliser le client lourd « Designer Studio ».
Les fichiers produits au format « xml » décrivent divers actions telles que la planification, les requêtes
à produire lors de la mise en œuvre, la personnalisation.
Il est ainsi possible de définir un seul rapport, puis de le diffuser à différents utilisateurs, chacun de
ceux-ci recevant par mail un rapport executé sur un périmètre de données différent.
On planifiera l’exécution du fichier « xaction », qui comprendra par exemple, à partir d’un rapport
générique :
►
►
►
►
►
Extraction des données spécifiques au destinataire
Intégration de ces données dans le rapport
Ajout d’une personnalisation par un entête
Diffusion
Prise en compte d’un nouveau destinataire, retour à l’étape 1
Ce document est sous licence GNU Free Documentation Licence.
Page 63/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
Schématisation des composants mis en œuvre dans la production du fichier « xaction »
Ce document est sous licence GNU Free Documentation Licence.
Page 64/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
7.1.4 Rapports « ad hoc »
La conception des rapports « ad hoc » depuis la plateforme met en œuvre la solution dédiée « AdHoc
Reporting ». Un outil dédié et externe à la plateforme « Pentaho Metadata Editor » permet aussi cette
conception. Nous le détaillerons par la suite, dans le chapitre des outils complémentaires offerts par la
suite Pentaho.
Dans un premier temps, l’interface permet la visualisation des vues métiers disponibles, puis le choix
parmi des gabarits de présentation.
La construction de ces gabarits est réalisée via des fichiers XML et AdHoc Reporting ne propose
qu’une restitution sous forme de liste.
A l ‘étape suivante (sélection des objets) la visualisation des champs fonctionnels des différentes
tables permet de sélectionner les colonnes à croiser entre elle afin d’extraire les données à mesurer.
Il est possible de choisir les colonnes de regroupement, les colonnes du corps du rapport, les
colonnes qui ne seront utilisées que pour le filtrage de données au moyen d’un glisser déposer ou
d’une affectation par icônes (flèches).
L’étape personnalisation donne accès à un panel d’éléments dédiés à chaque champ en fonction de
leur type.
Ce document est sous licence GNU Free Documentation Licence.
Page 65/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
Outre la fonction de comptage propre à tous types de champs, les champs de type date bénéficient de
quatre différents formats. Les champs numériques sont complétés par des fonctions de calcul et de
statistiques telles que « somme », « minimum », « maximum » et « moyenne ».
Il est également possible d’ajouter des contraintes sur les colonnes visualisables et sur les colonnes
de filtrage ainsi que de faire des classements par ordres croissants ou décroissants.
La dernière étape de personnalisation est la première phase de l’étape de mise en page permettant
de choisir un alignement spécifique pour chaque champ.
La mise en page en elle même regroupe les options suivantes:
9 Orientations en mode portrait ou paysage
9 Description du rapport
9 Gestion de l’en-tête et pied de page
Par un bouton accessible, on peut générer le rapport définit pour valider son aspect et son contenu.
Plusieurs formats d’exportations sont disponibles :
9
9
9
9
PDF
HTML
Excel
CSV
L’enregistrement du rapport se fait dans une des rubriques de la plateforme Pentaho.
Les utilisateurs autorisés peuvent ensuite le générer directement ou l’éditer pour modifications,
suivant leurs droits attribués.
Ce document est sous licence GNU Free Documentation Licence.
Page 66/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
7.1.5 Outils disponibles dans la plateforme
Les outils « JasperReport », « Birt », « JPivot » et « Mondrian » sont les composants techniques de la
solution. Pour aller plus loin, voir leur analyse individuelle en supra.
Elle intègre de plus les composants « Weka » pour le datamining et « Quartz » pour la planification.
L’étude de ces composants n’est pas réalisée dans ce livre blanc.
7.1.6 Outils complémentaires
Kettel est intégré dans la plate forme. Ceci permet d’en gérer les tâches directement dans
l’environnement BI.
7.1.6.1
Pentaho Metadata Editor
L’outil « Pentaho Metadata Editor » permet de configurer les « vues métiers » nécessaires au
reporting Ad Hoc de Pentaho. Un utilisateur « technique » ayant les droits d’accès aux données
physiques, élabore des sous ensemble de données fonctionnelles.
Cette conception se fait, suite à la définition de la connexion ainsi qu’après avoir renommé les champs
techniques en champs fonctionnels, par glisser/déposer dans l’espace de travail.
Item
CONCEPTION DE VUES METIER
Pentaho Metadata Editor 1.7.0
Conception graphique des vues métier
Public
MOE : Conception de
vues métier, pour mise à
disposition d’utilisateurs
Pré-requis
-
JVM
Accès aux données physiques
Langage SQL
DESCRIPTION
-
-
Depuis une interface graphique
o
L’utilisateur se connecte à plusieurs sources de données
o
Les vues sont nommées fonctionnellement
o
Un descripteur « xmi» est généré, contenant les paramètres de connexion aux bases, les données à extraire et
le nom fonctionnel à employer.
o
Il est possible d’ajouter un filtrage des données pour restreindre le périmètre suivant l’utilisateur.
Solution simple à mettre en œuvre.
o
Le déploiement se fait par remplacement du précédent fichier de configuration de la plateforme pour une mise à
disposition automatique. Le redémarrage n’est pas nécessaire mais il faudra disposer des droits d’administration
pour rafraîchir la configuration.
Licence
Notes
MPL
La vue métier produite peut être directement déployée dans la plateforme Pentaho
Ce document est sous licence GNU Free Documentation Licence.
Page 67/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
Ci dessous un exemple de l’interface de définition des metadatas
7.1.7
« Roadmap », évolutions futures
En fin d’année 2008, il est prévu par l’éditeur que le développement de Pentaho intègre la conception
d’interfaces orientées utilisateur pour la conception de reporting « ad hoc », sans compétence SQL.
Plusieurs sources de données différentes devraient aussi pouvoir être intégrées dans le même rapport
(voir plus haut les limitations de JasperReport sur ce point).
Pour les équipes techniques, il est aussi prévu des interfaces plus évoluées permettant la conception
plus aisée de vues métiers et de « dashboard ».
Concernant l’administration, les cubes OLAP ne sont pas oubliés car ils devraient être plus facilement
déployés et interrogeables dans les futurs versions.
Toutes ces évolutions sont indiquées par Pentaho, sans précision sur la date de sortie.
Ce document est sous licence GNU Free Documentation Licence.
Page 68/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
7.2
LA SUITE SPAGOBI
SpagoBI est édité par la SSII italienne « Engineering Ingegneria Informatica » basée à Milan. La
solution se présente comme l’agrégation de composants BI et groupware sur le middleware Spago.
Cette solution présente l’avantage d’être totalement LGPL et de s’affranchir d’un portail particulier. On
peut ainsi déployer la solution sur Liferay, eXoPortal, JBoss Portal.
Elle intègre une gestion des droits utilisateurs évoluée, comprenant les développeurs, les testeurs et
les utilisateurs finaux (voir § 7.2.2)
Les documents (reporting, dashboard, …) peuvent être versionnés en attendant une validation de
leur publication.
Item
INDUSTRIALISER
SpagoBI v1.94
La démarche de la société EII est d’agréger des composants BI sur leur middleware SpagoBI
Public
MOE :
Gestion des
accès,
répartition
en
profils « concepteur »,
« testeur » ou « utilisateur
»
Planification
de
la
diffusion des rapports pré
paramétrés
Utilisateurs : permet
l’analyse OLAP,
la visualisation de
rapports pré paramétrés,
la construction de
reporting adhoc
Pré-requis
-
JVM
Compétences Java, J2EE
Langage XML (pour configuration)
Langage SQL (pour conception des rapports)
DESCRIPTION
-
A partir d’un seul environnement web, avoir accès aux composants BI les plus aboutis :
o
Dans l’extraction des données (pilotage de Talend)
o
Dans la conception et la production de rapports
o
o
Dans l’analyse des données en ROLAP (Mondrian)
Dans l’exécution d’algorithmes de data mining (Weka)
Licence
Notes
LGPL
SpagoBI se présente comme une interface BI intégrant le meilleur des composants de la communauté.
Le versionning et la gestion avancée des utilisateurs est un plus
La « non adhérence » à un portail spécifique rend cette solution plus souple dans son intégration à un
existant.
Ce document est sous licence GNU Free Documentation Licence.
Page 69/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
7.2.1 Portail
SpagoBI peut s’intégrer dans un portail d’entreprise répondant aux normes JSR 168 (intégration des
applicatifs BI dans des « portlets », permettant la customisation poussée de l’interface utilisateur.)
7.2.2 Gestion des accès et des utilisateurs
SpagoBI propose trois niveaux d’utilisateurs, « développeurs », « testeurs » et « utilisateurs ». Ceci
permet de concevoir et de tester des rapports, en incluant la gestion de numéros de version dans les
documents en cours de validation et/ou de développement.
L’authentification se fait dans le portail, avec « mapping » de l’utilisateur et de son rôle dans la
plateforme. Ceci permet un point d’authentification unique pour toutes les applications intégrées dans
le portail et de s’appuyer sur un mécanisme validé et déporté.
7.2.3 Outillage dédié
« QBE » (acronyme de Query By Example) est l’outillage spécifique à SpagoBI. Il permet la
conception de reporting « adhoc ».
L’outillage « QBE » (Query By Example) a pour objectif de permettre à un utilisateur non technique de
générer une requête.
Suite à la sélection des données, l’outil génère un rapport sous forme de tableau uniquement.
L’interface de QBE se compose de différents onglets regroupant les fonctionnalités suivantes :
9
9
9
9
9
9
9
9
Sélection des champs
Gestion des conditions
Gestion des classements
Gestion des regroupements
Visualiser la requête
Sauvegarder la requête
Exécuter la requête
Générer un template
Outre la sélection des champs qui s’effectue en un simple clic sur chacun d’eux, SpagoBI introduit un
mécanisme de visualisation des champs permettant de valider fonctionnellement les données
extraites.
Ce document est sous licence GNU Free Documentation Licence.
Page 70/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
Là où Pentaho dissocie chaque table, SpagoBI permet de visualiser les données de la « table de fait »
et d’avoir accès aux données de chaque table liée.
L’accès (non recommandé) aux tables unitaires reste possible néanmoins au moyen de jointures.
Lorsque la sélection des champs est effectuée, on peut ensuite :
9 Attribuer à chaque champ des fonctions de calcul et de statistiques tels que : Somme,
Minimum, Maximum et Moyenne.
9 Renommer les champs
9 Utiliser le mot clé « distinct » (langage SQL)
9 Changer leur positionnement
Dans la gestion des conditions tous les champs sont accessibles afin d’effectuer des filtrages ou des
jointures si cela est nécessaire.
Le tri sur les colonnes sélectionnées peut se faire en ordre croissant ou décroissant.
La gestion des regroupements (mot clé « group by » en langage SQL) ne sera réellement nécessaire
que si il existe des fonctions de calcul affectés à certaines colonnes.
La partie « visualisation de la requête » permet de visualiser la requête mais aussi de l’éditer
manuellement pour des profils techniques connaissant le langage SQL.
Le mode « par défaut » utilise la requête générée automatiquement, le mode expert permet d’éditer la
gérée et de la modifier.
La sauvegarde de la requête permet de l’éditer ultérieurement au sein de QBE.
La partie « exécuter » de la requête donne un aperçu du rendu final de la requête.
Ce document est sous licence GNU Free Documentation Licence.
Page 71/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
L’export est possible suivant les formats suivants :
9
9
9
9
9
9
9
PDF
HTML
Excel
CSV
RTF
XML
TXT
La dernière option est la création d’une vue. Cette vue regroupe l’ensemble des champs sélectionnés
et est accessible dans l’arborescence de l’onglet « Sélection des champs ». Elle peut être utilisée
pour générer d’autres rapports.
Le menu de génération des template permet de visualiser le rapport en PDF et de le sauvegarder
sous forme de fichier « jrxml ». Ceci permet une éventuelle reprise sous iReport.
SpagoBI n’intègre pas la gestion de multiple template comme Pentaho.
La configuration du seul template disponible se fait directement en XML et est réservée aux
utilisateurs « experts ».
Ce document est sous licence GNU Free Documentation Licence.
Page 72/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
7.2.4 Outils disponibles dans la plateforme
Les outils « JasperReport », « Birt », « JPivot » et « Mondrian » sont les composants techniques de la
solution. Pour aller plus loin, voir leur analyse individuelle en supra.
Elle intègre de plus les composants « Weka » pour le datamining et « Quartz » pour la planification.
L’étude de ces composants n’est pas réalisée dans ce livre blanc.
7.2.5
« Roadmap », évolutions futures
La version 2.0 est diffusée en version Alpha depuis la mi mai 2008 et met en avant une ergonomie
améliorée, ainsi qu’une simplification d’accès aux fonctions.
Du coté des nouveautés on notera :
Item
Nouveautés
Architecture
Certification Exo WebOS et Liferay
Certification JSR 168 / 286
Utilisation de SpagoBI comme une application Web non intégrée à un portail
Serveur
QbE Multi-schema
Gestion des Alertes
Moteur de recherche
Nouveau moteur GEO
Intégration de FreeAnalysis
Intégration de PALO/JPALO
Nouveau dashboards
Support de KPIs/Scorecards
Nouveau moteur de Data Mining
Outillage externe
SpagoBI Studio (plateforme de gestion et de déploiement de document BI)
SpagoBI Meta (constructeur de Meta données)
SpagoBI SDK
Ce document est sous licence GNU Free Documentation Licence.
Page 73/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
7.3
LA SUITE JASPER SERVER
La plateforme JasperServer est architecturée autour des librairies JasperReport. Elle offre la
configuration nécessaire (voir § 4.1.1.2 et la configuration externe d’accès aux bases de données) à la
production d’un rapport. Une gestion des accès et des périmètres utilisateurs est également
implémentée.
Il est possible de déployer directement sur la plateforme les rapports conçus sous iReport.
C’est une plateforme dédiée à la gestion et à la production de rapports JasperReport, ainsi qu’à la
gestion des cubes OLAP Mondrian avec JPivot. Cette plateforme n’intègre pas de capacité de
datamining.
Item
INDUSTRIALISER
JASPER SERVER v3.0
Plateforme décisionnelle permettant la conception et la visualisation de rapports JasperReport exclusivement.
Public
MOE : Conception de
rapports
depuis
la
plateforme en version Pro
Conception
de
«
dashboard » en version
Pro
Utilisateurs :
Visualiser
des
rapports
JasperReport.
Visualisation de cubes
OLAP
Visualisation
de
«
dashboard »
Pré-requis
-
Tomcat, JBoss
Navigateur web
DESCRIPTION
-
Solution intégrée permettant la mise à disposition centralisée de rapport JasperReport
o
Accès simplifié par périmètre accessible par utilisateur
-
Après authentification
o
o
Licence
Notes
L’utilisateur peut créer (version Pro) des rapports ou des dashboard
Chaque utilisateur accède à ses propres tableaux de bord
Deux types de licence. Une version « communauté », en GPL et une version commerciale.
La solution n’intègre pas d’outil de datamining
Les rapports sont limités au format JasperReport
Ce document est sous licence GNU Free Documentation Licence.
Page 74/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
7.3.1 Portail
Le portail adopté est dédié à la plateforme. Il n’intègre pas la norme JSR 168, ce qui ne permet pas
d’utiliser les composants dans les « portlets » d’un autre portail.
Il existe un « plug in » d’intégration à LifeRay dans la version pro.
7.3.2 Gestion des accès et des utilisateurs
La gestion des utilisateurs se fait depuis la plateforme.
Les utilisateurs peuvent être associés à cinq groupes différents qui définissent les droits d’accès
suivants :
• No access
• Admin
• Read Only
• Delete + Read
• Write + Delete + Read
Il est également possible d’octroyer ces droits directement à un utilisateur ce qui permet une
administration plus fine des accès.
7.3.3 Outillage dédié
« Ad Hoc editor » est l’outil dédié à la conception de rapports par des utilisateurs ne possédant pas de
connaissance du langage SQL. Cet outillage est réservé à la solution commerciale.
Item
CONCEPTION
ADHOC Editor
Outil web de conception de reporting « adhoc » sur la plateforme commerciale
Public
Utilisateurs : Permet la
conception de rapports «
adhoc »
Pré-requis
-
Tomcat, JBoss
Navigateur web
DESCRIPTION
-
Par « glisser-déposer », l’utilisateur conçoit son rapport :
o
Les sources de données ont été définies au préalable sous forme de « vues métier »
o
Suite à l’extraction, au-delà de la présentation sous forme de tableaux classiques, il lui est possible de produire
les résultats sous forme graphique
Permet de produire des « tableaux croisés » (calcul automatique du contenu des cellules, après choix des lignes
et des colonnes)
o
Licence
Notes
Open source Commerciale
Seule solution à permettre de générer un graphique sur un reporting « adhoc »
Les « tableaux croisés » s’apparentent aux tableaux croisés dynamiques d’Excel, sans capacité d’export
graphique.
Ce document est sous licence GNU Free Documentation Licence.
Page 75/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
7.3.4 Outils disponibles dans la plateforme
L’outil « JasperReport », est le composant technique de la solution. Pour aller plus loin, voir son
analyse individuelle en supra.
Elle intègre de plus le composant « Quartz » pour la planification. L’étude de ce composant n’est pas
réalisée dans ce livre blanc.
7.3.5 Outils complémentaires
« Jasper ETL », version OEM de Talend
7.3.6 « Roadmap », évolutions futures
La version 3.1 prévue fin 2008 devrait intégrer des outils d’analyse, la mise à disposition de la
plateforme sous forme de Saas (acronyme de l’expression « Software as a service »), une
construction de reporting ad-hoc sur des couches de données métier, un outillage différent permettant
une autre définition du rapport.
La version 3.2, prévue mi 2009, devrait approfondir les outils mis en place dans la version 3.1
Ce document est sous licence GNU Free Documentation Licence.
Page 76/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
7.4
OPENREPORTS
OpenReports est édité par Erik Swenson, développeur à Enfield, en Amérique du nord. Le support
reste limité à l’accès au blog http://oreports.com/blog/ où Erik donne quelques détails de configuration
avancée.
OpenReports est une solution web de publication de rapports pré configuré depuis les outils de
conception iReport ou Birt.
Ceci permet d’adresser simplement à des utilisateurs finaux, des tableaux de bord pré paramétrés. Il
n’est pas possible de gérer un paramétrage dépendant du profil afin par exemple, de réduire le
périmètre du tableau de bord suivant l’utilisateur.
L’avantage est sa simplicité de mise en œuvre, à partir du moment où une solution de conception des
rapports pré existe dans la chaîne décisionnelle.
Item
INDUSTRIALISER
OpenReport v3.0.1
Interface web de diffusion et de consultation de tableaux de bord pré paramétrés.
Public
Diffusion paramétrable
de tableaux de bord
Consultation
des
rapports attribués au profil
Accès à des analyses
ROLAP (Mondrian)
Pré-requis
-
Serveur Tomcat
Langage SQL
Langage XML
Conception sous JasperReport
Conception sous Birt
Conception de cubes Mondrian
DESCRIPTION
-
La solution est simple dans ses usages et dans sa mise en œuvre :
o
Conception des rapports sous Birt ou iReport
o
Déploiement sur la plate forme
o
o
Attribution des droits de production selon l’utilisateur
Définition des paramètres de diffusion (liste d’utilisateur, période, …)
Licence
Notes
Licence GPL
Une version « pro » avec des fonctionnalités supplémentaires est accessible pour un coût de 495$
(juillet 2008)
Cette version inclus un planificateur, les tableaux de bord et la gestion des alertes
Solution simple à mettre en œuvre, pour compléter une chaîne de production de rapports existante.
Limitée en version OpenSource
Ce document est sous licence GNU Free Documentation Licence.
Page 77/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
7.4.1 Gestion des accès et des utilisateurs
La gestion des utilisateurs est simplifiée et répartie entre le rôle d’administration (ajout/suppression
d’utilisateurs, de rapports,…) et le rôle « utilisateur », destinataire des rapports ou consommateur des
rapports générés et accessibles depuis l’interface web.
7.4.2 Outils disponibles dans la plateforme
Les outils « JasperReport », « Birt », « JFreeReport » (reporting Pentaho) et « JPivot » sont les
composants techniques de la solution. Pour aller plus loin, voir leur analyse individuelle en supra.
Elle intègre de plus le composant « Quartz » pour la planification. L’étude de ce composant n’est pas
réalisée dans ce livre blanc.
7.4.3 « Roadmap » et évolutions futures
La version 3.1 est sortie le 3 aout 2008. Elle intègre les nouvelles librairies JasperReports 3.0, BIRT
2.3, JXLS 0.9.6, JPivot 1.8, and Mondrian 3.0.
Nous l’avons testée, sans y trouver l’apport de fonctionnalités supplémentaires.
La plate forme fonctionne maintenant avec un JDK 1.6 qui possède nativement des fonctions
étendues dans la gestion des nombres décimaux.
Ce document est sous licence GNU Free Documentation Licence.
Page 78/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
7.5
LA SUITE VANILLA 1.2 (BPM CONSEIL)
La suite d’outils éditée par la société Lyonnaise BPM Conseil, fournie une alternative aux plateformes
BI majeures que représentent SpagoBI, Pentaho et JasperServer.
La plateforme fédère l’outillage propre de BPM Conseil. Quelques outils restent sous forme de
« clients lourds », essentiellement pour les tâches d’administration et de conception avancée (comme
la conception de vues métier).
Item
INDUSTRIALISER
BPM BI Portal v0.59
La plateforme de BPM Conseil prend forme, intégrant progressivement les outils spécifiques de la société
Public
MOE : Conception de
rapports
JasperReport
(FreeWebReport)
Conception
de
dashboard
(FreeDashboardWeb)
Utilisateurs :
visualisation de rapports,
visualisation de cubes
ROLAP
et
MOLAP
(FreeAnalysisWeb)
visualisation
de
dashboard
(FreeDashboardWeb)
Visualisation
de
Balanced Score Card
(FreeMetricsWeb)
Pré-requis
-
Tomcat, JBoss
Navigateur web
DESCRIPTION
-
-
Déploiement de plusieurs applications Java J2EE dans un serveur web
o
Configuration par fichier « xml » pour les périmètres utilisateurs
o
Configuration centralisée pour les référentiels applicatifs
o
Gestion des droits d’accès depuis une interface
Conception et visualisation depuis l’interface web
o
Interfaces intuitives permettant la couverture fonctionnelle
Licence
MPL (Mozilla Public License) v1.1
-
Notes
Seule solution à proposer des rapports sur les KPI (ou Balanced Score Card)
Doit parfois être complétée par l’utilisation de clients lourds
o
FreeMetaData pour la conception des vues métier (automatiquement déployées dans le
référentiel de la plateforme)
o
FreeAnalysisDesigner pour produire le fichier descripteur d’interrogation du cube
Mondrian (fichier « schema » cf. § V.B.2.2)
o
FreeDashBoardDesigner permet la définition du « dictionnaire de données » déployé
automatiquement dans le référentiel de FreeDashboardWeb
o
FreeMetrics se décompose en « FreeMetricsAdmin », « FreeMetricsAlert », «
FreeMetricsDesigner », « FreeMetricsLoader » qui permettent une gestion plus fine des
Balanced Score Card. Les configurations sont automatiquement disponibles pour
FreeMetricsWeb.
Ce document est sous licence GNU Free Documentation Licence.
Page 79/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
7.5.1 Portail
Le portail est un portail spécifique, non compatible avec les normes JSR168. Chaque application
intégrée est une application autonome qui se trouve agrégée dans le portail « BPM BI Portal ».
7.5.2 Gestion des accès et des utilisateurs
La gestion des utilisateurs est centralisée. L’agrégation des applications dans le portail permet une
forme de SSO n’obligeant pas la ressaisie des identifiants à chaque accès à une application
autorisée.
7.5.3 Outillage dédié
Ce chapitre présente le détail des « clients lourds ». Ils sont tous développés sur la plateforme
Eclipse.
Les solutions web correspondent aux clients lourds, modulo quelques aménagements nécessités par
l’interface.
7.5.3.1 FreeMetaData (Reporting Ad Hoc)
La solution « FreeMetaData » de BPM Conseil permet de configurer les « vues métiers ». Un
utilisateur « technique » ayant les droits d’accès aux données physiques, élabore des sous ensemble
de données fonctionnelles.
Cette conception se fait par choix dans des listes présentant les colonnes de données physiques.
Les jointures ne sont pas réalisées automatiquement.
Item
CONCEPTION DE VUES METIER
FREEMETADATA v0.40
Conception graphique des vues métier
Public
MOE : Conception de
vues métier, pour mise à
disposition d’utilisateurs
Pré-requis
-
JVM
Accès aux données physiques
Langage SQL
DESCRIPTION
-
-
Depuis une interface Eclipse
o
L’utilisateur se connecte à plusieurs sources de données qu’il agrège selon des règles fonctionnelles
o
Les vues sont nommées fonctionnellement
o
Un descripteur « xml » est généré, contenant les paramètres de connexion aux bases, les données à extraire et
le nom fonctionnel à employer.
o
Il est possible d’ajouter un filtrage des données pour restreindre le périmètre suivant l’utilisateur.
Solution simple à mettre en œuvre.
o
Le déploiement se fait par accès au référentiel de la plateforme pour une mise à disposition automatique, sans
nécessiter le redémarrage de cette dernière.
Licence
Notes
FreeMetaData Public Licence (MPL + clauses spécifiques)
Avec « Pentaho MetaDataEditor », autre solution « évoluée » de conception des vues métier
Ce document est sous licence GNU Free Documentation Licence.
Page 80/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
7.5.3.2
FreeDashboardDesigner
L’outil dédié permet la définition de tableaux de bord s’appuyant sur la technologie Pentaho des
fichiers « xaction ».
BPM Conseil envisage à terme de développer sa propre technologie support des tableaux de bord,
leur permettant ainsi plus de fonctionnalités et une meilleure intégration de l’outil
« FreeDashboardWeb » dans leur plateforme.
Item
PILOTAGE
Free DashBoard Designer v0.61
Interface graphique sous Eclipse permettant de construire des dashboards
Public
Construction
de
dashboard à partir de
fichier « *.xaction » pré
paramétrés (technologie
Pentaho)
Pré-requis
-
Client « lourd » supposant une JVM
Paramètres de connexion à la base de données
Connaissance du mécanisme des fichiers «
*.xaction » de Pentaho
Langage XML (pour comprendre le fichier
«freedashboard» produit)
Langage SQL (pour le requêtage)
DESCRIPTION
-
Free Dashboard Designer est un client lourd JAVA permettant de construire des dashboards
o
Graphes de types JFreeChart et FusionChart (Flash)
o
Insertion de tous les composants de FreeAnalysis et de reporting dans le dashboard (Cubes OLAP, Graphes,
JasperReport, BIRT report, JFreeReport, FreeMetrics)
Publication du dashboard directement dans la plateforme FreeDashboardWeb et Pentaho
o
-
Exécution pour l’utilisateur final, demande la connaissance des « xaction » et de FreeMetaData
o
Licence
Notes
Configuration du dictionnaire et construction du dashboard
Freedashboard Public License (licence MPL avec des clauses supplémentaires)
Utilisation en mode « stand alone » sauf pour la publication
Construction des dashboards sur la technologie Pentaho facilité
L’ergonomie de l’interface s’améliore au fil des versions
Ce document est sous licence GNU Free Documentation Licence.
Page 81/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
La copie d’écran ci-dessous présente l’interface et ses principales fonctionnalités. A elle seule, elle
permet de concevoir et de produire un regroupement de graphes présentant des indicateurs clés.
Ensuite, le tableau de bord peut être directement déployé dans la plateforme, comme en utilisant
l’outil web « FreeDashboardWeb ».
La différence entre les 2 modes de conception réside dans la capacité du client lourd à gérer un
dictionnaire de données, absent actuellement de la version web.
Ce document est sous licence GNU Free Documentation Licence.
Page 82/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
7.5.3.3
FreeDashBoardWeb
FreeDashboardWeb est le pendant web de l’outil « Free Dashboard Designer ». Cette version
n’intègre pas encore de dictionnaire de données. Son intégration est prévue dans les versions
ultérieures.
Item
PILOTAGE
FreeDashBoardWeb v0.61
Interface web, permet de créer et visualiser des dashboards
Public
Utilisateurs :
Visualisation et création
des dashboards
Pré-requis
-
Tomcat, JBoss
Navigateur Internet
DESCRIPTION
-
-
FreeDashboardWeb est l’interface Web de visualisation et de construction de dashboards
o
Visualisation et interaction avec les dashboards
o
Export en PDF
o
o
Graphes de types JFreeChart et FusionChart (Flash)
Insertion de tous les composants de FreeAnalysis et de reporting dans le dashboard (Cubes OLAP, Graphes,
JasperReport, BIRT report, JFreeReport, FreeMetrics)
Exécution pour l’utilisateur final, ne demande aucune connaissance particulière.
o
o
Licence
Notes
Affichage des dashboards, figés et paramétrés
L’ergonomie est en cours d’amélioration pour être encore plus intuitive
Freedashboard Public License (licence MPL avec des clauses supplémentaires)
Sur la version utilisée, quelques incompatibilités entre navigateurs Internet sont apparues. Les
corrections ont été rapidement implémentées.
Utilisation en mode « client/serveur»
Ce document est sous licence GNU Free Documentation Licence.
Page 83/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
Ci-dessous une copie d’écran de l’interface sous Firefox.
Celle-ci reprend les fonctionnalités de la solution sous Eclipse intitulée « Free Dashboard Designer »
et étudiée au chapitre précédent.
Le tableau de bord produit est déployé automatiquement dans la plateforme et son exécution peut
alors être planifiée pour une liste de destinataires.
Ce document est sous licence GNU Free Documentation Licence.
Page 84/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
7.5.3.4
FreeAnalysisWeb
Au sein de la plateforme BPM Conseil, la navigation dans les cubes ROLAP a été totalement revue.
L’interface de « FreeAnalysisWeb » remplace totalement les interfaces produites par la librairie JPivot.
Des colonnes calculées ont été ajoutées, permettant une représentation des données en mode
tableur.
Item
ANALYSE
FreeAnalysisWeb
Interface web, permet de naviguer dans le cube Mondrian
Public
Utilisateurs : Navigation
dans le cube, « drag and
drop » des dimensions,
génération de graphes,
export sous forme de
rapports
Pré-requis
-
Tomcat, JBoss
Langage MDX (pour édition de requête MDX
manuelle)
Navigateur Internet
DESCRIPTION
-
FreeAnalysisWeb est la version web du client lourd JAVA permettant de naviguer dans un cube OLAP
o
-
Visualisation du cube et des mesures
o
Gestion des dimensions et des mesures en « drag and drop »
o
Filtrage des dimensions avant insertion au sein du cube
o
Edition de requêtes MDX manuelles
o
Gestion des graphes
o
o
Export sous forme de rapports aux formats HTML, PDF, Excel
Ajout des colonnes calculées (addition et soustraction)
Exécution pour l’utilisateur final, ne demande aucune connaissance particulière.
o
o
Licence
Notes
Ouverture de la plateforme web et accès direct aux cubes et aux fonctionnalités
L’évolution de l’interface vers une plus grande ergonomie est en cours.
Freeanalysis public license (licence MPL avec des clauses supplémentaires)
La version de l’outil testé n’était pas totalement finalisée.
Ce document est sous licence GNU Free Documentation Licence.
Page 85/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
Ci-dessous l’interface, présentant une vue en « mode tableur » des données du cube. On note la
capacité d’ajout de colonnes calculées.
Ce document est sous licence GNU Free Documentation Licence.
Page 86/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
7.5.3.5
FreeAnalysis4Excel
FreeAnalysis4Excel est un plugin Excel destiné à interroger un cube Mondrian directement depuis une
dans une feuille du tableur.
Item
ANALYSE
FreeAnalysis4Excel
Suite à l’installation des plugins dans Excel, il est possible d’interroger un cube Mondrian
Public
Utilisateurs : Réalisation
de « drill-down » depuis
Excel
Pré-requis
-
Connaissance d’Excel
DESCRIPTION
-
-
Depuis Excel, permet d’alimenter les cellules avec les données agrégées présentes dans le cube.
o
L’alimentation est réalisé via une connexion sécurisé à la plateforme BPM (recommandé) ou via l’utilisation du
fichier de description, soit d’un cube « fasd », soit d’une metadata « freemetadata ».
o
Le choix des dimensions est pour l’instant très limité
o
Les fonctions principales sont le drill-down et le drill-up
o
La feuille Excel est recréée à chaque utilisation des fonctions principales
L’utilisateur visualise les données du cube dans les cellules
o
Licence
Notes
Il peut réaliser un drill-down ou un drill-up pour visualiser l’ensemble des données agrégées dans le cube.
NC
Sur un cube Mondrian, permet une analyse des données depuis Excel.
Ce document est sous licence GNU Free Documentation Licence.
Page 87/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
7.5.3.6
FreeWebReport
La conception de rapports « adhoc » est l’élément différenciant les plateformes BI OpenSource. Pour
BPM Conseil, cette conception est réalisée par l’outil « FreeWebReport », directement intégré dans la
plateforme.
L’outil permet la conception et le déploiement du rapport « adhoc » dans le référentiel commun.
Item
CONCEPTION
FreeWebReport
Permet la conception d’un rapport « ad hoc » depuis la plate forme BI
Public
Utilisateurs : Permet la
conception de rapport
sans
connaissance
approfondie du langage
SQL
Pré-requis
-
Tomcat, JBoss
Navigateur Internet
DESCRIPTION
-
Choix du gabarit de restitution
-
Choix des champs ou colonnes à croiser entre elles, afin d’extraire les données à mesurer
Interface simplifiée
o
Affectation au moyen d’icônes sous forme de flèches
-
Pas de capacité graphique, rapport uniquement sous forme de tableaux de données ou de tableaux croisés
o
Les fonctions de calculs «count », « sum », « avg », « min », « max », « first », « deviation » et « variance » sont
disponibles
Licence
Notes
NC
Les « tableaux croisés » s’apparentent aux tableaux croisés dynamiques d’Excel, sans capacité d’export
graphique.
Ce document est sous licence GNU Free Documentation Licence.
Page 88/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
Ci-dessous l’interface de « FreeWebReport ». On distingue la représentation de la couche
d’abstraction des données physique dans la colonne de gauche.
Le choix de ses colonnes permet à l’utilisateur de concevoir des requêtes SQL sans connaissance de
ce langage et du mode d’implémentation physique des données.
Ce document est sous licence GNU Free Documentation Licence.
Page 89/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
7.5.3.7
FreeMetrics
L’ensemble
FreeMetrics,
se
composant
de
FreeMetricsAdmin,
FreeMetricsDesigner,
FreeMetricsLoader sert à alimenter la base dédiée pour la conception de KPI ou indicateurs clés,
nécessaires au pilotage d’une direction métier.
.
Item
PILOTAGE
FreeMetrics
Interface web, permet de naviguer de visualiser des métriques sous forme de tableaux de bord
Public
Visualisation
des
objectifs
stratégique,
gestion de la performance
et satisfaction client
Pré-requis
-
Tomcat, JBoss
Navigateur Internet
DESCRIPTION
-
FreeMetricsWeb, la version web du client lourd JAVA FreeMetricsUser, permet de visualiser des métriques
o
Visualisation des tendances
o
Visualisation du statut actuel des indicateurs de l’entreprise
o
Détails des données pour chaque métrique
o
Visualisation de diagrammes et de jauges
o
o
Gestion des alertes
Export sous forme de rapports
Licence
Notes
NC
Cet outil est spécifique et possède sa base de données propre
Plusieurs outils sont mis à disposition pour la configuration et l’importation de données au sein de la
base.
Le peuplement de la base est possible par import des données d’un fichier Excel.
Utilisation en mode « client/serveur »
Ce document est sous licence GNU Free Documentation Licence.
Page 90/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
FreeMetrics est la seule implémentation OpenSource de gestion des indicateurs clés.
Cette gestion complexe fait l’objet par BPM Conseil de session de formations aux entreprises qui
mettent en place ce mode de gestion.
Elles aboutissent à la mise en place d’indicateurs, gérés et remontés vers les utilisateurs finaux au
travers de l’interface présentée ci-dessous.
7.5.4 Outils disponibles dans la plateforme
Les outils « JasperReport », « Birt », « JFreeReport » (reporting Pentaho) et « JPivot » sont les
composants techniques de la solution. Pour aller plus loin, voir leur analyse individuelle en supra.
Elle intègre de plus les composants « Weka » pour le datamining et « Quartz » pour la planification.
L’étude de ces composants n’est pas réalisée dans ce livre blanc.
7.5.5 « Roadmap », évolutions futures
Pas d’indications à l’heure actuelle
Ce document est sous licence GNU Free Documentation Licence.
Page 91/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
7.6
SYNTHESE DES PLATEFORMES
Pentaho qui est dans notre livre blanc la première solution présentée, intègre les fichiers « xaction »,
permettant la personnalisation lors du reporting de masse.
La société éponyme a d’ailleurs absorbé les projets Mondrian et Kettle, en en faisant partie intégrante
de la solution.
SpagoBI se présente comme un challenger très intéressant par les choix technologiques adoptés.
Chaque composant est intégré comme une portlet selon la norme JSR 168 au sein d’un portail
entièrement modulable, ce qui en simplifie l’administration et l’intégration.
La gestion des versions et des utilisateurs est l’autre point fort de cette solution.
La société JasperSoft édite la suite d’outils constituée autour de JasperReport. Les composants
intégrés excluent donc Birt comme outil de conception et de production de rapports. La version
commerciale intègre seule la capacité de production de rapports « adhoc ».
OpenReports est limité à la consommation de rapports figés. Cette plateforme n’offre pas toute la
richesse des autres présentées.
BPM Conseil est une plateforme riche, en progression constante. Quelques défauts de jeunesse sont
rapidement rattrapés. Elle rejoint rapidement les trois grandes solutions présentées plus haut.
Au-delà de leur apport dans l’industrialisation, de l’unification de l’accès aux outils, le principal
caractère différenciant des plateformes se concentre dans leur outil de conception du reporting
« adhoc ». La plateforme BPM Conseil intègre en plus le composant FreeMetrics permettant le BSC.
La synthèse suivante présente les différences de conception et d’implémentation du reporting
« adhoc ». On notera l’absence d’OpenReports qui n’inclue pas de conception de reporting « adhoc ».
Fonction majeure
Fonctions de design
métier de la BDD
Capacité à créer de
nouvelles
données
calculées
Pentaho
SpagoBI
JasperSoft
BPM Conseil
(adHoc Reporting)
(QBE)
(ADHOC Editor)
(FreeWebReport)
« MetaData
Editor»
permet de définir une
couche
métier
indépendante de la
couche de données
physique
Un
fichier
« datamart.jar »
permettant la gestion
de
cette
couche
d’abstraction doit être
généré au moyen
d’une
plateforme
Eclipse incorporant un
plugin « hibernate »
La
version
commerciale intègre
un
outil
baptisé
« semantic
layer Designer »
permettant
la
conception
de
la
couche d’abstraction.
« FreeMetaData »
est
l’outil de conception de
la
vue
métier,
indépendante
de
la
couche physique des
données.
Les
fonctions
arithmétiques
« comptage »,
« somme »,
« moyenne »,
« minimum »,
« maximum »
sont
intégrées
Les
fonctions
arithmétiques
classiques
sont
intégrées.
AdHoc
Editor
permet
également l’ajout de
colonnes calculées.
Le formatage des dates
et
des
champs
numériques est prévu,
les
fonctions
arithmétiques
« comptage »,
« somme »,
« moyenne »,
« minimum »,
« maximum »
sont
Ce document est sous licence GNU Free Documentation Licence.
La
version
OpenSource
ne
permet pas la gestion
de
reporting
« adhoc »
Les
fonctions
arithmétiques
« comptage »,
« somme »,
« moyenne »,
« minimum »,
« maximum »,
« premier »
sont
intégrées.
Page 92/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
Fonction majeure
Pentaho
SpagoBI
JasperSoft
BPM Conseil
(adHoc Reporting)
(QBE)
(ADHOC Editor)
(FreeWebReport)
intégrées
Les
fonctions
statistiques « variance »,
« déviation »
sont
présentes
Sécurité
Les droits sont attribués
globalement
par
utilisateur sur la couche
d’abstraction créée.
Les
droits
sont
attribués
par
utilisateurs et par
profils sur la couche
d’abstraction créée.
Les
droits
sont
attribués
par
utilisateurs et par
groupes sur la couche
d’abstraction créée.
Les droits sont attribués
par
utilisateurs,
par
groupes et par sous
ensemble de données
sur
la
couche
d’abstraction créée.
Fonction de contrôle
des utilisateurs
Le contrôle des actions
des utilisateurs se limite
aux groupes possédant
des rôles figés.
Le périmètre d’actions
possible est défini au
niveau du groupe
auquel
appartient
l’utilisateur.
Le périmètre d’actions
est défini par les rôles
affectés
aux
d’utilisateurs où à
leurs
groupes
d’appartenance.
Le périmètre d’actions
possibles est affecté au
groupe
auquel
appartient l’utilisateur.
Mise en forme
Un template peut être
utilisé, permettant une
personnalisation.
La mise en forme est
limitée
au
regroupement.
Un template peut être
utilisé, permettant une
personnalisation.
Ce template est défini
par un fichier « xml »
La présentation
sortie est figée.
La
version
commerciale permet
d’utiliser un template
de personnalisation.
de
Les formats « portrait »
et
« paysage »,
l’alignement du contenu
des colonnes et la
gestion de l’entête et
pied de page est aussi
possible
Vision
l’information
Mise à disposition
Paramétrabilité
de
Les formats « portrait »
et « paysage », ainsi
que la gestion et pied de
page est aussi possible
L’information
est
restituée sous forme de
liste uniquement.
L’information
est
restituée sous forme
de liste uniquement.
L’information
peut
être restituée au choix
sous forme de liste,
tableau
croisé
et
graphe.
L’information peut être
restituée sous forme de
liste ou tableau croisé.
Les formats d’export
possibles sont :
PDF
HTML
Excel
CSV
Les formats d’export
possibles sont :
PDF
HTML
Excel
CSV
RTF
XML
TXT
L’export
en
« jrxml »est
aussi
possible
afin
de
permettre une reprise
sous iReport.
Les formats d’export
possibles sont :
PDF
Excel
RTF
CSV
Flash
Les formats d’export
possibles sont :
PDF
HTML
Excel
CSV
RTF
Aucun
possible.
Aucun paramétrage
possible.
Aucun paramétrage
possible.
Possibilité de paramètre
saisi par l’utilisateur.
paramétrage
La configuration de cette
fonction sera réalisée
lors de la création de la
vue
métier
avec
FreeMetaData.
Ce document est sous licence GNU Free Documentation Licence.
Page 93/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
Fonction majeure
Pentaho
SpagoBI
JasperSoft
BPM Conseil
(adHoc Reporting)
(QBE)
(ADHOC Editor)
(FreeWebReport)
Fonctions avancées
La seule action possible
sur
la
couche
d’abstraction est le
filtrage des données
avant restitution.
La
seule
action
possible sur la couche
d’abstraction est le
filtrage des données
avant restitution.
La
seule
action
possible sur la couche
d’abstraction est le
filtrage des données
avant restitution.
La seule action possible
sur
la
couche
d’abstraction
est
le
filtrage des données
avant restitution.
Capitalisation
(enregistrement
de
requêtes,
de
modèles, de vues
réutilisables…)
Seule
la
couche
d’abstraction peut être
mutualisée.
La vue créée par un
utilisateur
sur
la
couche d’abstraction
peut
être
sauvegardée
et
partagée
par
plusieurs utilisateurs.
Seule
la
couche
d’abstraction peut être
mutualisée.
Seule
la
couche
d’abstraction peut être
mutualisée.
La vue créée par un
utilisateur sur cette
couche ne peut être
sauvegardée.
La vue créée par un
utilisateur
sur
cette
couche ne peut être
sauvegardée.
La vue créée par un
utilisateur sur cette
couche ne peut être
sauvegardée.
Ce document est sous licence GNU Free Documentation Licence.
Page 94/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
8 L’INTEGRATION DES COMPOSANTS OPEN SOURCE
Suite à notre parcours des solutions individuelles présentées dans ce document, nous avons ensuite
indiqué le bénéfice que pouvait apporter leur agrégation au sein d’une plateforme décisionnelle.
Celle-ci va apporter la gestion de la configuration centralisée, un mode d’authentification et de
définition de périmètre par utilisateur.
Les plateformes existantes vont plus loin que la simple agrégation de composants, puisqu’elles
permettent en plus de concevoir des sous-ensembles de données et du reporting « ad-hoc », avec les
limitations et les spécificités que nous avons exposées plus haut pour chaque solution.
Pour aller plus loin, il est possible d’appréhender une réponse à des besoins venus de l’usage, en
adoptant au sein de l’entreprise un portail compatible JSR 168 tel que Liferay, d’y construire et d’y
intégrer différentes « portlets » qui vont chacune offrir des solutions des reporting et d’analyse.
Nous avons ainsi intégré avec succès JasperReport, BIRT, web-Palo ou JPivot dans un portail
commun et adaptée à l’intranet de l’entreprise. La gestion des utilisateurs existante (au moyen d’un
annuaire LDAP OpenSource tel qu’OpenLDAP ou propriétaire tel qu’ActiveDirectory) permet de définir
les outils et les périmètres accessibles à chaque utilisateur.
Les outils BI propriétaires tels que Business Objects et SAS peuvent aussi, sous réserve d’interface
d’accès spécifiques, s’intégrer dans des « portlets » et venir compléter l’offre BI OpenSource.
On peut donc, sous réserve d’avoir une expertise approfondie sur les outils BI OpenSource et
propriétaires, adapter une solution BI personnalisée à l’entreprise et à ses besoins.
Ce document est sous licence GNU Free Documentation Licence.
Page 95/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
9 POUR CONCLURE…
Nous avons parcouru tout au long de ce livre blanc, un large périmètre de l’outillage BI disponible
dans le monde de l’Open Source.
A l’inverse de l’édition propriétaire qui relève plus d’un marketing de l’offre que de l’usage, l’édition
Open Source prend son inspiration dans les attentes utilisateurs. En ce sens il s’agit d’une approche
pragmatique de la prestation informatique.
Il apparaît clairement que l’offre Open Source associée à une expertise BI (tant conseil que mise en
œuvre) est pertinente pour répondre à une large gamme de services attendus par les directions
métiers et leur DSI :
Que ce soit pour du reporting de masse (diffusion de rapports statiques ou dynamique à un large
périmètre d’utilisateurs par tous les canaux disponibles),
Que ce soit pour des services d’analyse de l’activité à destination des managers (analyse
multidimensionnelle),
Que ce soit pour supporter les processus d’élaboration budgétaire,
Que ce soit pour fournir des tableaux de bord synthétiques à destination des directions, leur offrant
ainsi un visuel ergonomique sur l’avancement de leurs objectifs,
Ou encore pour permettre l’agrégation de composants BI distincts dans un portail web. Ce qui rend
possible le déploiement d’outils adaptés et ciblés au sein de l’entreprise, sans recourir à des
développements spécifiques conséquents.
Il est vrai, la partie Ad hoc (permettre aux utilisateurs finaux la construction personnalisée d’un rapport
à partir d’une vue métier des données) présente encore une limitation chez la majeure partie des
éditeurs. Mais elle peut être compensée par une conception en amont tenant compte de cette
limitation ou encore relever de choix d’organisation (contrôler la production de rapport par la DSI en
l’intégrant dans un cycle projet) – Cependant les efforts actuels des éditeurs se portent tous sur ce
point.
D’un point de vue technique, une attention particulière devra être portée aux pré-requis techniques,
concernant l’intégration et la configuration nécessaire des plateformes décisionnelles.
De même, certaines compétences SQL et/ou Java permettront une meilleure adoption de solutions
demandant parfois un haut niveau de technicité.
Nos retours d’expérience clients et nos liens avec l’écosystème nous amènent à considérer que la
réussite d’un projet métier repose dans l’association d’éditeurs Open Source et d’un intégrateur
fédérateur.
Ce dernier, par son savoir faire et son expérience autour de ces technologies est le rouage essentiel
dans l’assemblage qui détermine le caractère innovant de la solution.
Ce document est sous licence GNU Free Documentation Licence.
Page 96/97