Découvrir les meilleures méthodes et outils pour élaborer un entrepôt de données
Objectifs du cours:
Ce stage vous permettra de découvrir les meilleures méthodes et outils pour élaborer un entrepôt de données, à partir des besoins métier et de comprendre les rôles clés dans ce type de projet, et quel est l'impact sur l'architecture SI et la qualité du référentiel de données d'entreprise.
Pré-requis:
Maîtrise gestion de bases de données. Connaissances de base en analyse décisionnelle..
Programme:
Le Data Warehouse, finalité et principes.
Les enjeux stratégiques d'un SI décisionnel
Les raisons techniques et culturelles qui conduisent au Data Warehouse.
Définition du Data Warehouse selon Bill Inmon.
Les solutions apportées par l'architecture technique et fonctionnelle du Data Warehouse.
Caractéristiques des données du SI décisionneL
L'Infocentre et le SI décisionnel.
Présentation des différentes approches Data Warehouse et Infocentre, leurs avantages et inconvénients.
L'architecture d'un SI décisionnel d'entreprise.
Les différentes couches de l'organisation d'un Data Warehouse.
La collecte et l'intégration des données.
L'operational Data Store et la Data Staging area.
La couche de présentation, le portail décisionnel.
Les moteurs d'analyse OLAP : (MOLAP) et/ou relationnel OLAP (ROLAP).
Les techniques d'analyse "Data Mining" : méthodes prédictives, méthodes descriptives.
Croissance du volume et de la nature des données, les enjeux du Big Data.
La documentation des données du DW : notions de référentiel de données.
Comment le DW fiabilise la gestion du référentiel de données (MDM).
La gestion des flux : la capture des données sources, les règles de transformation.
Les principes de la modélisation Data Warehouse.
Les modèles relationnels opérationnels et dénormalisés.
Les modèles hybrides.
Les modèles génériques.
Comprendre le modèle en étoile, sa finalité.
Comprendre les notions de faits et d'analyse. Les hiérarchies d'axe d'analyse.
Le modèle en flocon.
La problématique des dimensions à évolution.
Gestion des agrégats et de la stabilité du périmètre fonctionnel.
Quelle approche favorise les informations de détail ou les agrégats ? Bonnes pratiques, questions à poser au métier.
La démarche de construction d'un Data Warehouse.
Identifier le périmètre fonctionnel candidat. Déterminer l'objectif et les événements de gestion à suivre.
Estimer la volumétrie du périmètre.
Analyse fonctionnelle, recueil des besoins utilisateurs.
Conception de l'architecture technique détaillée.
Etablir une démarche générique de mise en oeuvre.
Les apports d'une démarche itérative, le contenu d'une itération.
Première itération ou projet pilote, bien le choisir. Rôle du sponsor, de la MOA, de la MOE, impact sur l'organisation.
L'administration et le suivi de la solution opérationnelle.
Organisation du projet, les acteurs et les livrables.
Le rôle fondamental du sponsor ou promoteur.
Le comité de pilotage.
Rôle de l'équipe fonctionnelle, du groupe de projet utilisateurs : valider le design de l'environnement utilisateur.
Le transfert de compétences vers les utilisateurs finaux par l'équipe fonctionnelle : formation et documentation.
L'équipe technique, les architectes.
Les principaux livrables d'un projet décisionnel.
Les outils dans le domaine du décisionnel.
Les dernières évolutions techniques des SGBDR dans le domaine du décisionnel.
Panorama et typologie des solutions BI du marché. Les offres en mode Saas.
Les solutions de Reporting : SSRS, IBM Cognos, SAS, BusinessObjects... La mise en oeuvre des outils de requête.
Les outils d'analyse OLAP côté serveur et côté client : Utilisation, évolutivité, approche DataMart, temps de réponse.
Les solutions d'analyse Data Mining : SAS Enterprise Miner, IBM, OBI Datamining. Exigences et points forts.
Les solutions ETL : IBM, Informatica, Oracle, SAP, Talend..
Les outils de modélisation relationnelle : possibilités et limites.
Synthèse.
Les tendances d'évolution des systèmes décisionnels.
Bonnes pratiques pour la modélisation.
Recommandations pour l'organisation du projet Data Warehouse.