Approches de mise en place d’un Data warehouse

Approches de mise en place d’un Data warehouse

Dans cet article nous présentons les différentes approches de mise en place d’un Datawarehouse. Il en existe plusieurs, cependant les plus utilisées sont l’approche « Top-Down » prônée par Inmon, l’approche « Bottom-up » de Kimball et l’approche « Hybride » qui dérive des deux premières approches. Par la suite nous définissons l’approche que nous avons toujours appliquée lors de la mise en place de Datawarehouse à grande envergure.

Les trois approches :

 

 

 

Top-DownBill Inmon et le CIF Bottom-UpRalph Kimball et le Bus Architecture Hybride
· L’emphase est mise sur le DW.· Commence par concevoir un modèle de DW au niveau de l’entreprise.

· Déploies  une architecture multi tiers composée de  staging area, le DW, et les data mart dépendants.

· Le staging area est permanent.

· Le DW est orienté entreprise; les data marts sont orientés processus.

· Le DW contient des données atomiques; Les data marts contiennent les données agrégées.

· Le DW utilise un modèle de données normalisé de toute l’entreprise; Les data marts utilise des modèles dimensionnels orientés sujet.

· Les utilisateurs peuvent effectuer des requêtes sur le DW et les data marts.

· L’emphase est mise sur les data marts.· Commence par concevoir un modèle dimensionnel pour le data mart.

· Utilise une architecture qui consiste en un staging area et les data marts.

· Le staging area est en général non permanent, mais il peut devenir permanent pour implanter l’architecture en BUS (Dimensions et faits conformes)

· Les data marts contiennent les données atomiques et les données agrégées.

· Les data marts peuvent fournir une vue entreprise ou processus.

· Un data mart consiste en un seul star schema physique.

· Les data marts sont implantés d’une façon incrémentale et intégrée  en utilisant les dimensions conformes et les faits conformes ce qui constitue ce qu’on appelle l’architecture en BUS.

· Les utilisateurs ne peuvent effectuer des requêtes sur le staging area.

· L’emphase est sur le DW et les data marts; utilise les deux approches “top-down” et “bottom-up”.· Commence par concevoir un modèle de données de l’entreprise en même temps que les modèles spécifiques.

· Passe  2–3 semaines à créer un modèle normalisé d’entreprise de haut niveau ; génère les modèles des premiers data marts.

· Charge les data marts avec les données atomiques en utilisant un staging area temporaire.

· Les modèles des data marts sont composés d’un ou plusieurs star schémas.

· Utilise un outil ETL pour charger les data marts et pour échanger le méta data avec ces derniers.

· Charge le DW à partir des data marts lorsqu’il y’a besoin de faire des requêtes à travers plusieurs data marts en même temps.

 

Notre approche : Agir localement et penser globalement

  • L’emphase est mise sur les Data Marts avec une vision entreprise.
  • Commence par concevoir un modèle dimensionnel pour le premier data mart.
  • Ce premier Data Mart est donc Le DW à sa première itération.
  • A la constitution du deuxième Data mart, les dimensions et les faits partagés par les deux Data Marts deviennent ce qu’on appelle des dimensions et faits conformes.
  • Déploies  une architecture multi tiers composée de  staging area, du DW, et des data mart dépendants.
  • Le staging area est  temporaire. Il est donc vidé après chaque chargement dans le DW. Il sert à réduire le temps d’extraction et à regrouper les données à transformer.
  • Les data marts contenant les données atomiques sont stockés physiquement dans le DW. Les Data Marts qui contiennent les données agrégées peuvent être stockés dans le DW pour accélérer le chargement des Cubes, sinon les Cubes en soit deviennent des Data marts.
  • Un Data Mart est un ou plusieurs schémas en étoile
  • Le DW est donc une agglomération de Data marts métiers dépendants. Le lien entre ces data marts sont les dimensions conformes et les faits conformes.
  • Les utilisateurs peuvent effectuer des analyses dans les cubes et accéder aux détails dans le DW (Tout cela devrait être transparent aux utilisateurs)

Comments

Comments are closed.