Ahmed EL JAOUARI
Août 2, 2019
5 minutes
Moyen

Le terme Data Warehouse se traduit en français par “Entrepôt de données”. A la manière d’un véritable entrepôt, le Data Warehouse permet de stocker des téraoctets de données fonctionnelles.


Ces données sont collectées, traitées et ordonnées dans un entrepôt de données. Elles peuvent ensuite être croisées, coupées, analysées, décortiquées… c’est ce qu’on appelle le Datamining.

Sa finalité est d’aider à la prise de décisions. Evidemment, ces quantités de données ne peuvent être stockées que sur de puissants systèmes informatiques.

La qualité d’un Data Warehouse dépend essentiellement de la qualité des données qui s’y trouvent, de leur fiabilité et de leur cohérence. Des points primordiaux pour tirer les enseignements les plus pertinents.

Différences entre une base de donnés et un Data Warehouse

La confusion entre les deux termes est fréquente tant plus que les deux concepts s’apparentent.

Cela dit, la base de données sert en général à une fonction précise de l’entreprise (service client, comptabilité, achats, ressources humaine…) alors que le Data Warehouse permet d’analyser toutes ces infos à la fois.

Le Data Warehouse est la concentration de toutes les bases de données en une seule base. 

Autre différence, les bases de données sont en théorie optimisées pour une lecture rapide. Un simple coup d’oeil et les informations peuvent être lues et décryptées.

En revanche, le Data Warehouse va stocker ces données de manière agrégées, demandant une première analyse avant de pouvoir décrypter les informations qui s’y trouvent.

Les bases de données de chaque métier de l’entreprise sont donc au service des Data Warehouse et les alimentent.

Les grandes caractéristiques du Data Warehouse

Bill Inmon

Bill Inmon, le fondateur du concept décrivait le Data Warehouse comme n’étant “pas une simple copie des données de production. Le Data Warehouse est organisé et structuré”.

  • Orienté sujet
    Par structure, on entend ici que les données sont orientées “sujet”, c’est-à-dire ordonnées par fonction de l’entreprise (marketing, comptabilité…) ou par thème, comme par exemple celui des ventes.
  • Intégré
    Deuxième caractéristique, les données sont intégrées. Bien qu’elles proviennent de plusieurs sources et ne sont bien souvent pas structurées de la même manière, les données sont uniformisées pour être stockées dans le Data Warehouse. Un travail important de normalisation est nécessaire pour permettre ensuite une analyse pertinente et plus rapide.
  • Non volatile
    Troisième caractéristique, les informations stockées sont “non volatiles”. Toutes les informations sont traçables et ne changent pas au fil des traitements. Ces mêmes données non-volatiles sont datées et historisées. Chaque nouvelle donnée est insérée sans en supprimer d’ancienne, d’où l’importance d’associer l’information à une date. Tout est identifiable dans le temps.

Concrètement, à quoi sert le Data Warehouse ?

Contrairement aux systèmes opérationnels, le Data Warehouse permet l’analyse de l’activité de l’entreprise sur des milliers d’enregistrement parfois recoupés d’autres informations.

Ceci permet aux entreprises d’améliorer les prises de décisions en effectuant des requêtes pour examiner les processus, les performances et les tendances de leurs clients.

Exemple concret :

Avec le Data Warehouse, on peut analyser l’impact d’une remise à -30% sur les clients fidèles et sur les clients qui vont leur premier achat. Pour aller encore plus loin, on peut différencier les boutiques qui avaient ce produit en vitrine contre celles qui ne l’avaient pas.

Les informations propres à plusieurs services sont ici utilisées et serviront à répondre à plusieurs questions :

  • La promotion booste-t-elle les ventes ?
  • Doit-elle être accentuée ?
  • Doit-elle être accentuée seulement pour les clients fidèles ?
  • Le produit doit-il être mis en vitrine dans toutes les boutiques ?

Des décisions qui impacteront les services opérationnelles de merchandising, d’approvisionnement, etc..