Ahmed EL JAOUARI
Août 6, 2019
5 minutes
Moyen

Le Data Mining c’est en français l’exploration de données. Une fois les données stockées sur une base dédiée à cet effet (un data warehouse), encore faut-il décrypter ces informations et en tirer les enseignements pertinents. C’est là qu’intervient le Data Mining, le forage de données.


Il s’agit d’explorer et d’analyser une base de données souvent très vaste. Cette base de données est issue de plusieurs bases de données, pour en extraire une connaissance et anticiper des phénomènes. On recherche ici un modèle caché ou non évident.

Les résultats de ces études permettent de prendre des décisions cohérentes et viables pour l’entreprise.

A quoi sert le Data Mining ?

Le but du Data Mining est de pousser les analyses à un niveau supérieur. Là où les métiers de l’entreprise s’arrêteront aux données dont leur service dispose, le Data Mining analyse les données de l’entreprise dans sa globalité.

Il recherche par exemple des corrélations entre plusieurs facteurs issus de branches différentes de l’entreprise.

Une fois les enseignements tirés, les décisionnaires comprennent les phénomènes déclenchés par leurs actions.

Ce savoir permet la prédiction, qui elle même permet la prise de décision adéquate. Grâce à leurs analyses, les Data Miners peuvent mettre en lumière des schémas totalement ignorés.

Ils peuvent par exemple mettre en avant que lorsque qu’un internaute regarde un épisode d’une série le dimanche après-midi, il y a alors 80% de chance qu’il commande à manger le soir.

Pour une entreprise de livraison à domicile, c’est un modèle extrêmement important dans la mesure où il permet de cibler les publicités vers les personnes qui répondent à ces critères.

Le processus du Data Mining décrypté

Le Data Mining c’est tout d’abord la collecte des données, les extraire les transformer, les uniformiser pour pouvoir les compiler.

Une première étape parfois longue et fastidieuse qui permet dans un second temps de stocker ces données dans les Data Warehouses.

Le challenge est de recueillir le tout en les classifiant et ordonnant d’une manière à pouvoir les utiliser et les croiser.

Pas facile lorsque les données sont si vastes :

  • les données opérationnelles (les bases de données de chaque métier de l’entreprise. C’est-à-dire celles des départements achat, vente, marketing, comptabilité…)
  • les données non-opérationnelles (les données macro-économiques, les prédictions…)
  • les métadonnées (données servant à définir les autres données. Exemple concret: Une photo peut être définie par le lieu et la date précise où elle a été prise).

Vient ensuite la modélisation. Étape durant laquelle les données pertinentes sont sélectionnées et corroborer avec d’autres pour “être traduites”. Souvent utilisées à travers un logiciel applicatif, les données sont organisées sous forme de graphique ou de tableau.

Les résultats peuvent être présentés et compris aisément par les décisionnaires.

En d’autres termes, les Datas Analysts et spécialistes informatiques vont décortiquer les éléments et explorer les nombreuses possibilités offertes.

Ils vont étudier les patterns qui s’offrent à eux, étudier les relations possibles, les associations potentielles entre toute les données collectées et à disposition. Un travail précieux qui est censé déboucher sur des patterns récurrents et donc désormais compris, ou bien à propos de tendances futures.