Qu’est-ce que le Data warehousing et data mining ?
Data warehousing et Data mining sont des outils de business intelligence(BI) qui sont utilisés pour transformer des informations (ou des données) vers des connaissances exploitables. Les distinctions importantes entre les deux outils sont les méthodes et les processus que chacun utilise pour atteindre un objectif.
Data mining est un processus d’analyse statistique. Les analystes utilisent des outils techniques pour interroger et trier des téraoctets de données à la recherche de modèles. Habituellement, l’analyste développera une hypothèse, comme les clients qui achètent le produit X achètent généralement le produit Y dans les six mois. Lancer une requête sur les données pertinentes pour prouver ou réfuter cette théorie est appelé « exploration de données ». Les entreprises utilisent ensuite cette information pour prendre de meilleures décisions en fonction de la façon dont elles comprennent les comportements de leurs clients et de leurs fournisseurs.
Data warehousing décrit le processus de conception du stockage des données afin d’améliorer le reporting et l’analyse. Les experts du Data warehousing considèrent que les différents entrepôt de données sont connectés et liés les uns aux autres aussi bien conceptuellement que physiquement. Les données d’une entreprise sont généralement stockées dans un certain nombre de bases de données. Cependant, pour être en mesure d’analyser la plus large gamme de données, chacune de ces bases de données doit être connectée d’une manière ou d’une autre. Cela signifie que les données qu’elles contiennent ont besoin d’être reliées à d’autres données pertinentes et que les bases de données physiques elles-mêmes ont une connexion afin que leurs données puissent être examinées ensemble à des fins de reporting.
La différence clé entre Data mining et Data warehousing est donc les données qui sont correctement stockées sont plus faciles à extraire. Si une requête d’exploration de données doit exécuter des téraoctets de données réparties sur plusieurs bases de données, qui reposent sur des réseaux physiques différents, cette requête n’est pas efficace et l’obtention de résultats prend beaucoup de temps. Toutefois, si l’expert en data warehouse conçoit un système de stockage de données qui connecte étroitement les données pertinentes dans différentes bases de données, le data miner peut désormais exécuter des requêtes beaucoup plus significatives et efficaces pour améliorer l’activité.