Quelle est la différence entre Data Mining et Data Warehouse ? – Data Mining et Data Warehouse les deux sont utilisés pour conserver des informations commerciales et permettre la prise de décision. Pourtant, data mining et data warehouse ont des aspects différents sur le fonctionnement des données d’une entreprise. D’une part, data warehouse est un environnement où les données d’une entreprise sont rassemblées et stockées de manière agrégée et résumée. D’autre part, data mining est un processus; qui appliquent des algorithmes pour extraire des connaissances et des données dont vous ne savez même pas qu’elles existent dans la base de données.
Data Mining est le processus d’analyse de modèles de données inconnus.
Data Warehouse est un système de base de données conçu pour un travail analytique plutôt que transactionnel.
Data
Data Mining est une méthode de comparaison de grandes quantités de données pour trouver des modèles corrects.
Data Warehouse est une méthode de centralisation des données provenant de différentes sources dans un référentiel commun.
Processus
Data Mining est généralement effectuée par des utilisateurs professionnels avec l’aide d’ingénieurs.
Data Warehouse est un processus qui doit avoir lieu avant toute exploration de données c’est à dire avant le processus du Data Mining.
Sources
Data Mining est considérée comme un processus d’extraction de données à partir de grands ensembles de données.
D’autre part, Data Warehouse consiste à regrouper toutes les données pertinentes.
Informations
Data Mining aide à générer des stratégies exploitables basées sur des informations sur les données.
Une fois que vous avez entré des informations dans le système Data Warehouse, il est peu probable que vous perdiez la trace de ces données. Vous devez effectuer une recherche rapide, vous aide à trouver les bonnes informations statistiques.
Le défi
Les organisations doivent dépenser beaucoup de ressources à des fins de formation et de mise en œuvre. De plus, les outils du Data Mining fonctionnent de différentes manières en raison des différents algorithmes utilisés dans leur conception.
Dans Data warehouse, les données sont regroupées à partir de plusieurs sources. Les données doivent être nettoyées et transformées. Cela pourrait être un défi.
Data Mining peut être effectuée uniquement lorsqu’il existe une grande base de données(Data Warehouse) bien intégrée. Data Warehouse doit donc être fait avant Data Mining. Data Warehouse doit comporter des informations bien intégrées afin que Data Mining puisse extraire les connaissances de manière efficace.