Différence entre Big Data et Data Mining
Big data et Data mining sont deux concepts différentes. Les deux concernent l’utilisation des grands ensembles de données pour gérer la collecte ou la création de rapports destinés aux entreprises ou à d’autres destinataires.
Data mining implique de trouver des modèles intéressants à partir de jeux de données. Big data implique le stockage et le traitement à grande échelle (souvent à l’échelle d’un datacenter ) de grands ensembles de données. Ainsi, data mining fait partie du big data(par exemple, la recherche de modèles d’achat à partir de journaux d’achats volumineux). Toutes les tâches du Big Data ne sont pas des opérations du data mining (par exemple, indexation à grande échelle). Toutes les tâches de data mining ne font pas partie du Big Data (par exemple, l’exploration de données sur un petit fichier pouvant être effectué sur un seul nœud).
Table de comparaison
Data Mining | Big Data | |
---|---|---|
Définition | Il se base principalement sur de nombreux détails | Il se base principalement sur de nombreuses relations entre les données |
Définition | C’est une technique d’analyse de données | C’est un concept plutot qu’un terme précis |
Résultats | Principalement pour la prise de décision stratégique | Tableaux de bord et mesures prédictives |
Types de données | Données structurées, base de données relationnelle et dimensionnelle. | Données structurées, semi-structurées et non structurées (en NoSQL) |
Vue | C’est une vue rapprochée des données | C’est la grande image des données |
Les données | Il exprime « qu’en est-il des données? » | Il exprime « pourquoi des données? » |
Analyse | Principalement l’analyse statistique, se concentre sur la prédiction et la découverte de facteurs commerciaux à petite échelle. | Principalement l’analyse des données, l’accent est mis sur la prévision et la découverte de facteurs commerciaux à grande échelle. |
Data mining


Data mining consiste à découvrir des modèles dans de grands ensembles de données, en utilisant des méthodes situées à l’intersection du machine learning, des statistiques et des systèmes de base de données afin d’identifier les modèles futurs. Il s’agit d’une étape essentielle du processus de découverte des connaissances, dans lequel des méthodes intelligentes sont appliquées à une grande quantité de données pour extraire des modèles de données.
Les techniques de data mining sont utilisées dans de nombreux domaines de recherche, notamment les mathématiques, la génétique et le marketing. Alors que les techniques d’exploration de données sont un moyen d’optimiser l’efficacité et de prévoir le comportement des clients, si elle est utilisée correctement, l’entreprise peut se démarquer de ses concurrents
grâce à l’analyse prédictive.
Big Data


Big Data est un terme utilisé pour toute donnée de grande taille. Il est utilisé pour faire référence à tout type de données difficiles à représenter à l’aide de méthodes classiques telles que un systèmes de gestion de bases de données ou Microsoft Excel.
Big Data sont aussi des données mais avec une taille énorme. Big Data est un terme utilisé pour décrire une collection de données de grande taille, mais qui croît de manière exponentielle avec le temps. En bref, ces données sont si volumineuses et complexes qu’aucun des outils de gestion de données traditionnels ne peut les stocker ou les traiter efficacement.
Conclusion
Data Mining et le Big Data traitent les données mais de différentes manières. La différence réside dans la façon dont les données sont interprétées. Le Data Mining et le Big Data traitent des quantités énormes de données.