Différence entre un DataWarehouse et un Datamart
Data Warehouse et Data Mart sont utilisés comme entrepôt de données et servent le même objectif. Celles-ci peuvent être différenciées par la quantité de données ou d’informations qu’elles stockent. La différence essentielle entre un Data Warehouse et un Datamart réside dans le fait que Data Warehouse est une base de données qui stocke des informations pour satisfaire les demandes de prise de décision, tandis que le Datamart est un sous-ensemble logique complet d’un Data Warehouse complet.
En d’autres termes, un Data Mart est un Data Warehouse dont l’étendue est limitée et dont les données peuvent être résumées et sélectionnées à partir de Data Warehouse ou à l’aide de processus d’extraction, de transformation et de chargement du système de données.
Table de comparaison
DataWarehouse | Datamart | |
---|---|---|
Application | Data warehouse est indépendant de l’application. | Les Data mart sont spécifiques à l’application du système d’aide à la décision. |
Type de système | Centralisé | Décentralisé |
Facilité de construction | Difficile à construire | Simple à construire |
Type de schéma utilisé | Constellation de faits | Étoile et flocon de neige |
Modèle de données | Top-down | Bottom-up |
Utilisation de la dénormalisation | Les données sont légèrement dénormalisées. | Les données sont fortement dénormalisées. |
Forme de données | Détaillé | Résumé |
Définition de DataWarehouse
Le terme DataWarehouse désigne un groupe de données variant dans le temps, orienté sujet, non volatile et intégré qui facilite le processus de prise de décision. Il s’agit également d’un référentiel d’informations collectées à partir de sources multiples, stockées dans un schéma unifié, sur un site unique permettant l’intégration de divers systèmes d’application. Une fois que ces données sont collectées, elles sont stockées pendant une longue période et ont donc une longue durée de vie et permettent d’accéder à des informations historiques.
Par conséquent, Data Warehouse fournit à l’utilisateur une interface intégrée unique aux données grâce à laquelle l’utilisateur peut écrire facilement des requêtes d’aide à la décision. Data Warehouse aide à transformer les données vers des informations. La conception d’un Data Warehouse inclut une approche descendante.
Il rassemble des informations sur des sujets couvrant l’ensemble de l’organisation, tels que les clients, les ventes, les actifs et les éléments. Par conséquent, sa gamme couvre l’ensemble de l’entreprise. En général, le schéma de constellation de faits y est utilisé, ce qui couvre une grande variété de sujets. Un Data Warehouse n’est pas une structure statique et évolue continuellement.
Définition de Data Mart
Un Data Mart peut être appelé une sous-ensemble d’un DataWarehouse ou d’un sous-groupe de données d’entreprise correspondant à un certain ensemble d’utilisateurs. DataWarehouse implique plusieurs Data Mart logiques qui doivent être persistants dans leur illustration de données pour garantir la robustesse d’un DataWarehouse. Un Data Mart est un ensemble de tables qui se concentrent sur une seule tâche. Elles sont conçues selon une approche ascendante.
L’étendue du Data Mart est restreinte à un sujet spécifique et spécifique, sa portée est donc à l’échelle du département. Celles-ci sont généralement implémentées sur des serveurs départementaux à faible coût. Le cycle de mise en œuvre des DataWarehouse est surveillé en semaines plutôt qu’en mois et en année.
Comme les schémas en étoile et en flocon sont orientés vers la modélisation de sujet unique, c’est pourquoi ils sont couramment utilisés dans le Data Mart. Bien que le schéma en étoile soit plus populaire que le schéma en flocon de neige. Selon la source de données, les Data Mart peuvent être classés en deux types: les Data Mart dépendants et indépendants.
Différences clés entre Data Warehouse et Data Mart
- Data Warehouse est indépendant de l’application, tandis que Data Mart est spécifique à l’application du système d’aide à la décision.
- Les données sont stockées dans un référentiel centralisé unique dans un Data Warehouse. Par contre, le Data Mart stocke les données de manière décentralisée dans la zone utilisateur.
- Data Warehouse contient une forme détaillée de données. En revanche, le Data Mart contient des données résumées et sélectionnées.
- Les données d’un Data Warehouse sont légèrement dénormalisées tandis que dans le cas d’un Data Mart, elles sont fortement dénormalisées.
- La construction d’un Data Warehouse implique une approche descendante. À l’inverse, lors de la construction d’un Data Mart, l’approche ascendante est utilisée.
- Data Warehouse est flexible, axé sur les informations et a une existence plus longue. Au contraire, un Data Mart est restrictif, orienté projet et a une existence plus courte.
- Le schéma de constellation de faits est généralement utilisé pour modéliser un Data Warehouse, tandis que le schéma en étoile de Data Mart est plus populaire.
Conclusion
Data Warehouse fournit une vue d’entreprise, un système de stockage unique et centralisé, une architecture inhérente et une indépendance des applications, tandis que Data Mart est un sous-ensemble d’un Data Warehouse qui fournit une vue départementale et un stockage décentralisé. Comme Data Warehouse est très vaste et intégré, il existe un risque élevé d’échec et de difficulté à le construire. Par ailleurs, le Data Mart est facile à construire et le risque de défaillance associé est également moindre, en revanche, le Data Mart peut être fragmenté.