Intégration des données(Data Integration) : Data Warehouses

Comme nous l’avons vu précédemment, un entrepôt de données(Data Warehouses) est une base de données qui stocke des informations provenant d’autres bases de données en utilisant un format commun. C’est à peu près aussi spécifique que vous pouvez obtenir en décrivant les entrepôts de données. Il n’y a pas de définition unifiée qui dicte quels entrepôts de données sont ou comment les concepteurs doivent les construire. En conséquence, il existe plusieurs façons de créer des entrepôts de données, et un entrepôt de données peut se comporter très différemment des autres.
 
 
En général, les requêtes vers un entrepôt de données prennent très peu de temps à résoudre. C’est parce que l’entrepôt de données a déjà fait l’essentiel de l’extraction, de la conversion et de la combinaison des données. Le côté utilisateur d’un entrepôt de données est appelé Front-End, donc, du point de vue frontal, l’entreposage de données est un moyen efficace d’obtenir des données intégrées.

Du point de vue du Back-End, c’est une histoire différente. Les gestionnaires de bases de données doivent mettre beaucoup de réflexion dans un système d’entrepôt de données pour le rendre efficace et efficient. La conversion des données collectées à partir de différentes sources dans un format commun peut être particulièrement difficile. Le système nécessite une approche cohérente pour décrire et coder les données.

L’entrepôt doit avoir une base de données suffisamment grande pour stocker les données collectées à partir de plusieurs sources. Certains entrepôts de données incluent une étape supplémentaire appelée Datamart ou Magasin de données. L’entrepôt de données prend en charge les tâches d’agrégation des données, tandis que le datamart répond aux requêtes des utilisateurs en récupérant et en combinant les données appropriées provenant de l’entrepôt.

Un problème avec les entrepôts de données est que les informations qu’ils contiennent ne sont pas toujours à jour. C’est à cause du fonctionnement des entrepôts de données – ils tirent périodiquement des informations d’autres bases de données. Si les données de ces bases de données changent entre les extractions, les requêtes vers l’entrepôt de données n’aboutiront pas aux vues les plus récentes et les plus précises. Si les données d’un système changent rarement, ce n’est pas grave. Pour d’autres applications, cependant, c’est problématique.

Pour en revenir à notre exemple d’avant avec le rapport de circulation et la carte, vous pouvez voir comment cela pourrait poser problème. Bien que la carte de la ville ne nécessite pas de mises à jour fréquentes, les conditions de circulation peuvent changer radicalement dans un laps de temps relativement court. Un entrepôt de données peut ne pas extraire des données très fréquemment, ce qui signifie que les informations sensibles peuvent ne pas être fiables. Pour ce type d’applications, il est préférable d’adopter une approche d’intégration de données différente.

Quelle est l’alternative à l’entreposage de données(data warehousing)? Découvrez dans la section suivante.

 

Lire la suite :

 

Partagez cet article

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *