Intégration des données(Data Integration) : Les approches

Basé sur la section précédente, vous pourriez penser que les bases de données sont assez complexes. C’est une supposition juste, et cela aide à expliquer pourquoi l’intégration de données est encore une discipline en cours de développement, même si elle a plus de 30 ans. L’objectif de l’intégration de données est de rassembler des données provenant de différentes sources, de les combiner et de les présenter de telle sorte qu’elles semblent constituer un tout unifié.
 
 
Disons que vous êtes sur le point de partir en voyage et que vous voulez voir à quoi ressemble la circulation avant de décider quel itinéraire emprunter pour sortir de la ville. Voici comment les différentes approches de l’intégration de données géraient votre requête.

L’approche d’intégration manuelle vous laisserait tout le travail. D’abord, vous devez savoir où chercher vos données. Vous devez connaître l’emplacement physique du rapport de circulation et de la carte de votre ville. Vous devez récupérer le rapport sur le trafic et les données cartographiques directement à partir de leurs bases de données respectives, puis comparer les deux ensembles de données les uns par rapport aux autres pour déterminer quel est le meilleur itinéraire pour sortir de la ville.
 
Si vous utilisiez une interface utilisateur commune, vous feriez un peu moins de travail. Vous utiliseriez une interface telle que le World Wide Web pour faire une requête. Les résultats de la requête apparaîtraient comme une vue sur l’interface. Vous devez encore comparer le rapport de trafic par rapport à la carte pour déterminer le meilleur itinéraire, mais au moins l’interface prendrait soin de localiser et de récupérer les données.
 
Certaines approches d’intégration s’appuient sur des applications pour faire tout le travail pour vous. Les applications, qui sont des programmes informatiques spécialisés, permettraient de localiser, récupérer et intégrer les informations pour vous. Au cours du processus d’intégration, les applications doivent manipuler les données afin que les informations d’une source soient compatibles avec les informations de l’autre source. Dans notre exemple, cela signifierait que vous soumettriez une requête à une application et qu’elle présenterait une vue combinant une carte de votre ville avec des données provenant de rapports de trafic. Le problème de cette approche est que les applications deviennent complexes et difficiles à programmer à mesure que le nombre de sources de données et de formats augmente.
 
 
Ensuite, il y a la méthode de stockage de données commune, également appelée stockage de données. En utilisant cette méthode, toutes les données des différentes bases de données que vous avez l’intention d’intégrer sont extraites, transformées et chargées. Cela signifie que l’entrepôt de données extrait d’abord toutes les données des différentes sources de données. Ensuite, l’entrepôt de données convertit toutes les données dans un format commun afin qu’un ensemble de données soit compatible avec un autre. Ensuite, il charge ces nouvelles données dans sa propre base de données. Lorsque vous soumettez votre requête, l’entrepôt de données localise les données, les récupère et vous les présente dans une vue intégrée. En utilisant notre exemple, l’entrepôt de données localiser les dernières informations qu’il a sur les rapports de trafic et les cartes de votre ville. Ensuite, il intégrerait les deux ensemble et vous enverrait la vue. Il y a plusieurs avantages et inconvénients dans ce système, que nous verrons dans la section suivante.

La plupart des concepteurs de systèmes d’intégration de données supposent que l’objectif final est de créer le moins de travail possible pour l’utilisateur final, de sorte qu’ils ont tendance à se concentrer sur les applications et les techniques de ‘data warehousing’.

Qu’est-ce que les entrepôts de données font exactement? Découvrez dans la section suivante.

 

Lire la suite :

 

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *