Intégration des données(Data Integration) : Les bases de données
L’intégration de données se concentre principalement sur les bases de données. Une base de données est une collection organisée de données. C’est pareil à un système de fichiers, qui est une structure organisationnelle pour les fichiers afin qu’ils soient faciles à trouver, à consulter et à manipuler.
Il existe différentes manières de catégoriser les bases de données. Certaines personnes préfèrent les classer en fonction du type de données stockées dans les bases de données. Par exemple, vous pouvez classer une base de données en tant que base de données multimédia si toutes les informations stockées sont contenues dans des fichiers vidéo ou audio.
Une autre méthode de classification examine comment les bases de données organisent les données. L’organisation de la base de données s’appelle un schéma. Une technique organisationnelle commune consiste à utiliser des tables pour montrer la relation entre différents points de données. Les tables sont comme des feuilles de calcul. Les colonnes définissent des catégories de données, tandis que les lignes sont des enregistrements. Une base de données utilisant cette approche est une base de données relationnelle.
Les bases de données de programmation orientée objet (POO) adoptent une approche différente de l’organisation des données. Le langage POO s’écarte des approches traditionnelles de la programmation, qui suivent le modèle d’insertion de données dans un ensemble d’instructions, puis de production. Le langage POO se concentre plutôt sur la définition des données en tant qu’objets, puis sur la manière dont les objets interagissent les uns avec les autres.
Pour créer une base de données POO, vous devez d’abord définir tous les objets que vous prévoyez de stocker dans la base de données. Ensuite, vous définissez la façon dont chaque objet se rapporte à tous les autres objets de la base de données. Après avoir identifié un objet, vous le placez dans une classe ou un ensemble d’objets. Pour définir une classe, vous devez déterminer quelles données chaque objet de cette classe doit avoir et quelles séquences logiques, appelées méthodes, affecteront ces objets. Les objets d’un système peuvent communiquer avec vous ou d’autres objets en utilisant des interfaces appelées messages.
C’est plus facile à comprendre avec un exemple. Disons que vous construisez une base de données contenant des informations sur les sports américains. Vous décidez de commencer par définir les équipes de baseball. Une fois que vous avez créé la définition d’une équipe de base-ball, vous pouvez la généraliser en tant que classe dans la base de données. Les Atlanta Braves seraient une instance spécifique de cette classe, également connue sous le nom d’objet. La classe des équipes de base-ball appartient à une super-classe d’équipes sportives américaines, qui inclurait également d’autres classes comme les équipes de football.
Pour accéder aux informations dans une base de données (peu importe comment elle organise les données), vous utilisez une requête. Une requête est juste une demande d’information. Les personnes et les applications peuvent soumettre des requêtes aux bases de données. Une base de données répond aux requêtes en envoyant des données qui répondent aux paramètres de la requête d’origine. Les requêtes reposent sur des langages informatiques spéciaux tels que Structured Query Language (SQL). Si vous avez déjà utilisé un moteur de recherche Internet, vous avez envoyé une requête: vos termes de recherche.
La base de données répond aux requêtes en créant une vue des données. Une vue est une manière spécifique d’afficher des données. Dans un système d’intégration de données, la vue renvoyée affiche uniquement les données directement liées à la requête d’origine. Voir l’exemple ci-dessous, si vous soumettez une requête demandant tous les clients qui ont acheté plus de 100 € de produits, vous obtiendrez ce résultat:
Cette vue affiche uniquement les données pertinentes pour la requête « clients ayant acheté plus de 100 € de produits ». Notez qu’il ne montre pas quels types de produits ont été achetés, ni les clients qui ont acheté moins de 100 € de produits.
Quelles sont les différentes approches de l’intégration des données? Découvrez dans la section suivante.
Lire la suite :
- Intégration des données(Data Integration) : Introduction
- Intégration des données(Data Integration) : Les bases
- Intégration des données(Data Integration) : Les approches
- Intégration des données(Data Integration) : Data Warehouses
- Intégration des données(Data Integration) : Base de données réseau