Pour les systèmes d’intégration de données reposant sur des informations qui changent fréquemment, une approche d’entrepôt de données n’est pas idéale. Une façon dont les experts informatiques tentent de résoudre ce problème consiste à concevoir des systèmes qui extraient les données directement des sources de données individuelles. Comme il n’existe pas de base de données centralisée dédiée à l’analyse, à la catégorisation et à l’intégration des données en préparation des requêtes des utilisateurs, ces responsabilités incombent à d’autres parties du système.
Les experts informatiques définissent les systèmes d’intégration de données en termes de schémas. La vue unifiée produite à partir d’une requête traitée est le schéma global. La structure des différentes sources de données et la manière dont elles sont liées ça ce qu’on appel le schéma source. La façon dont les schémas globaux et les schémas sources sont reliés est appelée cartographie. Considérez le schéma source comme un plan pour toutes les données du système, tandis que le schéma global est un plan pour la vue présentée en réponse à une requête.
Il existe deux approches principales pour résoudre les requêtes dans un système intégré de données: global-as-view et local-as-view. Chaque approche se concentre sur une partie particulière du système global et présente ses avantages et ses inconvénients.
Dans une approche globale, l’accent est mis sur le schéma global. Tant que les sources de données restent cohérentes, l’approche global-as-view fonctionne bien. Il est facile de changer la configuration du schéma global. Cela signifie qu’il n’est pas difficile d’analyser le même ensemble de données de différentes manières. Toutefois, l’ajout ou la suppression de sources de données dans le système pose problème, car il affecte les données dans l’ensemble du système.
La technique local-as-view prend l’approche inverse. Il se concentre sur les sources de données. Tant que le schéma global reste constant, il est facile d’ajouter ou de supprimer des sources de données au système. Le schéma recherche les mêmes types de données et de relations dans les nouvelles sources de données. Dans cette approche, il est difficile de changer les paramètres du schéma global. Si vous souhaitez analyser les sources de données d’une autre manière, vous devrez redéfinir l’ensemble du système.
Voilà l’histoire de l’intégration des données. La prochaine fois que vous regarderez une carte météorologique ou que vous appellerez une sélection filtrée de données, vous serez au courant de la série complexe de processus qui se déroulent en arrière-plan pour rendre tout cela possible.
Pour en savoir plus sur l’intégration de données, cliquez sur les liens de la page suivante.
Lire la suite :
- QCM sur Big Data corrigé – Principes de base – Partie 1
- QCM sur Big Data corrigé – Principes de base – Partie 2
- QCM sur Big Data corrigé – Principes de base – Partie 3
- QCM sur Big Data corrigé – Principes de base – Partie 4
- QCM sur Big Data corrigé – Principes de base – Partie 5
- QCM sur Big Data corrigé – Principes de base – Partie 6
- QCM sur Big Data corrigé – Principes de base – Partie 7
- QCM sur Big Data corrigé – Principes de base – Partie 8
- QCM sur Big Data corrigé – Principes de base – Partie 9
- QCM sur Big Data corrigé – Principes de base – Partie 10
- QCM sur Big Data corrigé – Principes de base – Partie 11
- QCM sur Big Data corrigé – Principes de base – Partie 12
- QCM sur Big Data corrigé – Principes de base – Partie 13
- QCM sur Big Data corrigé – Principes de base – Partie 14
- QCM sur Big Data corrigé – Principes de base – Partie 15
- QCM sur Big Data corrigé – Principes de base – Partie 16
- QCM sur Big Data corrigé – Principes de base – Partie 17
- QCM sur Big Data corrigé – Principes de base – Partie 18
- QCM sur Big Data corrigé – Principes de base – Partie 19
- QCM sur Big Data corrigé – Principes de base – Partie 20
- QCM sur Big Data corrigé – Principes de base – Partie 21
- QCM sur Big Data corrigé – Hadoop, Spark, Hive, HDFS – Partie 1
- QCM sur Big Data corrigé – Hadoop, Spark, Hive, HDFS – Partie 2
- QCM sur Big Data corrigé – Hadoop, Spark, Hive, HDFS – Partie 3
- QCM sur Big Data corrigé – Hadoop, Spark, Hive, HDFS – Partie 4
- QCM sur Big Data corrigé – Hadoop, Spark, Hive, HDFS – Partie 5
- QCM sur Big Data corrigé – Hadoop, Spark, Hive, HDFS – Partie 6
- QCM sur Big Data corrigé – Hadoop, Spark, Hive, HDFS – Partie 7
- QCM sur Big Data corrigé – Hadoop, Spark, Hive, HDFS – Partie 8
- QCM sur Big Data corrigé – Hadoop, Spark, Hive, HDFS – Partie 9
- QCM sur Big Data corrigé – Hadoop, Spark, Hive, HDFS – Partie 10
- QCM sur Big Data corrigé – Hadoop, Spark, Hive, HDFS – Partie 11
- QCM sur Big Data corrigé – Hadoop, Spark, Hive, HDFS – Partie 12
- QCM sur Big Data corrigé – Hadoop, Spark, Hive, HDFS – Partie 13
- QCM sur Big Data corrigé – Hadoop, Spark, Hive, HDFS – Partie 14
- QCM sur Big Data corrigé – Hadoop, Spark, Hive, HDFS – Partie 15
- QCM sur Big Data corrigé – Hadoop, Spark, Hive, HDFS – Partie 16
- QCM sur Big Data corrigé – Hadoop, Spark, Hive, HDFS – Partie 17
- QCM sur Big Data corrigé – Hadoop, Spark, Hive, HDFS – Partie 18
- QCM sur Big Data corrigé – Hadoop, Spark, Hive, HDFS – Partie 19
- QCM sur Big Data corrigé – Hadoop, Spark, Hive, HDFS – Partie 20
- QCM sur Big Data corrigé – Hadoop, Spark, Hive, HDFS – Partie 21
- QCM sur Big Data corrigé – Hadoop, Spark, Hive, HDFS – Partie 22
- QCM sur Big Data corrigé – Hadoop, Spark, Hive, HDFS – Partie 23
- QCM sur Big Data corrigé – Hadoop, Spark, Hive, HDFS – Partie 24
- QCM sur Big Data corrigé – Mapreduce
- Différence entre SAS et R
- Différence entre données structurées, semi-structurées et non structurées
- Différence entre ETL et ESB
- À quoi sert le big data ?
- Différence entre Big Data et Data Mining
- Différence entre Big Data et Cloud Computing
- Différence entre ROLAP et MOLAP
- Différence entre Data Mining et Data Warehouse
- Différence entre OLTP et OLAP
- Différence entre Table des faits et Table de dimension
- Différence entre le schéma en étoile et en flocon
- Différence entre un DataWarehouse et un Datamart
- Intégration des données(Data Integration) : Introduction
- Intégration des données(Data Integration) : Les bases de données
- Intégration des données(Data Integration) : Les approches
- Intégration des données(Data Integration) : Data Warehouses
- Intégration des données(Data Integration) : Base de données réseau
- Qu’est-ce que le Data warehousing et data mining ?
QCMs qui pourraient vous intéresser :