QCM sur Big Data corrigé – Principes de base – Partie 2

Questions d’Entretien sur Big Data avec des réponses pour la préparation des entretiens d’embauche, tests en ligne, examens et certifications. Ces questions et réponses sur Big Data comprennent divers sujets tel que les principes de base du Big Data, Hadoop, l’écosystème et ses composants, l’analyse, Hypervisor, etc… Et sont tirés d’un vrai entretien écrit et certaines parties sont en direct. Cette méthode d’apprentissage systématique préparera facilement toute personne pour réussir son test sur Big Data.
 
 

1. Dans les environnements Big Data, la vélocité désigne ___________

A Les données peuvent arriver à grande vitesse

B Des ensembles de données énormes peuvent s’accumuler dans des périodes très courtes.

C La vélocité des données se traduit par le temps qu’il faut pour que les données soient traitées.

D Toutes les réponses ci-dessus

D
Dans les environnements Big Data, la vélocité fait référence à plusieurs aspects liés à la gestion des données :

  • A: Les données peuvent arriver à grande vitesse, ce qui signifie que les systèmes doivent être capables de traiter des flux de données en temps réel ou quasi-réel.
  • B: Des ensembles de données énormes peuvent s’accumuler en très peu de temps, ce qui pose un défi en termes de stockage et de traitement rapide.
  • C: La vélocité des données se traduit également par le temps nécessaire pour traiter ces données et en extraire de la valeur de manière rapide et efficace.

 

 

2. Dans les environnements Big Data, la variété des données comprend ___________

A multiples formats et types de données

B Comprend des données structurées sous la forme de transactions financières.

C des données semi-structurées sous forme d’e-mails et des données non structurées sous forme d’images.

D Toutes les réponses ci-dessus

D
Dans les environnements Big Data, la variété des données fait référence à la diversité des formats et des types de données. Cela inclut :

  • A: Multiples formats et types de données, ce qui signifie que les données peuvent venir de sources très diverses (texte, audio, vidéo, etc.).
  • B: Des données structurées, comme des transactions financières, qui suivent un format défini et peuvent être organisées dans des bases de données relationnelles.
  • C: Des données semi-structurées (comme des e-mails) et des données non structurées (comme des images), qui n’ont pas nécessairement une organisation rigide mais peuvent encore contenir des informations utiles.

 

 

3. Dans l’environnement du Big Data, la véracité des données fait référence à la ___________

A la qualité ou la fidélité des données.

B La taille importante des données qui ne peuvent pas être traitées

C La petite taille des données qui peuvent être facilement traitées

D Toutes les réponses ci-dessus

A
Dans l’environnement du Big Data, la véracité des données fait référence à leur qualité, leur fiabilité et leur exactitude. Les données massives proviennent souvent de sources variées, et il est crucial de s’assurer qu’elles sont précises et de confiance avant de les analyser pour prendre des décisions.

Les autres options (B et C) ne concernent pas directement la véracité des données.

 

 
 

4. Lesquels des éléments suivants sont des avantages du traitement des Big Data ?

A Réduction des coûts

B Réduction du temps

C Décisions commerciales plus intelligentes

D Tous les avantages mentionnés ci-dessus

D
Le traitement des Big Data offre plusieurs avantages, notamment:

  • A. Réduction des coûts: En analysant les données de manière plus efficace, les entreprises peuvent identifier des inefficacités et optimiser leurs processus, ce qui peut conduire à des économies.
  • B. Réduction du temps: L’analyse des Big Data permet de prendre des décisions plus rapidement, en automatisant certaines tâches et en facilitant l’accès à des informations pertinentes en temps réel.
  • C. Décisions commerciales plus intelligentes: En traitant de grandes quantités de données, les entreprises peuvent obtenir des insights précieux qui les aident à prendre des décisions mieux informées et plus stratégiques.

Ainsi, tous ces avantages sont des résultats positifs du traitement des Big Data.

 

 

5. Parmi les éléments suivants, lequel n’est pas un « V » du Big Data ?

A Volume

B Vitesse

C Variété

D Véracité

D
Les « V » classiques du Big Data sont le volume, la vitesse, et la variété. Certains ajoutent d’autres V comme la véracité (qualité des données) et la valeur (importance des données), mais véracité n’est pas toujours inclus dans les trois V fondamentaux.

 

 

6. Quel est le rôle de Hadoop dans le Big Data ?

A Effectuer des calculs statistiques sur de petites bases de données

B Fournir un système de gestion de bases de données relationnelles

C Gérer et traiter de grandes quantités de données en parallèle sur plusieurs machines

D Visualiser des données en temps réel

C
Hadoop est un framework open-source utilisé pour le stockage et le traitement de grandes quantités de données. Il permet de traiter ces données de manière distribuée sur un grand nombre de machines, en utilisant des modules comme HDFS pour le stockage et MapReduce pour le traitement parallèle.

 

 
 

7. Parmi les éléments suivants, lesquels sont/ne sont pas des technologies de Big Data ?

A Apache Hadoop

B Apache Spark

C Apache Kafka

D Apache PyTorch

D
Apache PyTorch n’est pas une technologie de Big Data. PyTorch est un framework de deep learning et non une technologie liée au Big Data. Apache Hadoop, Apache Spark et Apache Kafka sont utilisés dans le contexte d’une solution Big Data.

 

 

8. ______ implique l’exécution simultanée de plusieurs sous-tâches qui, ensemble, constituent une tâche plus importante.

A Traitement parallèle des données

B Traitement simple

C Traitement de données multiples

D Aucun des éléments mentionnés ci-dessus

A
Le traitement parallèle des données implique l’exécution simultanée de plusieurs sous-tâches qui, ensemble, constituent une tâche plus importante. Cela permet d’accélérer le traitement des données en répartissant les tâches sur plusieurs ressources de calcul, ce qui est crucial dans les environnements Big Data.

 

 
 

9. Parmi les éléments suivants, lesquels peuvent être considérés comme une source de données non structurées?

A Facebook

B Twitter

C Pages Web

D Tout ce qui est mentionné ci-dessus

D
Les données non structurées proviennent principalement des plateformes de médias sociaux telles que Twitter, Facebook et Internet. Dans le contexte du stockage des données, les données non structurées désignent les informations qui n’ont pas été organisées selon un modèle ou un schéma de données prédéterminé et qui ne peuvent donc pas être stockées dans un système de gestion de base de données relationnelle (SGBDR) standard. Le texte et le multimédia sont deux types de contenus non structurés que l’on rencontre fréquemment. De nombreux documents commerciaux, ainsi que des e-mails, des vidéos, des images, des pages web et des fichiers audio, ont un contenu non structuré.

 

 

10. Parmi les éléments suivants, lesquels constituent un exemple de données non structurées:

A Numéro de matricule du voiture, marque, modèle

B Vidéos

C Fichiers audio

D Les deux B et C

D
Les données non structurées sont des données qui ne suivent pas un format prédéfini ou une structure spécifique. Les exemples incluent:

  • B. Vidéos : Les vidéos sont des données non structurées car elles ne sont pas organisées sous forme de tables ou de données facilement analysables sans traitement préalable.
  • C. Fichiers audio : De même, les fichiers audio sont également considérés comme des données non structurées, car ils ne sont pas organisés de manière structurée comme les bases de données relationnelles.

 

 

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *