QCM sur Big Data corrigé – Principes de base – Partie 1

Questions d’Entretien sur Big Data avec des réponses pour la préparation des entretiens d’embauche, tests en ligne, examens et certifications. Ces questions et réponses sur Big Data comprennent divers sujets tel que les principes de base du Big Data, Hadoop, l’écosystème et ses composants, l’analyse, Hypervisor, etc… Et sont tirés d’un vrai entretien écrit et certaines parties sont en direct. Cette méthode d’apprentissage systématique préparera facilement toute personne pour réussir son test sur Big Data.
 
 

1. Les données d’une taille de ____ octets sont appelées Big Data.

A Giga

B Meta

C Peta

D Tera

C
Les données appelées « Big Data » sont généralement de très grande taille, souvent mesurées en Pétaoctets (Po). Un Pétaoctet équivaut à 1 024 To (Téraoctets), soit environ un million de Go (Gigaoctets).

 

 

2. ________ est une collection de données dont le volume est énorme, mais qui croît de manière exponentielle avec le temps.

A Fichier

B Base de données

C Cloud

D Big Data

D
Le terme Big Data désigne une collection de données dont le volume est énorme et qui croît de manière exponentielle avec le temps. Cela inclut non seulement une grande quantité de données, mais aussi une diversité et une vitesse de croissance qui nécessitent des outils spécialisés pour être analysées et exploitées efficacement.

 

 

3. Quels sont les 7 V du Big Data ?

A Véracité, Visualisation, et Valeur.

B Variété, variabilité

C Volume, vélocité

D Toutes les réponses sont vraies

D
Les 7 V du Big Data sont utilisés pour décrire les caractéristiques essentielles des données massives. Ils sont les suivants:

  • Volume : La quantité massive de données générées.
  • Vélocité : La rapidité avec laquelle les données sont générées et doivent être traitées.
  • Variété : La diversité des types de données (structurées, non structurées, semi-structurées).
  • Véracité : La fiabilité et la qualité des données.
  • Valeur : L’utilité des données pour l’analyse et la prise de décisions.
  • Variabilité : L’évolution rapide et la fluctuation des données.
  • Visibilité (ou Visualisation) : La capacité à visualiser et à comprendre les données.

 

 
 

4. Il existe _______ formes de Big Data.

A 7

B 3

C 6

D 1

B
Il existe généralement 3 formes de Big Data:

  • Données structurées : Ce sont des données organisées dans un format bien défini, comme une base de données relationnelle, où les informations sont stockées sous forme de tables avec des colonnes et des lignes.
  • Données semi-structurées : Ces données ne sont pas aussi organisées que les données structurées, mais elles contiennent des éléments qui peuvent être utilisés pour organiser et analyser les informations, comme les fichiers XML ou JSON.
  • Données non structurées : Ce sont des données qui ne suivent aucun format prédéfini, comme des images, des vidéos, des textes, des e-mails ou des publications sur les réseaux sociaux.

 

 

5. Quelle société a développé Apache Kafka ?

A Microsoft

B Amazon

C LinkedIn

D Google

C
Apache Kafka a été développé à l’origine par LinkedIn en 2010 pour gérer le flux massif de données générées par leur plateforme. Kafka a ensuite été open-source en 2011 et est devenu un projet de la Apache Software Foundation.

Kafka est maintenant largement utilisé dans l’industrie pour la gestion de flux de données en temps réel.

 

 

6. En quelle année Apache Kafka a-t-il été développé ?

A 2022

B 2009

C 2012

D 2011

D
Apache Kafka a été développé pour la première fois par LinkedIn en 2011. C’est cette année-là que le projet a été rendu open-source, ce qui a permis à Kafka de se populariser et d’être largement adopté par de nombreuses entreprises pour la gestion de flux de données en temps réel.

 

 
 

7. Les types de Big Data sont _________.

A Données non structurées

B Données structurées

C Données semi-structurées

D Toutes les réponses sont vraies

D
Il existe généralement 3 formes de Big Data:

  • Données structurées : Ce sont des données organisées dans un format bien défini, comme une base de données relationnelle, où les informations sont stockées sous forme de tables avec des colonnes et des lignes.
  • Données semi-structurées : Ces données ne sont pas aussi organisées que les données structurées, mais elles contiennent des éléments qui peuvent être utilisés pour organiser et analyser les informations, comme les fichiers XML ou JSON.
  • Données non structurées : Ce sont des données qui ne suivent aucun format prédéfini, comme des images, des vidéos, des textes, des e-mails ou des publications sur les réseaux sociaux.

 

 

8. Quelle est la définition du terme « Big Data » ?

A Des données stockées dans des bases de données relationnelles

B Un ensemble de données trop volumineuses pour être traitées avec des outils traditionnels

C Des données structurées uniquement

D Des données provenant des réseaux sociaux

B
Le Big Data désigne des ensembles de données extrêmement volumineux et complexes qui ne peuvent pas être gérés efficacement par des outils de gestion de bases de données traditionnels. Cela comprend des données structurées et non structurées.

 

 

9. ________ possède le plus grand cluster Hadoop du monde.

A Google

B LinkedIn

C Facebook

D IBM

C
Facebook possède l’un des plus grands clusters Hadoop au monde. Hadoop est un framework open-source utilisé pour stocker et traiter de grandes quantités de données, et Facebook l’utilise pour gérer ses énormes volumes de données générés par ses utilisateurs.

 

 
 

10. Quelle est la caractéristique principale du Big Data ?

A Son volume

B Son coût élevé

C Sa capacité de stockage

D Sa sécurité

A
La caractéristique la plus notable du Big Data est son volume massif de données. Cependant, on parle aussi des autres « V » du Big Data, comme la vitesse (vitesse à laquelle les données sont générées) et la variété (diversité des types de données).

 

 

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *