QCM sur Big Data corrigé – Principes de base – Partie 20

Questions d’Entretien sur Big Data avec des réponses pour la préparation des entretiens d’embauche, tests en ligne, examens et certifications. Ces questions et réponses sur Big Data comprennent divers sujets tel que les principes de base du Big Data, Hadoop, l’écosystème et ses composants, l’analyse, Hypervisor, etc… Et sont tirés d’un vrai entretien écrit et certaines parties sont en direct. Cette méthode d’apprentissage systématique préparera facilement toute personne pour réussir son test sur Big Data.
 
 

1. Quel est l’intérêt de l’indexation dans les systèmes Big Data ?

A Améliorer la sécurité des données

B Faciliter la recherche et l’accès rapide aux données

C Réduire la taille des fichiers

D Sauvegarder les données dans des formats compressés

 

2. Qu’est-ce qu’une tableau de bord (Dashboard) dans un contexte Big Data ?

A Un fichier de données brutes

B Un type de base de données relationnelle

C Un outil de stockage de données non structurées

D Une interface de visualisation des résultats d’analyse et des KPI

 

3. Quel est l’objectif principal de l’utilisation des clouds publics comme AWS, Google Cloud ou Azure pour le Big Data ?

A Augmenter les coûts de stockage

B Assurer une gestion centralisée de toutes les données

C Fournir des services évolutifs et un traitement distribué à grande échelle

D Limiter l’accès aux données à un seul serveur

 
 

4. Qu’est-ce qu’une fonction d’agrégation dans le contexte de Big Data ?

A Une opération qui permet de regrouper les données par date

B Une opération qui combine plusieurs valeurs en une seule

C Une fonction qui extrait les données depuis des bases relationnelles

D Une procédure pour sauvegarder les données

 

5. Qu’est-ce que le shuffling dans un job MapReduce ?

A Le tri des fichiers par nom

B L’envoi des résultats de la phase Map vers la phase Reduce

C La conversion des données structurées en non structurées

D La compression automatique des données traitées

 

6. Dans un contexte Big Data, que signifie scalabilité horizontale ?

A Augmenter les capacités d’un seul serveur

B Réduire la latence de traitement

C Ajouter plusieurs serveurs pour répartir la charge

D Compresser les fichiers pour gagner de l’espace

 
 

7. Dans Apache Spark, que signifie RDD ?

A Relational Data Deployment

B Real-time Data Dump

C Resilient Distributed Dataset

D Reactive Distributed Dataframe

 

8. Quel est le principal avantage de l’architecture Lambda dans le traitement Big Data ?

A Réduire le nombre de bases de données nécessaires

B Combiner traitement en batch et traitement en streaming pour une analyse complète

C Simplifier le codage SQL

D Supprimer le besoin d’outils de visualisation

 

9. Que signifie le terme data lineage ?

A La taille d’un fichier de données

B La structure interne d’un fichier

C Le schéma de réplication d’un cluster Hadoop

D La traçabilité complète de l’origine, de la transformation et de la destination des données

 
 

10. Quelle technologie est spécialisée dans l’indexation et la recherche de données textuelles dans le Big Data ?

A Apache Hive

B Apache Storm

C Elasticsearch

D Apache Pig

 

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *