QCM sur Big Data corrigé – Hadoop, Spark, Hive, HDFS – Partie 22

Questions d’Entretien sur Big Data avec des réponses pour la préparation des entretiens d’embauche, tests en ligne, examens et certifications. Ces questions et réponses sur Big Data comprennent divers sujets tel que les principes de base du Big Data, Hadoop, l’écosystème et ses composants, l’analyse, Hypervisor, etc… Et sont tirés d’un vrai entretien écrit et certaines parties sont en direct. Cette méthode d’apprentissage systématique préparera facilement toute personne pour réussir son test sur Big Data.
 
 

1. En Spark, quel composant convertit les transformations en DAG (Directed Acyclic Graph) ?

A TaskManager

B DAG Scheduler

C Catalyst

D GraphX

B
Le DAG Scheduler est responsable de transformer le code Spark en graphe orienté acyclique, permettant une exécution optimisée et tolérante aux pannes.

 

 

2. Dans Hive, une table partitionnée améliore les performances car __________

A Elle compresse les données

B Elle permet de distribuer les données sur plusieurs clusters

C Elle évite de scanner toute la table en filtrant sur des partitions

D Elle exécute les requêtes en parallèle

C
La partition permet à Hive de ne lire que les fichiers utiles (partition pruning), ce qui réduit drastiquement le temps d’exécution.

 

 

3. En Spark, quel est le rôle du Cluster Manager ?

A Fournir l’interface utilisateur

B Orchestrer les DAGs

C Allouer les ressources pour exécuter les tâches Spark

D Gérer les partitions

C
Le Cluster Manager (YARN, Mesos ou Spark standalone) s’occupe de gérer les ressources et de démarrer les exécutors.

 

 
 

4. Quelle commande permet de visualiser les fichiers cachés (ex : .part-0000) dans un dossier HDFS ?

A hadoop fs -hidden

B hadoop fs -ls -a

C hadoop fs -ls

D hadoop fs -ls -h

B
Le flag -a liste tous les fichiers, même ceux commençant par un point, comme .part-0000.crc.

 

 

5. En Hadoop, que permet le mode Safe Mode du NameNode ?

A Interdire les écritures pendant une vérification du système de fichiers

B Supprimer les blocs inutilisés

C Rebooter le DataNode

D Forcer un MapReduce

A
Au démarrage, le NameNode entre en Safe Mode pour vérifier l’intégrité des blocs → aucune écriture ou modification possible à ce moment.

 

 

6. En Hive, comment afficher les partitions existantes d’une table ?

A SHOW PARTITION tablename

B SHOW PARTITIONS tablename

C LIST tablename PARTITIONS

D DESCRIBE tablename PARTITIONS

B
Affiche toutes les partitions enregistrées dans le metastore Hive :

SHOW PARTITIONS ma_table;

 

 
 

7. Dans Hadoop, quel est le format de log principal utilisé par défaut ?

A Log4Shell

B logstash

C log4j

D loglite

C
Hadoop et la plupart des projets de l’écosystème utilisent log4j pour la journalisation. Tu peux le configurer dans log4j.properties.

 

 

8. En Spark, quelle est la différence principale entre RDD et DataFrame ?

A Les DataFrames sont typés, les RDDs non

B Les RDDs sont paresseux, les DataFrames non

C Les DataFrames permettent des optimisations via Catalyst et Tungsten

D Les RDDs sont plus performants que les DataFrames

C
RDD (Resilient Distributed Dataset) est l’API de bas niveau de Spark. Elle donne un contrôle total sur les données, mais ne permet pas d’optimisations automatiques.

DataFrame, quant à lui, est une abstraction de plus haut niveau (semblable à une table SQL ou un DataFrame Pandas) et bénéficie du moteur d’optimisation Catalyst (pour les requêtes) et Tungsten (pour l’optimisation mémoire et CPU).

 

 

9. Quelle commande permet d’afficher les informations sur la configuration du cluster Hadoop ?

A hadoop config -get

B hadoop conf -view

C hadoop version

D hadoop fs -status

C
La commande hadoop version affiche des informations sur la version d’Hadoop installée sur le cluster ainsi que des détails sur la configuration générale du système.

 

 
 

10. Quelle commande Hadoop permet de supprimer un fichier dans HDFS sans confirmation ?

A hadoop fs -rm

B hadoop fs -rm -skip

C hadoop fs -delete -force

D hadoop fs -rm -f

D
La commande hadoop fs -rm -f supprime un fichier dans HDFS sans demander de confirmation, même si le fichier est protégé contre la suppression. L’option -f force la suppression.

 

 

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *