QCM sur Big Data corrigé – Hadoop, Spark, Hive, HDFS – Partie 21

Questions d’Entretien sur Big Data avec des réponses pour la préparation des entretiens d’embauche, tests en ligne, examens et certifications. Ces questions et réponses sur Big Data comprennent divers sujets tel que les principes de base du Big Data, Hadoop, l’écosystème et ses composants, l’analyse, Hypervisor, etc… Et sont tirés d’un vrai entretien écrit et certaines parties sont en direct. Cette méthode d’apprentissage systématique préparera facilement toute personne pour réussir son test sur Big Data.
 
 

1. Quelle propriété configure le nom du cluster YARN dans
yarn-site.xml
yarn-site.xml ?

A yarn.cluster.name

B yarn.resourcemanager.cluster-id

C yarn.namenode.cluster

D yarn.resource.name

 

2. En Hive,
LIMIT 10
LIMIT 10 s’applique :

A Avant le tri

B Après toutes les transformations

C Immédiatement après le FROM

D Avant la clause WHERE

 

3. Quelle directive dans Spark permet de forcer l’exécution immédiate d’un DAG paresseux ?

A

load()
load()

B

collect()
collect()

C

printSchema()
printSchema()

D

persist()
persist()

 
 

4. En Spark, que fait l’opérateur
filter()
filter() sur un RDD ou un DataFrame ?

A Regroupe les données

B Trie les données

C Compresse les données

D Applique un filtre booléen et ne garde que les lignes qui passent

 

5. Dans Hive, le mot-clé
ROW FORMAT DELIMITED
ROW FORMAT DELIMITED est utilisé pour _________

A Créer une table compressée

B Définir le format de ligne d’un fichier texte (ex : séparateur de colonnes)

C Créer des vues

D Activer la sérialisation Avro

 

6. Que permet
--incremental append
--incremental append dans une importation Sqoop ?

A Écrase les données précédentes

B Met à jour les lignes modifiées

C Importe uniquement les nouvelles lignes basées sur une colonne incrémentale

D Lance un import multithread

 
 

7. En Spark, que fait
.persist(StorageLevel.MEMORY_ONLY)
.persist(StorageLevel.MEMORY_ONLY) ?

A Sauvegarde les données dans HDFS

B Garde les données en mémoire uniquement, sans fallback sur disque

C Compresse les données sur disque

D Ne change rien au comportement de Spark

 

8. Quelle propriété dans
hdfs-site.xml
hdfs-site.xml configure le facteur de réplication par défaut ?

A

dfs.replication.default
dfs.replication.default

B

hdfs.replication
hdfs.replication

C

dfs.replication
dfs.replication

D

hdfs.block.replication
hdfs.block.replication

 

9. Quelle commande Spark est une action et non une transformation ?

A

map()
map()

B

filter()
filter()

C

flatMap()
flatMap()

D

count()
count()

 
 

10. En Hive, comment créer une table temporaire utilisable uniquement dans la session active ?

A

CREATE SESSION TABLE
CREATE SESSION TABLE

B

CREATE TEMP TABLE
CREATE TEMP TABLE

C

CREATE TEMPORARY TABLE
CREATE TEMPORARY TABLE

D

CREATE TABLE TEMP
CREATE TABLE TEMP

 

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *