QCM Apache Spark Corrigé – Partie 8

QCM sur le framework Apache Spark avec des réponses pour la préparation des entretiens d’embauche, tests en ligne, examens et certifications. Ces questions et réponses sur le framework Apache Spark comprennent divers sujets tel que les bases du framework Apache Spark, Hadoop, MapReduce, Requêtes interactives, traitement en flux, ETL, Big Data, etc…. Et sont tirés d’un vrai entretien écrit et certaines parties sont en direct. Cette méthode d’apprentissage systématique préparera facilement toute personne pour réussir son test sur le framework Apache Spark.
 
 

1. Apache Spark prend en charge __________

A Traitement par lots

B Traitement du flux de données en temps réel

C Traitement à base de graphes

D Toutes les réponses sont vraies

D
Toutes les réponses sont vraies.

 

 

2. Lequel des énoncés suivants est FAUX pour l’opération map() ?

A Map transforme un RDD de longueur N en un autre RDD de longueur N.

B Dans l’opération Map, le développeur peut définir sa propre logique métier personnalisée.

C Elle s’applique à chaque élément du RDD et renvoie le résultat sous la forme d’un nouveau RDD.

D Map permet de retourner 0, 1 ou plusieurs éléments à partir de la fonction Map.

D
Dans la fonction Map, le développeur d’opérations peut définir sa propre logique commerciale personnalisée. FlatMap() est similaire à Map, mais FlatMap permet de retourner 0, 1 ou plusieurs éléments à partir de la fonction Map.

 

 

3. FlatMap transforme un RDD de longueur N en un autre RDD de longueur M. Laquelle des propositions suivantes est vraie pour N et M?

A Soit N > M ou N < M

B Soit N < M ou N <= M

C Soit N > M ou N <= M

D Aucune de ces réponses

B
Soit N < M ou N <= M.

 

 
 

4. Lequel des éléments suivants est une transformation ?

A take(n)

B top()

C countByValue()

D mapPartitionWithIndex()

D
mapPartitionWithIndex() est une transformation.

 

 

5. Laquelle des propositions suivantes est une action ?

A Distinct()

B CountByValue()

C Union(dataset)

D Intersection(other-dataset)

B
CountByValue() est une action.

 

 

6. Dans une fonction d’agrégation, peut-on obtenir un type de données différent du type de données d’entrée ?

A Oui

B Non

C Peut-être

D Je ne sais pas!

A
Oui, dans une fonction d’agrégation, on peut obtenir un type de données différent du type de données d’entrée.

 

 
 

7. Dans laquelle des actions suivantes le résultat n’est pas renvoyé au pilote.

A countByValue()

B collect()

C foreach()

D top()

C
L’opération foreach() est une action. Elle ne renvoie aucune valeur. Elle exécute une fonction d’entrée sur chaque élément d’un RDD.

 

 

8. La principale API de Machine Learning pour Spark est désormais l’API basée sur _____.

A DataFrame

B Dataset

C RDD

D Aucune de ces réponses

A
La principale API de Machine Learning pour Spark est désormais l’API basée sur DataFrame.

 

 

9. Lequel des éléments suivants est un module pour le traitement des données structurées ?

A GraphX

B MLlib

C Spark SQL

D Spark R

C
Spark SQL est un module pour le traitement des données structurées.

 

 
 

10. SparkSQL traduit les commandes en codes. Ces codes sont traités par _________

A Des nœuds pilotes

B les nœuds de l’exécuteur

C Gestionnaire de cluster

D Aucun des éléments ci-dessus

B
SparkSQL traduit les commandes en codes. Ces codes sont traités par les nœuds de l’exécuteur.

 

 

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *