QCM Apache Spark Corrigé – Partie 8
QCM sur le framework Apache Spark avec des réponses pour la préparation des entretiens d’embauche, tests en ligne, examens et certifications. Ces questions et réponses sur le framework Apache Spark comprennent divers sujets tel que les bases du framework Apache Spark, Hadoop, MapReduce, Requêtes interactives, traitement en flux, ETL, Big Data, etc…. Et sont tirés d’un vrai entretien écrit et certaines parties sont en direct. Cette méthode d’apprentissage systématique préparera facilement toute personne pour réussir son test sur le framework Apache Spark.
1. Apache Spark prend en charge __________
A Traitement par lots
B Traitement du flux de données en temps réel
C Traitement à base de graphes
D Toutes les réponses sont vraies
2. Lequel des énoncés suivants est FAUX pour l’opération map() ?
A Map transforme un RDD de longueur N en un autre RDD de longueur N.
B Dans l’opération Map, le développeur peut définir sa propre logique métier personnalisée.
C Elle s’applique à chaque élément du RDD et renvoie le résultat sous la forme d’un nouveau RDD.
D Map permet de retourner 0, 1 ou plusieurs éléments à partir de la fonction Map.
3. FlatMap transforme un RDD de longueur N en un autre RDD de longueur M. Laquelle des propositions suivantes est vraie pour N et M?
A Soit N > M ou N < M
B Soit N < M ou N <= M
C Soit N > M ou N <= M
D Aucune de ces réponses
4. Lequel des éléments suivants est une transformation ?
A take(n)
B top()
C countByValue()
D mapPartitionWithIndex()
5. Laquelle des propositions suivantes est une action ?
A Distinct()
B CountByValue()
C Union(dataset)
D Intersection(other-dataset)
6. Dans une fonction d’agrégation, peut-on obtenir un type de données différent du type de données d’entrée ?
A Oui
B Non
C Peut-être
D Je ne sais pas!
7. Dans laquelle des actions suivantes le résultat n’est pas renvoyé au pilote.
A countByValue()
B collect()
C foreach()
D top()
8. La principale API de Machine Learning pour Spark est désormais l’API basée sur _____.
A DataFrame
B Dataset
C RDD
D Aucune de ces réponses
9. Lequel des éléments suivants est un module pour le traitement des données structurées ?
A GraphX
B MLlib
C Spark SQL
D Spark R
10. SparkSQL traduit les commandes en codes. Ces codes sont traités par _________
A Des nœuds pilotes
B les nœuds de l’exécuteur
C Gestionnaire de cluster
D Aucun des éléments ci-dessus