QCM Apache Spark Corrigé – Partie 5
QCM sur le framework Apache Spark avec des réponses pour la préparation des entretiens d’embauche, tests en ligne, examens et certifications. Ces questions et réponses sur le framework Apache Spark comprennent divers sujets tel que les bases du framework Apache Spark, Hadoop, MapReduce, Requêtes interactives, traitement en flux, ETL, Big Data, etc…. Et sont tirés d’un vrai entretien écrit et certaines parties sont en direct. Cette méthode d’apprentissage systématique préparera facilement toute personne pour réussir son test sur le framework Apache Spark.
1. Est-ce que Spark R utilise MLlib ?
A Oui
B Non
C Peut-être
D Je ne sais pas!
2. Vous pouvez connecter un programme R à un cluster Spark à partir de ________
A R Shell
B RStudio
C Rscript
D Tous les programmes ci-dessus
3. Pour un problème de classification multiclasse, quel algorithme n’est pas la solution ?
A Forêts aléatoires (Random Forests)
B Régression logistique
C Arbres de Décision (AD)
D Naive Bayes
4. Pour un problème de régression, quel algorithme n’est pas la solution ?
A Gradient-Boosted Trees
B Arbres de Décision (AD)
C Régression de crête
D Régression logistique
5. Lequel des énoncés suivants est VRAIE à propos de DataFrame ?
A Les DataFrames offrent une API plus facile à utiliser que les RDD.
B L’API des DataFrames offre une sécurité au moment de la compilation.
C Les deux A et B
D Aucune de ces réponses
6. Lequel des éléments suivants est un outil de la bibliothèque du Machine Learning ?
A Persistance
B Pipelines
C Utilitaires comme l’algèbre linéaire et les statistiques
D Tous les outils ci-dessus
7. MLlib est-il déprécié ?
A Oui
B Non
C Peut-être
D Je ne sais pas!
8. Lequel des énoncés suivants est FAUX pour Apache Spark ?
A Il fournit une API de haut niveau en Java, Python, R et Scala.
B Il peut être intégré à Hadoop et peut traiter les données HDFS existantes.
C Spark est un framework open source écrit en Java.
D Spark est 100 fois plus rapide que Bigdata Hadoop.
9. Lequel des énoncés suivants est VRAIE pour Spark SQL ?
A C’est le noyau de Spark
B Il fournit une plateforme d’exécution pour toutes les applications Spark.
C Il permet aux utilisateurs d’exécuter des requêtes SQL/HQL sur Spark.
D Il permet d’exécuter des applications interactives et d’analyse de données puissantes sur des données en direct.
10. Lequel des énoncés suivants est VRAIE pour Spark core ?
A C’est le noyau de Spark
B Il permet aux utilisateurs d’exécuter des requêtes SQL/HQL sur Spark.
C Il s’agit d’une bibliothèque scalable de machine learning qui offre des performances.
D Améliore considérablement les performances des algorithmes itératifs.