QCM sur Big Data corrigé – Hadoop – Partie 2

Questions d’Entretien sur Big Data avec des réponses pour la préparation des entretiens d’embauche, tests en ligne, examens et certifications. Ces questions et réponses sur Big Data comprennent divers sujets tel que les principes de base du Big Data, Hadoop, l’écosystème et ses composants, l’analyse, Hypervisor, etc… Et sont tirés d’un vrai entretien écrit et certaines parties sont en direct. Cette méthode d’apprentissage systématique préparera facilement toute personne pour réussir son test sur Big Data.
 
 

1. Hive supporte également les extensions personnalisées écrites en ___.

A C++

B C

C Java

D C#

C
Hive prend également en charge les extensions personnalisées écrites en Java, notamment les fonctions définies par l’utilisateur (UDF) et les sérialiseurs-désérialiseurs pour la lecture et éventuellement l’écriture de formats personnalisés.

 

 

2. Indiquez l’affirmation incorrecte:

A Elastic MapReduce (EMR) est l’offre Hadoop intégrée de Facebook.

B Amazon Web Service Elastic MapReduce (EMR) est l’offre Hadoop intégrée d’Amazon.

C Scalding est une API Scala au-dessus de Cascading qui supprime la plupart des formalités Java.

D Toutes les réponses sont vraies

B
Plutôt que de construire manuellement des déploiements Hadoop sur des clusters EC2 (Elastic Compute Cloud), les utilisateurs peuvent faire tourner des installations Hadoop entièrement configurées à l’aide de commandes d’invocation simples, soit via la console Web AWS, soit via des outils de ligne de commande.

 

 

3. _______ est un modèle informatique polyvalent et un système d’exécution pour l’analyse de données distribuées.

A Drill

B Mapreduce

C Oozie

D Aucune de ces réponses

C
Mapreduce fournit une base flexible et évolutive pour l’analyse, du reporting traditionnel aux algorithmes d’apprentissage automatique.

 

 
 

4. Le langage de script Pig Latin est non seulement un langage de flux de données de plus haut niveau, mais il possède également des opérateurs similaires à ______.

A XML

B JSON

C SQL

D Toutes les réponses sont vraies

C
Le Pig Latin, par définition, est conçu pour combler le vide entre le style déclaratif de SQL et le style procédural de bas niveau de MapReduce.

 

 

5. _______ Les jobs sont optimisés pour l’évolutivité mais pas pour la latence.

A Hive

B Oozie

C Drill

D Mapreduce

A
Les requêtes Hive sont traduites en tâches MapReduce pour exploiter l’évolutivité de MapReduce.

 

 

6. ______ est un framework permettant d’effectuer des appels de procédure à distance et de sérialiser des données.

A Drill

B BigTop

C Avro

D Chukwa

C
Dans le contexte d’Hadoop, Avro peut être utilisé pour faire passer des données d’un programme ou d’un langage à un autre.

 

 
 

7. Quelle est la base de données NoSQL la plus populaire pour le stockage évolutif de données volumineuses avec Hadoop ?

A Cassandra

B MongoDB

C Hbase

D Oracle

C
HBase est la base de données NoSQL la plus populaire pour le stockage évolutif de données volumineuses avec Hadoop: un entrepôt de Big Data distribué et évolutif qui vous permet d’héberger de très grandes tables – des milliards de lignes multipliées par des millions de colonnes – sur des clusters construits avec du matériel de commodité.

 

 

8. HBase fournit des capacités similaires à ___________ au-dessus de Hadoop et HDFS.

A Bigtable

B BigTop

C TopTable

D Oracle

A
Google Bigtable optimise le stockage distribué des données fourni par le système de fichiers Google.

 

 
 

9. Indiquez l’affirmation incorrecte.

A Les solutions de stockage évolutives pour Hadoop d’EMC Isilon combinent une plate-forme de stockage puissante, simple et très efficace.

B L’intégration native HDFS d’Isilon vous évite d’avoir à investir dans une infrastructure Hadoop distincte.

C Les systèmes NoSQL fournissent un accès à haute latence et s’adaptent à un nombre réduit d’utilisateurs simultanés.

D Aucune de ces réponses

C
Les systèmes NoSQL offrent un accès à faible latence et peuvent accueillir de nombreux utilisateurs simultanés.

 

 

10. ______ sont hautement résilients et éliminent le risque de point de défaillance isolé des déploiements Hadoop traditionnels.

A Solutions Isilon

B AWS

C EMR

D Aucune de ces réponses

A
La solution Isilon offre également des options de protection et de sécurité des données d’entreprise, notamment l’audit des systèmes de fichiers et le cryptage des données, afin de répondre aux exigences de conformité.

 

 

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.