QCM sur Big Data corrigé – Hadoop, Spark, Hive, HDFS – Partie 1

Questions d’Entretien sur Big Data avec des réponses pour la préparation des entretiens d’embauche, tests en ligne, examens et certifications. Ces questions et réponses sur Big Data comprennent divers sujets tel que les principes de base du Big Data, Hadoop, l’écosystème et ses composants, l’analyse, Hypervisor, etc… Et sont tirés d’un vrai entretien écrit et certaines parties sont en direct. Cette méthode d’apprentissage systématique préparera facilement toute personne pour réussir son test sur Big Data.
 
 

1. Indiquez l’affirmation correcte.

A Hadoop est un environnement idéal pour extraire et transformer de petits volumes de données.

B Hadoop stocke les données dans HDFS et prend en charge la compression/décompression des données.

C Le framework Giraph est moins utile qu’une tâche MapReduce pour résoudre les problèmes de graphes et d’apprentissage automatique.

D Aucune de ces réponses

 

2. Sous quelle licence Hadoop est-il distribué ?

A Licence Apache 2.0

B Mozilla Public License

C Shareware

D Commerciale

 

3. En quel langage Hadoop a-t-il été écrit ?

A Python

B Java

C Perl

D C++

 
 

4. Lequel des éléments suivants est produit par Hadoop ?

A Système de fichiers distribués

B Service de messages Java

C JAX-RS

D Système de gestion de bases de données relationnelles

 

5. Sur laquelle des plateformes suivantes Hadoop fonctionne-t-il ?

A Debian

B Unix

C Multiplateformes

D Android

 

6. Hadoop atteint la fiabilité en répliquant les données sur plusieurs hôtes et ne nécessite donc pas de stockage _________ sur les hôtes.

A ZFS

B RAID

C Niveaux RAID standard

D Système d’exploitation

 
 

7. Au-dessus des systèmes de fichiers se trouve le moteur __________, qui consiste en un traqueur de tâches, auquel les applications clientes soumettent des tâches MapReduce.

A Facebook

B Google

C MapReduce

D Programmation fonctionnelle

 

8. La liste Hadoop comprend la base de données HBase, le système Apache Mahout __________ et les opérations matricielles.

A Intelligence artificielle

B Machine learning

C Classification statistique

D Reconnaissance des formes

 

9. _____ est une plateforme permettant de construire des flux de données pour le traitement et l’analyse de grands ensembles de données par extraction, transformation et chargement (ETL).

A Hadoop

B Pig

C Hive

D Oozie

 
 

10. Indiquez l’affirmation correcte:

A Hive n’est pas une base de données relationnelle, mais un moteur de requête qui prend en charge les parties du langage SQL spécifiques à l’interrogation des données.

B Hive est une base de données relationnelle avec support SQL

C Pig est une base de données relationnelle avec un support SQL

D Toutes les réponses sont vraies

 

Une réflexion sur “QCM sur Big Data corrigé – Hadoop, Spark, Hive, HDFS – Partie 1

  • mai 28, 2024 à 7:56 pm
    Permalien

    s’était pas mal intéressant encore !

    Répondre

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *