QCM sur Big Data corrigé – Principes de base – Partie 1

Questions d’Entretien sur Big Data avec des réponses pour la préparation des entretiens d’embauche, tests en ligne, examens et certifications. Ces questions et réponses sur Big Data comprennent divers sujets tel que les principes de base du Big Data, Hadoop, l’écosystème et ses composants, l’analyse, Hypervisor, etc… Et sont tirés d’un vrai entretien écrit et certaines parties sont en direct. Cette méthode d’apprentissage systématique préparera facilement toute personne pour réussir son test sur Big Data.
 
 

1. Les données d’une taille de ____ octets sont appelées Big Data.

A Giga

B Meta

C Peta

D Tera

C
Le terme Big Data désigne des données dont la taille est supérieure à un Peta octet. Le volume estimé des données qui seront traitées par les solutions Big Data est important et devrait continuer à augmenter. Outre l’augmentation des besoins de stockage et de traitement, les grands volumes de données nécessitent la mise en œuvre d’activités de préparation, de traitement et de gestion des données accrues.

 

 

2. ________ est une collection de données dont le volume est énorme, mais qui croît de manière exponentielle avec le temps.

A Fichier

B Base de données

C Cloud

D Big Data

D
Big Data est une collection de données dont le volume est énorme, mais qui croît de manière exponentielle avec le temps.

 

 

3. Quels sont les 7 V du Big Data ?

A Véracité, Visualisation, et Valeur.

B Variété, variabilité

C Volume, vélocité

D Toutes les réponses sont vraies

D
Les 7 V du Big Data sont le volume, la variété, la vélocité, la véracité ou validité, la variabilité, la valeur et la visualisation

 

 
 

4. Il existe _______ formes de Big Data.

A 7

B 3

C 6

D 1

B
Il existe 3 formes de Big Data:

  • Données structurées.
  • Données non structurées.
  • Données semi-structurées.

 

 

5. Quelle société a développé Apache Kafka ?

A Microsoft

B Amazon

C LinkedIn

D Google

C
Apache Kafka est une plateforme de streaming distribuée qui est utilisée pour construire des pipelines de données en temps réel et des applications qui s’adaptent aux flux de données.

 

 

6. En quelle année Apache Kafka a-t-il été développé ?

A 2022

B 2009

C 2012

D 2011

D
Apache Kafka a été développé en 2011.

 

 
 

7. Les types de Big Data sont _________.

A Données non structurées

B Données structurées

C Données semi-structurées

D Toutes les réponses sont vraies

D
Les types de Big Data sont:

  • Données structurées.
  • Données non structurées.
  • Données semi-structurées.

 

 

8. ________ possède le plus grand cluster Hadoop du monde.

A Google

B LinkedIn

C Facebook

D IBM

C
Facebook possède le plus grand cluster Hadoop du monde.

 

 

9. Les données non traitées ou les données traitées sont des observations ou des mesures qui peuvent être exprimées sous forme de texte, de chiffres ou d’autres types de médias.

A Vrai

B Faux

A
Les données non traitées ou les données traitées sont des observations ou des mesures qui peuvent être exprimées sous forme de texte, de chiffres ou d’autres types de supports. En statistique, un point de données, ou observation, est une collection d’une ou plusieurs mesures prises sur un seul membre de l’unité d’observation (ou unité d’observation). Exemple : Si l’unité d’observation est un particulier et que la question de recherche porte sur les déterminants de la croissance de la demande de liquidités, un point de données peut être les valeurs du revenu, de la richesse, de l’âge du particulier et du nombre de personnes à charge.

 

 
 

10. En informatique, ____ est une représentation symbolique des faits ou de concepts à partir desquels des informations peuvent être obtenues avec un degré raisonnable de confiance.

A Connaissance

B Données

C Programme

D Algorithme

B
En informatique, des informations peuvent être dérivées de données si ces dernières fournissent une représentation symbolique des faits ou de concepts à partir desquels une certaine probabilité peut être calculée. Bien que le résumé de très grands ensembles de données puisse donner lieu à des ensembles de données plus petits composés principalement de données symboliques, les données symboliques sont différentes en soi, quelle que soit la taille de l’ensemble de données, quelle que soit sa taille.

 

 

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.