QCM sur Big Data corrigé – Principes de base – Partie 2

Questions d’Entretien sur Big Data avec des réponses pour la préparation des entretiens d’embauche, tests en ligne, examens et certifications. Ces questions et réponses sur Big Data comprennent divers sujets tel que les principes de base du Big Data, Hadoop, l’écosystème et ses composants, l’analyse, Hypervisor, etc… Et sont tirés d’un vrai entretien écrit et certaines parties sont en direct. Cette méthode d’apprentissage systématique préparera facilement toute personne pour réussir son test sur Big Data.
 
 

1. Dans les environnements Big Data, la vélocité désigne ___________

A Les données peuvent arriver à grande vitesse

B Des ensembles de données énormes peuvent s’accumuler dans des périodes très courtes.

C La vélocité des données se traduit par le temps qu’il faut pour que les données soient traitées.

D Toutes les réponses ci-dessus

D
Dans les environnements Big Data, de grands ensembles de données peuvent s’accumuler en peu de temps, car les données arrivent à la vitesse de l’éclair et s’accumulent en quantités massives. Du point de vue d’une entreprise, la vélocité des données peut être définie comme le temps qu’il faut aux données pour être traitées une fois qu’elles sont entrées dans le périmètre de l’entreprise. Pour faire face à l’arrivée rapide des données, les entreprises doivent développer des solutions de traitement des données hautement élastiques et disponibles, ainsi que les capacités de stockage des données associées.

 

 

2. Dans les environnements Big Data, la variété des données comprend ___________

A multiples formats et types de données

B Comprend des données structurées sous la forme de transactions financières.

C des données semi-structurées sous forme d’e-mails et des données non structurées sous forme d’images.

D Toutes les réponses ci-dessus

D
Les systèmes Big Data doivent prendre en charge un large éventail de formats et de types de données, ce que l’on appelle la diversité des données. Les entreprises rencontrent un certain nombre de problèmes lorsqu’il s’agit d’intégration, de transformation, de traitement et de stockage des données en raison de la diversité des données. Par exemple, les transactions financières peuvent contenir des données structurées, des données semi-structurées sous forme d’e-mails et des données non structurées sous forme d’images.

 

 

3. Dans l’environnement du Big Data, la véracité des données fait référence à la ___________

A la qualité ou la fidélité des données.

B La taille importante des données qui ne peuvent pas être traitées

C La petite taille des données qui peuvent être facilement traitées

D Toutes les réponses ci-dessus

D
La qualité ou la fidélité des données est appelée « véracité ». La qualité des données entrant dans les environnements Big Data doit être évaluée, ce qui peut nécessiter des activités de traitement des données afin de résoudre les données erronées et de supprimer le bruit du flux de données. En ce qui concerne la véracité, les données peuvent soit faire partie du signal, soit faire partie du bruit d’un ensemble de données.

 

 
 

4. Lesquels des éléments suivants sont des avantages du traitement des Big Data ?

A Réduction des coûts

B Réduction du temps

C Décisions commerciales plus intelligentes

D Tous les avantages mentionnés ci-dessus

D
La réduction des coûts, la réduction du temps et des décisions commerciales plus intelligentes sont les avantages du traitement des données volumineuses.

 

 

5. Les données structurées se conforment à un modèle ou à un schéma de données et sont souvent stockées sous forme de tableaux.

A Vrai

B Faux

A
Les données structurées sont des données qui ont été organisées selon un modèle ou un schéma de données et qui sont souvent stockées sous forme de tableaux. Comme elles sont utilisées pour enregistrer les relations entre des éléments différents, elles sont le plus souvent stockées dans une base de données relationnelle. Les applications d’entreprise et les systèmes d’information, tels que les systèmes ERP et CRM, sont souvent responsables de la génération de données structurées.

 

 

6. Les données qui ne sont pas conformes à un modèle de données ou à un schéma de données sont connues sous le nom de ______.

A Données structurées

B Données non structurées

C Données semi-structurées

D Tout ce qui est mentionné ci-dessus

B
On parle de données non structurées lorsque les données ne sont pas conformes à un modèle de données ou à un schéma de données. Selon certaines estimations, les données non structurées représenteraient 80% de toutes les données d’une organisation donnée. Le taux de croissance des données non structurées est plus rapide que celui des données structurées. SQL ne peut pas être utilisé pour traiter ou interroger des données non structurées puisqu’elles ne sont pas structurées.

 

 
 

7. Parmi les éléments suivants, lesquels sont/ne sont pas des technologies de Big Data ?

A Apache Hadoop

B Apache Spark

C Apache Kafka

D Apache Pytarch

D
Apache Pytarch n’est pas une technologie Big Data. Apache Hadoop, Apache Spark et Apache Kafka sont utilisés dans le contexte d’une solution Big Data. Hadoop MapReduce est capable de traiter des ensembles de données beaucoup plus importants que Spark, notamment lorsque la taille totale de la collection de données dépasse la quantité de mémoire disponible.

 

 

8. ______ implique l’exécution simultanée de plusieurs sous-tâches qui, ensemble, constituent une tâche plus importante.

A Traitement parallèle des données

B Traitement simple

C Traitement de données multiples

D Aucun des éléments mentionnés ci-dessus

A
Le parallélisme, qui est défini en informatique comme l’exécution simultanée de plusieurs processus. Le traitement parallèle des données est l’exécution simultanée de plusieurs sous-tâches qui, ensemble, représentent une tâche plus importante dans le contexte d’une tâche plus vaste. L’analyse parallèle des données est une technique d’analyse des données par l’exécution de processus parallèles sur de nombreux ordinateurs en même temps.

 

 
 

9. Parmi les éléments suivants, lesquels peuvent être considérés comme une source de données non structurées?

A Facebook

B Twitter

C Pages Web

D Tout ce qui est mentionné ci-dessus

D
Les données non structurées proviennent principalement des plateformes de médias sociaux telles que Twitter, Facebook et Internet. Dans le contexte du stockage des données, les données non structurées désignent les informations qui n’ont pas été organisées selon un modèle ou un schéma de données prédéterminé et qui ne peuvent donc pas être stockées dans un système de gestion de base de données relationnelle (SGBDR) standard. Le texte et le multimédia sont deux types de contenus non structurés que l’on rencontre fréquemment. De nombreux documents commerciaux, ainsi que des e-mails, des vidéos, des images, des pages web et des fichiers audio, ont un contenu non structuré.

 

 

10. Parmi les éléments suivants, lesquels constituent un exemple de données non structurées:

A Numéro de matricule du voiture, marque, modèle

B Vidéos

C Fichiers audio

D Les deux B et C

D

 

 

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *