Différence entre données structurées, semi-structurées et non structurées

Big Data fait référence aux gros volumes de données qui nous entourent. Chaque type de données diffère dans la manière dont il est créé, stocké et analysé. Sur la base des caractéristiques, les données sont classées dans trois types; structurées, semi-structurées et non structurées.
 
 

Données structurées

Les données structurées sont des données dont les éléments sont adressables pour une analyse efficace. Il constitue 20% du total des données. Il est organisé dans un référentiel formaté qui est généralement une base de données. Il concerne toutes les données pouvant être stockées dans une base de données SQL dans une table avec des lignes et des colonnes. Ils ont une clé relationnelle et peuvent facilement être mappés dans des champs prédéfinis. Aujourd’hui, ces données sont le plus souvent traitées lors du développement et constituent le moyen le plus simple de gérer les informations.
 
Exemple: données relationnelles.


 

Données semi-structurées

Les données semi-structurées sont des informations qui ne résident pas dans une base de données rationnelle, mais qui possèdent des propriétés organisationnelles facilitant leur analyse. Avec certains processus, vous pouvez les stocker dans la base de données relationnelle (cela peut être très difficile pour certaines données semi-structurées), mais Semi-structurée existe pour réduire l’espace.
 
Exemple: données XML.

<?xml version = "1.0" encoding="UTF-8" standalone="yes"?>
<document>
  <employee>
      <name>Alex</name>
      <age>22</age>
  </employee>
  <employee>
      <name>Bob</name>
      <age>24</age>
  </employee>
  <employee>
      <name>Emily</name>
      <age>32</age>
  </employee>
</document>

 
 

Données non structurées

Les données non structurées sont des données qui ne sont pas organisées de manière prédéfinie ou qui ne possèdent pas de modèle de données prédéfini. Elles ne conviennent donc pas à une base de données relationnelle traditionnelle. Ainsi, pour les données non structurées, il existe des plates-formes alternatives pour le stockage et la gestion. Elles sont de plus en plus répandues dans les systèmes informatiques et sont utilisées par les entreprises dans diverses applications de business intelligence et d’analyse.
 
Exemple: Word, PDF, texte, logs.
 

Table de comparaison
Structurées Semi-structurées Non structurées
Il est basé sur les tables de base de données relationnelle Il est basé sur XML/RDF Il est basé sur des caractères et des données binaires
Il est dépendant du schéma et moins flexible Il est plus flexible que les données structurées mais moins que les données non structurées Très flexible et l’absence de schéma
Il est très difficile de mettre à l’échelle le schéma de base de données La mise à l’échelle est plus simple que les données structurées C’est très facile à mettre à l’échelle

 

Conclusion

les données structurées ne représentent que 5 à 10% de toutes les données informatiques.
 
 

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *