Les 8V du Big Data

Les 8V du Big Data

Lorsque l’on parle du Big Data, on se retrouve confronté à plusieurs problèmes. Comment stocker les données ? Quelles sont les sources de ces données ? A quelles fréquences seront-elles collectées ? Les Big Data sont caractérisés par plusieurs facteurs, souvent appelés les « 3V ». Ce sont 3 axes « classiques » du développement du big data (volume, variété et vélocité), mais la définition peut s’étendre à 8 aspects.

Big Data Nuage de mots

Volume

La quantité de données produites est très importante dans le contexte des big data. En effet, c’est la taille de ces informations qui détermine leur impact et la valeur potentielle que l’on peut en retirer et surtout si on peut les considérer comme des données de masse ou non. La dénomination « Big Data » contient elle-même un terme qui est lié à la dimension et à sa caractéristique principale.

Variété

Le volume de données collectées pose un problème aux data centers, un grand volume implique un nombre important de sources qui ne peuvent être toutes traitées de la même manière, car elles sont structurées en formats, langages et codes différents. Cette variété doit être connue par les analystes de données afin qu’ils puissent utiliser efficacement ces données à leurs avantages et confirmant l’importance du Big Data.

Vélocité

Dans le domaine des big data, la vélocité représente la fréquence à laquelle les données sont capturées, traitées et partagées. Mais aussi la vitesse à laquelle ces données grandissent. L’illustration suivante montre combien nous produisons de données en une minute sur le web.

Ce qu'il se passe sur le Net en 60 secondes. D'après le site qmee.com. (2014)

Ce qu’il se passe sur le Net en 60 secondes. D’après le site qmee.com. (2014)

Visualisation

Les données doivent être lues et comprises par les utilisateurs et décideurs. On doit pouvoir comprendre les données d’un simple coup d’oeil et ces présentations peuvent être simples ou dynamiques. On parle alors de « data vizualisation ».

Variabilité 

Avec l’augmentation de la variété et de la vélocité des données, les flux de données entrantes peuvent subir des pics périodiques. Cette montée en charge peut être difficile à gérer surtout si des données non structurées sont impliquées dans les calculs. Par exemple, on peut facilement déceler une augmentation de l’utilisation des réseaux sociaux grâce au volume de données qu’ils engendrent lors d’événements divers et variés (Nouvel An, Noël, match de football, etc., etc.).

Visibilité

Les réseaux sociaux ont une portée virale extraordinaire pour n’importe quel message, des plus malicieux aux plus nobles (comme les « badbuzz » ou pour aider à trouver une personne disparue), à condition qu’on sache saisir la sensibilité du public auquel on les destine, en effet on ne s’adresse pas de la même manière à des adolescents ou des adultes.

Véracité

Cette visibilité accrue et non contrôlée peut engendrer des problèmes pour les marques ou pour des personnes. On parle alors de « bad buzz », ils attirent souvent une très forte audience et la réputation de la victime peut vite être mal perçue par les internautes. Il faut donc s’assurer de la qualité des données récoltées, car elle peut varier grandement et la précision des analyses dépend de l’exactitude des sources.

Valorisation

L’information sera le nouvel or noir du 21e siècle. Donc il ne faut pas oublier que l’exploitation de ces données doit produire un bénéfice financier surtout pour les entreprises dans le secteur privé. En fait, la valeur de ces données vient de l’analyse et de l’application des résultats aux besoins spécifiques des entreprises.

La gestion des données peut devenir un processus très complexe et gérer les 8V demande beaucoup ressources. Aujourd’hui les données viennent de différentes sources dans un très grand volume. Elles doivent être reliées, nettoyées, transformées et hiérarchisées à travers les différents systèmes afin que l’on puisse comprendre et saisir l’information produite par ces données. Cette situation est appelée comme la « complexité » du Big Data.

Article écrit par Thomas Malice

J'ai suis actuellement à la Haute école de Condorcet à Tournai, suivant la formation du Bachelier en E-Business. Je suis passionné par les nouvelles technologies et avancées scientifiques, et tout ce qui touche au « Web ». Grâce aux cours dispensés à Condorcet, j’ai appris à travailler sur des logiciels comme Adobe Dreamweaver, Adobe Photoshop, WordPress, mais aussi à programmer que ce soit en PHP, JavaScript, C#, HTML et CSS.

Quelque chose à dire? Réagissez!

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *