Le Big data est devenu un véritable phénomène qui suscite la convoitise de plusieurs entreprises.
La Big Data n’est pas nécessairement massive
Ces données permettent aux entreprises de comprendre le fonctionnement de leurs clients et de prédire leurs besoins. Cependant, certaines entreprises n’ont qu’une fraction de données mais prétendent le contraire ; de plus, seule une partie de cette fraction est vraiment utile. En effet, les entreprises mentent pour ressembler aux géants de ce secteur tels que Facebook, Google. Elles croient qu’en injectant des tas de données dans une entreprise technologique normale, cette dernière va devenir le prochain Google ; alors qu’en réalité, elles n’ont ni la capacité de rassembler autant de données, ni l’argent nécessaire pour en acheter. De plus, elles ne savent pas que ces grandes entreprises n’utilisent qu’une infime partie des données recueillies car la plupart des données de masse ne sont pas utiles.
Pourquoi conserver tous les données ?
Même si c’est seulement une partie du Big Data qui est véritablement utilisée, ces données massives ne sont pas inutiles pour tout le monde. En effet, elles sont capitales pour certains types d’algorithme de transformation et de modélisation prédictive qui ne fonctionnent que sur des données massives étiquetées : images, textes, vidéos. Il est à noter que l’étiquetage de ces quantités impressionnantes de données nécessite plusieurs milliers de dollars, et que seuls les géants du milieu peuvent se le permettre tels que Facebook ou Google. Il suffit alors de former un algorithme sur un ensemble de données assez conséquentes avant de l’utiliser par la suite sur des données de petites tailles. A l’exemple de la plateforme MetaMind, dont les algorithmes peuvent juger si le contenu d’un tweet individuel est positif ou négatif.
- Partager l'article :