Tout savoir sur la Small Data

Small Data : tout savoir sur les micros données

Le Small Data désigne ces données suffisamment petites pour la compréhension humaine, par opposition au Big Data, trop volumineux pour être analysé par des humains. Ces micros données se présentent dans un volume et un format qui les rendent accessibles, informatives et exploitables. Pour faire simple, le terme « Big Data » est propre aux machines, tandis que « Small Data » concerne les personnes.

Small Data vs Big Data : les bases

Le Big Data fait généralement référence à un ensemble de données structurées et non structurées pouvant être mesurées en pétaoctets ou en exaoctets. Le Big Data se caractérise généralement par le volume de données, la variété des données traitées et la vitesse de traitement des données. Tout cela rend la gestion du Big Data très complexe. Voici un exemple. Des capteurs collectent des données météorologiques d’un pays. Des ordinateurs viennent ensuite traiter cette grande quantité de données avant de la transformer en un graphique. 

Le Small Data en revanche est constitué de petits éléments lisibles, accessibles, compréhensibles et utilisables. Le Small Data fournit généralement des informations qui répondent à une question spécifique ou abordent un problème particulier. Il peut s’agir des scores d’un match de baseball, des rapports d’inventaire, des données de vente, des mesures biométriques, des historiques de recherche ou encore des prévisions météorologiques.

Volume, variété, vitesse

Tout savoir sur le Small Data

En règle générale, les experts en données définissent le Big Data par les « trois V » : volume, variété et vitesse. En réalité, les trois V ne sont pas uniquement des caractéristiques du Big Data. C’est aussi ce qui le différencie du Small Data.

Le volume

Le volume de données est la quantité de données traitée. Le Big Data implique de plus grandes quantités d’informations, tandis que les petites données sont, sans surprise, plus petites. Les mégadonnées sont souvent utilisées pour décrire des ensembles massifs d’informations non structurées. Les petites données, en revanche, impliquent des métriques plus précises et plus petites.

La variété

La variété des données fait référence au nombre de types de données. En analysant le trafic vers le site web d’une entreprise par exemple, le Big Data peut faire référence au nombre total de visiteurs, quelle que soit la manière dont ils ont atteint le site ou leurs qualités démographiques. Le Small Data pour sa part a tendance à se concentrer sur un type de données, les visiteurs qui ont trouvé l’entreprise via les réseaux sociaux par exemple.

La vitesse

La vitesse des données décrit la vitesse à laquelle les informations sont acquises et traitées. En règle générale, les mégadonnées impliquent d’énormes quantités d’informations introduites et analysées par lots périodiques. D’un autre côté, les petites données peuvent être traitées rapidement et impliquent des ensembles d’informations en temps réel ou quasi réel.

Le Small Data, oui, mais pourquoi ? 

Le Big Data est difficile 

La collecte et le traitement des données à grande échelle peuvent prendre du temps, tout comme les retombés. Par ailleurs, la plupart des spécialistes en marketing digital n’ont pas besoin de données massives complètes pour définir leur stratégie et offrir une expérience personnalisée aux cibles.

Le Small Data de son côté est partout, sur les réseaux sociaux entre autres. Les données sont de suite disponibles et prêtes à être collectées pour éclairer les décisions de marketing et d’achat. À un niveau personnel, tout internaute crée des petites données à chaque fois qu’il fait une recherche, surfe sur Internet, publie sur un réseau social, etc. Il crée systématiquement une signature unique donnant un aperçu de son activité numérique.

Le Small Data au cœur du CRM social 

Tout savoir sur le Small Data

Le CRM social ou la gestion de la relation client sociale est l’intégration des canaux de médias sociaux dans les plateformes de gestion de la relation client (CRM). Les plateformes de CRM social prennent en charge les médias sociaux aux côtés des canaux traditionnels (téléphone, SMS, chat, e-mail). Le CRM social permet à une entreprise de communiquer avec ses clients en utilisant le canal de leur choix, que ce soit par téléphone, SMS, chat, e-mail ou via les réseaux sociaux (Facebook ou Twitter par exemple ). 

Suite à quoi, un système de CRM social aide les entreprises à recueillir des informations plus riches et exploitables sur le sentiment des clients envers leur entreprise, leur marque, des produits ou des services spécifiques. Et le Small Data reste un des points clés pour construire des profils riches qui seront au centre des nouvelles solutions CRM.

Le Small data concerne les utilisateurs finaux

Le Small Data concerne l’utilisateur final. Ces données renseignent sur ce dont il a besoin, sur ses réactions et ses sentiments. En se concentrant sur l’utilisateur, les décisions deviennent plus claires. Et puis le Small Data est facile. Nul besoin d’être un Data Scientist pour comprendre ce type de données ou les appliquer aux tâches quotidiennes. C’est simple.

Le Small Data et IA

Quel est le rôle du Small Data dans l’avenir de l’IA ? Des efforts ont déjà été entrepris dans ce sens. Le mantra actuel du Deep Learning souligne la nécessité d’un grand volume de données pour l’IA. Et pourtant, l’IA semble devenir encore plus intelligente et puissante si elle a la capacité d’être entraînée avec le Small Data. Certaines solutions d’IA qui reposent uniquement sur de petites données surpassent celles qui travaillent avec des données volumineuses. Certaines autres solutions d’IA utilisent le Big Data pour apprendre à tirer parti du Small Data.

Le Small Data transforme le Big Data en un outil

Tout savoir sur le Small Data

Les petites données transforment les mégadonnées en un outil et définissent des spécificités d’un système d’IA. Dans certains cas, le Deep Learning n’est pas nécessaire pour créer une IA performante. Certes, il y a une tendance à former l’IA en utilisant autant de données que possible et en mélangeant des données réelles avec des données synthétiques. Mais dans de nombreux cas, les problèmes ne peuvent pas être résolus avec les seules mégadonnées. Certaines conclusions importantes ne peuvent être tirées que du Small Data. Par exemple, on obtient un aperçu de la personnalité, des habitudes et des motivations d’un individu uniquement avec le Small Data. 

Le Small Data fournit des informations pertinentes à partir des données personnelles de chaque individu. L’IA doit être capable d’extraire ce sens. Des ensembles de données massifs risquent de l’obscurcir plus qu’autre chose. Et les méthodes de machine Learning appliquées à ces ensembles de données font généralement la moyenne de ces informations. L’idée est donc de créer des approches d’IA capables de trouver de la valeur dans le Small Data.

Avec le Small Data, tout a du sens. Le Small Data peut être analysé par les humains. De plus, un seul humain ne génère normalement que de petites données. Par conséquent, tout produit ou service optimisé pour les consommateurs doit fonctionner avec de petites données. En fin de compte, l’IA doit être adaptée à une personne individuelle et devrait apprendre des informations provenant uniquement de cette personne. 

IA, Small Data et personnalisation 

Une IA qui s’appuie exclusivement sur de petites données peut fournir une personnalisation sans précédent. L’IA consiste à maîtriser les connaissances, pas à traiter les données. Il s’agit de donner à une machine les connaissances nécessaires pour effectuer une tâche. Une forme de connaissance très spécifique est requise pour personnaliser un produit pour un consommateur donné. 

Les ventes relèvent du Big Data. Le marketing s’appuie également sur les mégadonnées. C’est la tendance. Même les recommandations de produits individuels impliquent plus de données que nécessaire. Et pourtant, en utilisant le Small Data, les marketeurs passent d’une analyse basée sur la moyenne à une prise de décision immédiate, de la multidiffusion à l’individualisation, de la généralisation à la personnalisation.

Pour les marques par exemple, l’ajustement d’un produit est généralement élaboré au moyen de simulations. La simulation individualisée ne peut pas être réalisée avec le Big Data. Le modèle de simulation doit en effet intégrer les commentaires des clients, ce qui relève du Small Data. 

Utiliser le Big Data pour former l’IA et apprendre à partir du Small Data

Tout savoir sur le Small Data

Le Deep Learning nécessite généralement des données volumineuses. D’ailleurs, ce besoin en mégadonnées constitue la principale limite de cette méthode. Si un projet de Deep Learning échoue, le manque d’ensemble de données de qualité suffisamment volumineuses est souvent mis en cause. Très éclectique, le Deep Learning a besoin de beaucoup de données. Il peut tout apprendre. Et parce qu’il peut tout apprendre, il a besoin de beaucoup de données pour apprendre quelque chose. 

En revanche, les apprenants spécialisés peuvent apprendre à partir de petites quantités de données. Les humains n’apprennent qu’à partir de petites données. Pour un humain, il suffit de voir une voiture pour reconnaître ensuite toutes les voitures. Les humains n’ont pas besoin de millions d’exemples de voitures pour reconnaître les voitures de manière fiable. Les apprenants spécialisés sont capables d’apprendre à partir de petites données, car ils possèdent des biais inductifs corrects. 

Les biais inductifs représentent la connaissance du monde dans lequel l’apprentissage aura lieu. Ceux-ci sont présents dans le modèle avant même que la formation ne commence. En d’autres termes, le modèle doit déjà savoir extraire du sens d’un certain type de données. Un modèle de Machine Learning ne peut apprendre avec succès à partir de petites données que s’il dispose d’une quantité suffisante de telles connaissances. 

Le Small Data, l’avenir de l’IA

L’IA créée directement à partir du Big Data n’est qu’un prélude à ce qui s’en vient. L’avenir de l’IA est une IA capable de maîtriser le Small Data. Une telle IA est possible et existe déjà. L’IA pour les petites données peut être créée à la fois « à la main » et par le biais de l’apprentissage automatique. Ceci, en effectuant une formation initiale à partir de données volumineuses. 

L’idéal est de combiner l’expertise humaine et la formation entraînée par la machine appliquée pour implémenter l’expertise du Small Data. Les humains ont toujours excellé en utilisant de petites données. Les chercheurs commencent tout juste à construire des machines intelligentes capables d’exploiter de petites données pour aider à améliorer la civilisation à des niveaux jamais vus auparavant. En somme, la maîtrise du Small Data est essentielle pour faire progresser l’IA.

Utilisation du Small Data en entreprise

Le Small data est partout. Les médias sociaux à eux seuls offrent un éventail de petites données sur les décisions des acheteurs et le cycle de vie des clients. En fait, toute personne possédant un ordinateur ou un smartphone crée de petites données chaque fois qu’elle se connecte à Facebook, clique sur une publicité ou recherche un produit qu’elle a vu sur le compte Instagram d’un influenceur.

Le Small Data se traduit immédiatement en business intelligence. Par nature, les petites données sont plus faciles à comprendre pour les humains. Celles-ci sont aussi exploitables. Cela signifie que les marketeurs peuvent les utiliser au profit de leur entreprise, et ce, immédiatement.

Booster les stratégies marketing et de business intelligence

De plus en plus d’entreprises utilisent le Small Data. Plus que jamais, les entreprises commencent à comprendre la valeur des décisions marketing basées sur les données. En utilisant de petites données, celles-ci peuvent optimiser leurs stratégies marketing et de business intelligence. Le Big Data est toujours important, mais le combiner avec le Small Data est la première étape pour toucher efficacement les clients

Tout savoir sur le Small Data

Les spécialistes du marketing peuvent obtenir des informations sur le marché en rassemblant des petites données et en observant les consommateurs dans leur propre environnement. Par rapport au Big Data, le Small Data a le pouvoir de déclencher des émotions et de fournir des informations sur les raisons qui sous-tendent les comportements des clients. Les petites données peuvent révéler des informations détaillées sur l’extraversion ou l’introversion d’une personne, sa confiance en soi, etc. 

Le Small Data dans le secteur de la santé

Des chercheurs de l’Université Cornell ont commencé à développer des applications pour surveiller les problèmes de santé des patients en se basant sur le Small Data. Il s’agit d’une initiative du Small Data Lab de Cornell, en étroite coopération avec le Weill Cornell Medicine College, dirigé par Deborah Estrin.

Le Small Data Lab a développé une série d’applications, se concentrant par exemple  sur la collecte de données relative à la douleur des patients. Cela permettrait d’identifier des modèles qui pourraient indiquer des fluctuations des performances cognitives, de la fatigue, des effets secondaires des médicaments, etc. Les informations sur les habitudes alimentaires, révélées par la liste des achats, permettent pour leur part d’adapter les courses aux recommandations des nutritionnistes. 

Le Small Data au service de la poste

Le service postal des États-Unis (USPS) a utilisé la reconnaissance optique de caractères (ROC) pour lire et traiter automatiquement 98 % de tout le courrier adressé à la main et 99,5 % du courrier imprimé par machine. En combinant cette technologie avec son petit échantillon de données de codes postaux américains, l’USPS peut désormais traiter plus de 36 000 pièces de courrier par heure.

L’IA pour améliorer la vitesse et la précision du flux de travail de maintenance aérospatial

Actuellement, il n’existe pas de procédure standardisée pour documenter les journaux de maintenance conduisant à des petits ensembles de données non structurés. En conséquence, il devient très difficile pour les agents de maintenance de traduire ces variations dans les journaux de maintenance dans un court laps de temps. Cependant, avec l’IA et un ensemble de données restreint de la terminologie commune de la maintenance des aéronefs, il devient possible de traduire dynamiquement ces journaux en temps réel. En utilisant l’IA pour améliorer la vitesse et la précision du flux de travail de maintenance des compagnies aériennes, les compagnies aériennes pourraient économiser des milliards selon la Harvard Business Review.

Pin It on Pinterest