Algorithmes AI : les GAFAM largement avantagés par leurs trésors de données ?

Avoir des ressources quasi illimitées dans le et l'IA ça compte. C'est ce que concluent les journalistes de Wired à la lecture de l'étude publiée par sur des algorithmes de Big Data, réalisée en partenariat avec l'Université de Carmegie Mullon, situé à Pittsburgh aux États Unis.

Les deux partenaires voulaient savoir comment améliorer l'efficacité des algorithmes de Computer vision, la fameuse technologie de reconnaissance d'image.

Pour ce faire, les chercheurs ont émis deux hypothèses : soit il faut améliorer les algorithmes eux-mêmes, soit il faut augmenter considérablement le nombre de données à traiter lors de l'entraînement.

Une hypothèse gourmande en ressources

Google a donc mis au service de la recherche 50 processeurs graphiques très puissants , et donc très cher, pendant deux mois entiers. Selon le protocole de l'étude, les chercheurs ont comparé l'efficacité des algorithmes de Computer Vision nourri avec 1 million d'images et ceux alimentés par 300 millions d'images. Ils devaient reconnaître des objets dans ces fichiers, par exemple.

Résultat, le deuxième échantillon a été bien plus efficace. Oui, augmenter le nombre de jeux de données permet d'améliorer la précision des algorithmes de computer vision… de 3 %.

Alors, pourquoi investir dans le stockage de masse et des processeurs graphiques puissants nécessaires au bon fonctionnement des algorithmes ? Cela peut se justifier par la possibilité selon l'auteur de l'article scientifique d'améliorer ce résultat en optimisant les algorithmes pour des jeux de données à large échelle.

Des algorithmes cruciaux pour les marchés économiques de demain

Aussi petit soit le pourcentage d'augmentation de performance, il peut être un avantage crucial dans l'avènement de technologies comme la voiture autonome, la surveillance vidéo avancée ou l'imagerie médicale.

Selon les journalistes de Wired les conséquences de ce changement seraient bénéfiques pour des entreprises qui gèrent et possèdent des quantités de données impressionnantes : Google, , , , , etc.

Quand les GAFAM protègent leurs données, les startups redoublent d'ingéniosité

algorithmes dragon

S'ils partagent souvent leurs technologies et leurs données en les rendant open source, les GAFAM adoptent généralement la position du dragon gardien de trésor en ce qui concerne les Data Sets destinés à l'intelligence artificielle. Et quand un jeu de données est libéré pour faciliter l'amélioration d'algorithmes de langage, ce dernier n'est pas critique pour la concurrence.

Après la publication des résultats de cette recherche scientifique, Google et l'Université de Pittsburgh défendent le fait de pouvoir utiliser des images libres de droits. Elles pourraient être mises à disposition par Facebook et Microsoft par le biais de leur fondation respective.

Cette approche financièrement et énergétiquement gourmande n'est pourtant pas la meilleure méthode d'évolution du machine learning.

L'enjeu de la propriété des données se pose généralement pour les startups spécialisées dans ce domaine. La reconnaissance d'objets dans une image est bien plus aisée que la détection d'une maladie, qui demande d'avoir accès à des dossiers médicaux. Les jeunes entreprises pensent donc leurs algorithmes dans une économie de moyens : elles visent à réduire le nombre de jeux de données pour rendre opérationnels leurs algorithmes.

La fracture économique entre les géants de la tech et les autres n'est donc pas rédhibitoire. La capacité d'innovation repose aussi sur l'imagination et la réflexion.

Newsletter

Envie de ne louper aucun de nos articles ? Abonnez vous pour recevoir chaque semaine les meilleurs actualités avant tout le monde.

Cliquez pour commenter

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *