gan tout savoir

GAN ou réseau antagoniste génératif : qu’est-ce que c’est ?

Un GAN ou Generative Adversarial Network (réseau antagoniste génératif) est une technique d'intelligence artificielle permettant de créer des imitations parfaites d'images ou autres données. Découvrez tout ce que vous devez savoir sur cette technologie fascinante et effrayante à la fois…

Un GAN ou Generative Adversarial Network (réseau antagoniste génératif en français) est une technique de Machine Learning. Elle repose sur la mise en compétition de deux réseaux au sein d'un framework.

Ces deux réseaux sont appelés  » générateur  » et  » discriminateur « . Le générateur est un type de réseau neuronal convolutif dont le rôle est de créer de nouvelles instances d'un objet. De son côté, le discriminateur est un réseau neuronal  » déconvolutif  » qui détermine l'authenticité de l'objet ou s'il fait ou non partie d'un ensemble de données.

Pendant le processus d'entraînement, ces deux entités sont en compétition et c'est ce qui leur permet d'améliorer leurs comportements respectifs. C'est ce que l'on appelle la rétropropagation.

L'objectif du générateur est de produire des outputs sans que l'on puisse déterminer s'ils sont faux, tandis que l'objectif du discriminateur est d'identifier les faux. Ainsi, au fil du processus, le générateur produit des outputs de meilleure qualité tandis que le discriminateur détecte de mieux ne mieux les faux. De fait, l'illusion est de plus en plus convaincante au fil du temps.

Comment fonctionnent les GAN ?

Dans un premier temps, il convient de déterminer ce que l'on souhaite que le GAN produise (l'output). La seconde étape consiste à composer un ensemble de données basé sur ces paramètres. Ces données sont ensuite entrées dans le générateur jusqu'à ce qu'il commence à produire des outputs convaincants.

Les images générées sont ensuite transmises au discriminateur, aux côtés des véritables points de données du dataset. Le discriminateur filtre les informations, et établit une probabilité comprise entre 0 et 1 pour déterminer l'authenticité de l'image. Le chiffre 1 signifie que l'image est réelle, le 0 indique qu'il s'agit d'un faux. Ces valeurs sont ensuite vérifiées manuellement, et le processus est répété jusqu'à ce que le résultat souhaité soit atteint.

Quels sont les cas d'usage ?

Les GAN peuvent avoir de multiples cas d'usage. Il est possible de s'en servir pour imiter du contenu multimédia, des textes ou encore des discours. De manière générale, la principale utilité d'un GAN est de créer des données à partir de rien.

Parmi les applications populaires de cette technologie, on peut citer la modification ou la création d'images, la colorisation d'images en noir et blanc, ou encore l'amélioration de la définition d'une image. Il est par exemple possible de créer de faux visages grâce à cette technologie.

Il est aussi possible de s'en servir pour créer des animations de comportement ou de mouvement humains pour des vidéos. C'est ainsi que l'acteur Harrison Ford a pu être intégré au trailer du film Star Wars : Solo.

Cette technologie est aussi de plus en plus utilisée pour créer des vidéos de type  » deepfakes « . On peut ainsi citer la vidéo où se vante de contrôler les utilisateurs de , ou encore celle où la présidente de la Chambre des représentants des États-Unis Nancy Pelosi semble ivre.

De même, les GAN peuvent servir à recréer une peinture ou une photo populaire. C'est ainsi que Mona Lisa a pu prend vie grâce à l'IA de Samsung. On peut aussi s'en servir pour entraîner une IA à écrire des articles pour un blog ou un site web en se basant sur du contenu existant. Il est aussi possible de générer une image à partir de texte, ou encore de produire des représentations photoréalistes de prototypes de produits.

GAN et Data Augmentation

Parmi les avancées réalisées grâce à l'utilisation du Deep Learning dans le domaine de la vision par ordinateur, on compte une technique appelée  » data augmentation «  ou augmentation des données.

Cette technique permet l'élaboration de modèles plus performants, avec un taux d'erreur fortement réduit. Elle repose sur la création de nouveaux exemples artificiels mais plausibles sur le domaine pour lequel le modèle est entraîné.

Dans le cas des données d'images, la data augmentation peut se présenter sous forme de modifications très simples : rognage, zoom, retournement… et autres transformations des images de l'ensemble de données d'entraînement.

Toutefois, les GAN offrent une alternative et une approche plus spécifique pour la data augmentation. En réalité, la data augmentation elle-même peut être considérée comme une version simplifiée des modèles génératifs.

Tout particulièrement, dans le cas des domaines les plus complexes, où le volume de données est limité, les modèles génératifs permettent un meilleur entraînement des modèles. On utilise notamment les GAN pour le Deep Learning par renforcement.

Ces réseaux génératifs antagonistes peuvent compenser le manque de données, et offrir des résultats multiples. La définition des images peut être améliorée, des images artistiques peuvent être entièrement créées, et il est même possible de modifier les images en changeant par exemple la saison ou en passant du jour à la nuit.

Newsletter

Envie de ne louper aucun de nos articles ? Abonnez vous pour recevoir chaque semaine les meilleurs actualités avant tout le monde.

Cliquez pour commenter

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *