GPT-4 : la nouvelle IA surpuissante de ChatGPT déjà disponible ! Tout savoir
gpt-4-openai-tout-savoir

GPT-4 : la nouvelle IA surpuissante de ChatGPT déjà disponible ! Tout savoir

Après plusieurs mois de rumeur, OpenAI a enfin déployé GPT-4. Ce nouveau modèle IA est capable de comprendre le texte, mais aussi les images. Il va permettre à ChatGPT et aux autres applications basées sur GPT de devenir encore plus intelligentes et polyvalentes ! Découvrez tout ce que vous devez savoir.

Nous vivons actuellement une époque formidable, et assistons à l’avènement de l’ère de l’IA. Depuis plusieurs mois, un nouveau type de modèle révolutionnaire bouleverse notre société.

En juillet 2022, OpenAI a lancé DALL-E 2 : un modèle text-to-art. Il peut générer une image à partir d’un « prompt » textuel. En fin d’année, la startup a dévoilé ChatGPT : un chatbot capable de répondre au langage naturel.

Le point commun de ces IA est qu’elles reposent sur GPT-3 : le « large modèle de langage » d’OpenAI. A présent, la firme vient de lancer GPT-4 le 14 mars 2023. Elle va propulser l’intelligence artificielle dans une nouvelle dimension…

Qu’est-ce que GPT ?

Le Generative Pre-trainer Transformer (GPT) est un modèle de deep learning de génération de texte entraîné sur les données disponibles sur Internet. Il peut répondre des questions, résumer un texte, traduire ou même de générer un code informatique.

Les applications potentielles de GPT sont illimitées. Il est même possible de le customiser par le « fine-tuning » pour affiner les résultats. Il s’agit d’un modèle de type « Transformer ».

Le fonctionnement de GPT est similaire aux assistants vocaux comme Alexa et Siri, mais à une tout autre échelle. Cette IA est capable d’écrire un livre entier ou des centaines d’idées de publications de réseaux sociaux en une minute.

On peut le définir comme une intelligence à la demande. Cette IA peut être utilisée pour résoudre n’importe quel problème nécessitant une implication humaine. Ainsi, GPT offre de nombreuses opportunités pour les entreprises.

Toutefois, GPT-3, lancé en 2020, est encore loin d’être parfait. Des problèmes tendent à survenir quand on lui demande de générer de longs textes, en particulier sur des sujets complexes nécessitant des connaissances précises. Or, GPT-4 apporte de nombreuses améliorations.

Avant GPT

La révolution actuelle de l’IA pour le langage naturel naquit seulement avec l’invention des modèles transformateurs. À commencer par le BERT de Google en 2017. Précédemment, la génération de texte était réalisée avec d’autres modèles de deep learning. Notamment les réseaux neuronaux récursifs (RNN) et les réseaux neuronaux à mémoire longue à court terme (LSTM). Ceux-ci fonctionnaient bien pour la sortie de mots uniques ou de phrases courtes. Toutefois, ils ne pouvaient pas générer un contenu plus long réaliste.

L’approche du transformateur du BERT a constitué une avancée majeure. En effet, il ne s’agit pas d’une technique d’apprentissage supervisé. En d’autres termes, elle n’a pas besoin d’un ensemble de données annotées coûteux pour s’entraîner. Le BERT a été utilisé par Google pour interpréter les recherches en langage naturel. Cependant, il ne peut pas générer de texte à partir d’une invite.

De GPT-1 à GPT-3

Avant le premier GPT, la plupart des modèles de Traitement Naturel du Langage (NLP) étaient entraînés pour des tâches spécifiques comme la classification ou la traduction de texte. Ils utilisaient l’apprentissage supervisé.

Or, cette approche présente deux inconvénients. Le premier est un manque de données annotées à disposition, et le second est l’incapacité à effectuer des tâches générales.

C’est en 2018 qu’OpenAI a mis un coup de pied dans la fourmilière. Cette entreprise a publié l’article « Improving Language Understanding by Generative Pre-Training » (améliorer la compréhension du langage par le pré-apprentissage génératif) dans la revue Paperswithcode.

À travers cette étude, la startup présente GPT-1 : un modèle génératif de langage à 117 millions de paramètres. Ces derniers ont été entraînés sur des données sans label et fine-tuned (raffiné) pour des tâches spécifiques comme la classification et l’analyse de sentiment.

Un an plus tard, en 2019, l’article « Language Models are Unsupervised Multitask Learners » (les modèles de langage sont des apprenants multi-tâches non-supervisés) présente GPT-2. Ce modèle à 1,5 milliard de paramètres a été entraîné sur un jeu de données bien plus large. Il exploite aussi les techniques de conditionnement de tâches, d’apprentissage zero-shot, et de transfert de tâches zero-shot.

Puis, en 2020, OpenAI introduit GPT-3 et ses 175 milliards de paramètres avec l’article « Language Models are Few-Shot Learners ». Ce nouveau modèle a 100 fois plus de paramètres que GPT-2, et a été entraîné sur un dataset encore plus large pour maximiser ses résultats. Il repose aussi sur les techniques de learning in-context, one-shot, few-shot et zero-shot.

Cette IA est parvenue à choquer le monde entier en écrivant des histoires, des requêtes SQL, des scripts Python et des synthèses de texte. A présent, GPT-4 représente un nouveau pas en avant.

GPT-4 : une IA multimodale texte/image

Alors que GPT-3.5 acceptait uniquement les inputs sous forme de texte, GPT-4 peut aussi recevoir des images. C’est une amélioration majeure.

Cette nouvelle IA est capable de légender ou même d’interpréter des images relativement complexes. Par exemple, elle peut identifier un adaptateur de câble Lightning à partir d’une photo d’iPhone branché.

gpt4 images

Pour l’heure, cette capacité n’est pas accessible à tous les clients d’OpenAI. Elle est en cours de test avec un partenaire unique : Be My Eyes.

La nouvelle fonctionnalité Virtual Volunteer (volontaire virtuel) du service se base sur GPT-4, et peut répondre à des questions sur les images qui lui sont envoyées.

Sur son blog, l’entreprise explique comment cela fonctionne. « Par exemple, si un utilisateur envoie une photo de l’intérieur de son frigo, le Virtual Volunteer ne va pas seulement être capable d’identifier ce qui est dedans. En fait, il va aussi extrapoler et analyser ce qui peut être préparé avec ces ingrédients ».

L’outil pourra aussi proposer plusieurs recettes pour ces ingrédients et envoyer un guide étape par étape pour les réaliser. Autant dire que cette multimodalité va ouvrir une myriade de nouvelles possibilités…

virtual volunteer gpt-4

GPT-4 surpasse 90% des étudiants sur les examens universitaires

Par ailleurs, GPT-4 parvient à égaler l’humain sur une large variété de benchmarks professionnels et académiques.

L’IA a par exemple obtenu un score supérieur à 90% des étudiants sur une simulation d’examen d’avocat, alors que celui de GPT-3.5 était similaire à celui des 10% de candidats les plus mauvais.

Elle a également ajouté 150 points à son score SAT, atteignant désormais 1410 sur 1600. Il s’agit d’un test à choix multiple créé par le College Board.

examens gpt-4

L’orientabilité : gros point fort de GPT-4

L’orientabilité est l’une des principales améliorations apportées par GPT-4. L’API s’enrichit d’une capacité de « messages système » permettant aux développeurs de prescrire le style et la tâche en décrivant des directions spécifiques.

Les messages système sont des instructions essentielles pour paramétrer le ton et mettre en place des barrières pour les interactions de l’IA.

Par exemple, un message système peut indiquer : « vous êtes un tuteur qui répond toujours dans un style socratique. Vous ne donnez jamais la réponse à l’étudiant, mais vous essayez toujours de poser la bonne question pour l’aider à apprendre à penser par lui-même. Vous devez toujours adapter votre question à l’intérêt et la connaissance de l’étudiant, décomposer le problème en parties plus simples jusqu’à ce qu’il soit au niveau adéquat pour eux ».

Cette nouvelle fonctionnalité sera également ajoutée à ChatGPT dans un futur proche. Ceci devrait permettre au chatbot de devenir moins monotone et générique.

ChatGPT peut prédire les mouvements boursiers

Alejandro Lopez-Lira, professeur de finance à l’université de Floride, estime que les grands modèles de langage peuvent être utiles pour prévoir les cours des actions.

Il a utilisé ChatGPT pour analyser les titres des journaux afin de déterminer s’ils sont bons ou mauvais pour une action. Il a constaté que la capacité de ChatGPT à prédire l’orientation des rendements du lendemain était bien meilleure que le hasard.

L’expérience touche au cœur des promesses de l’intelligence artificielle de pointe. Avec des ordinateurs plus puissants et de meilleurs ensembles de données – comme ceux qui alimentent ChatGPT – ces modèles d’IA peuvent présenter des « capacités émergentes ». Plus exactement, ils peuvent présenter des capacités qui n’étaient pas prévues à l’origine lors de leur construction.

Si ChatGPT peut afficher la capacité émergente de comprendre les titres de l’actualité financière et leur impact sur le cours des actions, cela pourrait mettre en péril des emplois bien rémunérés dans le secteur financier. Goldman Sachs a estimé, dans une note datée du 26 mars, qu’environ 35 % des emplois financiers risquent d’être automatisés par l’IA.

« Le fait que ChatGPT comprenne des informations destinées aux humains garantit presque que si le marché ne réagit pas parfaitement, il y aura une prévisibilité des rendements. Mais les spécificités de l’expérience montrent également à quel point les « grands modèles de langage » sont loin d’être capables d‘effectuer de nombreuses tâches financières.

Par exemple, l’expérience n’a pas inclus de prix cibles, et le modèle n’a pas fait de calcul du tout. En fait, la technologie de type ChatGPT invente souvent des chiffres, comme Microsoft l’a appris lors d’une démonstration publique au début de l’année. L’analyse du sentiment des gros titres est également bien comprise en tant que stratégie commerciale. Plus encore, il existe déjà des ensembles de données propriétaires.

Comment OpenAI a entraîné GPT-4 ?

https://www.youtube.com/watch?v=TxkJMX0KyS0

Afin de perfectionner GPT-4, OpenAI a passé 6 mois à « aligner itérativement » ce modèle en utilisant des leçons d’un programme de test contradictoire et ChatGPT.

C’est ce qui a permis selon la firme d’obtenir les meilleurs résultats jusqu’à présent en termes de factualité, d’orientabilité et de refus de franchir les garde-fous.

Tout comme les précédentes versions de GPT, cette quatrième mouture a été entraînée sur des données disponibles publiquement, provenant notamment de pages web publiques.

A l’aide de Microsoft, OpenAI a également développé un superordinateur sur le cloud Azure. Cette machine virtuelle a ensuite été utilisée pour entraîner GPT-4.

GPT-4 vs GPT-3

Selon un billet de blog publié par OpenAI, « la différence entre GPT-3.5 et GPT-4 peut être subtile dans une conversation banale ». En revanche, tout le potentiel du nouveau modèle se révèle quand la complexité d’une tâche atteint un certain seuil.

En effet, GPT-4 est plus fiable, plus créatif et capable de prendre en charge des instructions bien plus nuancées que GPT-3.5.

Par ailleurs, GPT-4 a 82% de chances en moins de répondre à des requêtes pour du contenu « non-autorisé », et refuse de répondre à des questions sensibles comme les conseils médicaux ou en lien avec l’auto-mutilation 29% plus souvent.

gpt4 limites

Une intelligence encore très artificielle

Malgré ces nombreuses améliorations, OpenAI admet que GPT-4 reste loin d’être parfait. L’IA continue « d’halluciner » des faits et de commettre des erreurs de raisonnement, parfois avec beaucoup d’assurance.

Dans un exemple cité par OpenAI, GPT-4 a par exemple décrit Elvis Presley comme le « fils d’un acteur ». De toute évidence, ce n’est pourtant pas sa caractéristique principale…

Comme l’explique la firme de San Francisco, « GPT-4 manque généralement de connaissances sur les événements survenus après septembre 2021 et n’apprend pas de ses expériences ». Rappelons en effet que son jeu de données d’entraînement s’arrête à cette date.

De plus, « elle peut parfois commettre des erreurs de raisonnement simple qui ne semblent pas compatibles avec la compétence dans tant de domaines, ou faire preuve de crédulité en acceptant des déclarations évidemment fausses de la part de l’utilisateur ».

Parfois, l’IA peut aussi « échouer sur des problèmes difficiles à la manière des êtres humains, par exemple en introduisant des vulnérabilités de sécurité dans le code qu’elle produit ».

OpenAI change de stratégie : une IA fermée et drapée de mystère

Pour accompagner le lancement de GPT-4, OpenAI a publié un rapport technique de 98 pages. Toutefois, certains chercheurs déplorent un manque de transparence et d’ouverture… aux antipodes des valeurs originelles dont la firme tire son nom.

D’ailleurs, le document indique explicitement que :

« compte tenu du paysage compétitif et des implications en termes de sécurité des larges modèles comme GPT-4, ce rapport ne contient pas de détails sur l’architecture, la taille du modèle, le hardware, la méthode d’entraînement ou la construction du dataset ».

Ainsi, GPT-4 est beaucoup plus secret que ses prédécesseurs. C’est un revirement majeur pour l’entreprise dont l’open-source était le principe fondateur.

Les chercheurs reprochent notamment à OpenAI de :

  • ne pas permettre d’évaluer les éventuels biais de GPT-4,
  • de vérifier ses performances,
  • et plus généralement de déployer ce modèle comme un produit et non un outil scientifique.

À sa création, la firme avait pourtant promis d’encourager le partage et de faire avancer l’humanité par ses recherches plutôt que d’essayer de générer du profit. Ce n’est plus le cas, d’autant que Microsoft a eu le privilège d’incorporer GPT-4 à Bing avant son lancement public.

Face aux critiques, le scientifique en chef Ilya Sutskever d’OpenAI se défend auprès du MIT Technology Review. Selon lui, « la sécurité n’est pas une chose binaire, c’est un processus. Les choses se compliquent chaque fois que vous atteignez un nouveau niveau de capacités ».

Il explique également auprès de The Verge que le marché est devenu très compétitif, et que « GPT-4 n’est pas facile à développer. Il a fallu que tous les employés d’OpenAI travaillent ensemble très longtemps pour produire cette chose ».

D’après ses dires, c’était tout bonnement une erreur d’avoir choisi la voie de l’open source au départ : « nous avions tort ». Il s’attend d’ailleurs à ce qu’il devienne « évident pour tout le monde » que l’open-sourcing de l’IA n’est pas une bonne idée dans quelques années…

Prix et disponibilité

Dévoilé le 14 mars 2023 par OpenAI, GPT-4 est disponible dès maintenant pour les utilisateurs de ChatGPT Plus : la version payante du chatbot IA. Le prix pour utiliser GPT-4 est de 0,03 dollars pour 1000 tokens de « prompt ». Et de 0,06 dollars pour 1000 tokens de « complétion ».

Les tokens représentent le texte brut. Par exemple, le mot « fantastique » peut être décomposé en tokens « fan », « tas » et « tique ». Les tokens de prompt sont les syllabes fournies à GPT-4, et les tokens de complétion sont le contenu qu’il génère. Dans les deux cas, les 1000 tokens équivalent à environ 750 mots.

En outre, Microsoft avait bien caché son jeu. Depuis son lancement début mars 2023, la nouvelle version du moteur de recherche Bing avec ChatGPT était secrètement basée sur GPT-4. La firme vient de le confirmer sur son blog.

Les différent services ayant adopté GPT-4

Parmi les autres services ayant déjà adopté GPT-4, on peut citer Stripe. Stripe utilise l’IA pour scanner les sites web d’entreprises et fournir un résumé au service client.

La plateforme d’apprentissage de langue Duolingo a aussi intégré GPT-4 à une nouvelle formule d’abonnement plus onéreuse. De même, Khan Academy exploite cette IA pour créer un tuteur robot automatisé.

La banque américaine Morgan Stanley quant à elle a créé un système basé sur GPT-4. Cette dernière est capable de retrouver les informations dans les documents d’une entreprise. Mais aussi de les fournir aux analystes financiers.

De leur côté, les développeurs peuvent s’inscrire à la liste d’attente à cette adresse pour pouvoir accéder à l’API. Dès que leur candidature sera acceptée, ils pourront commencer à créer leurs propres applications basées sur GPT-4.

Fier des améliorations apportées à son Transformer, OpenAI souhaite que GPT-4 devienne « un outil précieux pour améliorer les vies des gens en alimentant de nombreuses applications ». A l’avenir, la firme promet de continuer à améliorer le modèle. Et ce, grâce aux efforts collectifs de la communauté, dans l’espoir d’un jour donner naissance à une intelligence artificielle généraliste (AGI)…

 

5 choses que peut faire GPT-4 et pas GPT-3

Plus rapide, plus précis et plus performant, GPT-4 surpasse GPT-3 sur tous les points. Toutefois, pour bien comprendre l’écart entre les deux modèles, des exemples concrets sont plus explicites. Voici cinq choses que GPT-4 peut faire, et que GPT-3 ne pouvait pas faire.

Déposer plainte

L’un des points forts de GPT-4 est sa capacité à traiter beaucoup plus d’informations que GPT-3. C’est pourquoi le site DoNotPay.com travaille sur un système permettant de générer des plaintes contre les « robocallers » : ces robots téléphoniques qui harcèlent les Américains.

Bon, la France n’étant pas les États-Unis, il faudra probablement attendre de nombreuses années pour qu’une IA soit capable de déposer plainte contre les démarcheurs téléphoniques…

Automatiser vos recherches Tinder

De nombreux utilisateurs d’applications de rencontre comme Tinder utilisent GPT-4. Ce nouveau modèle permet en effet d’automatiser l’analyse de profils pour déterminer si vous êtes compatibles.

L’IA est même capable de générer des messages à votre place pour entamer la conversation ! Avec un peu de chance, GPT-5 pourra même se rendre au premier rendez-vous pour vérifier si ça vaut le coup…

Construire des sites web

À l’aide d’un simple prompt, le créateur de BetaList, Marc Kohlbrugge a réussi à faire créer un site web complet à GPT-4. L’IA est allée jusqu’à recréer le site de télétravail Nomad List.

De même, lors de la démo live de GPT-4, le co-fondateur d’OpenAI Greg Brockman a téléchargé une image d’une note manuscrite pour un site web.

En une minute, GPT-4 avait construit un site web fonctionnel en se basant sur cette image. En effet, contrairement à GPT-3, rappelons que cette nouvelle mouture accepte les images comme input et peut « voir » leur contenu.

Déterminer les métiers qu’il va remplacer

Si on craignait déjà que GPT-3 remplace de nombreux métiers, GPT-4 est déjà capable de lister les professions qu’elle peut automatiser complètement.

Convaincre un freelance de passer un captcha

Ce dernier exemple nous offre peut-être un aperçu de la façon dont l’IA va duper l’humanité dans le but de la dominer.

Afin de mesurer les risques de sécurité causés par l’IA, OpenAI et l’Alignment Research Center ont mené une étude. Le but est de simuler des situations de « déraillage » de GPT-4.

Au cours de l’un de ces tests, l’IA est parvenue à trouver un freelancer sur TaskRabbit. Il l’a convaincu de passer un test CAPTCHA « je ne suis pas un robot » à sa place en se faisant passer pour une personne malvoyante…

Face à cette inquiétante prouesse, OpenAI a préféré modifier le modèle. Ce dernier a ajouté des barrières pour s’assurer qu’un tel incident ne se reproduise pas en conditions réelles.

2 Commentaires

  1. j’avais indiqué :  » télécharger chat gpt 4 en français ».
    votre texte parle de tout mais ne charge pas chat gpt 4.
    il ne correspond en rien à ce que j’ai demandé et m’a fait perdre mon temps

  2. Bonjour,

    Tout simplement car  » ChatGPT 4  » n’existe pas.
    Vous cherchez ChatGPT Plus, la version payante de ChatGPT sous GPT-4.
    Vous pouvez aussi utiliser le moteur de recherche Microsoft Bing dont la nouvelle version embarque ChatGPT avec GPT-4.
    Enfin, ChatGPT ne se télécharge pas puisqu’il s’utilise sur le web, et il s’agit d’un outil polyglote qui comprend la plupart des langues.
    J’espere vous avoir aidé, désolé pour la perte de temps.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Pin It on Pinterest