Après plusieurs rumeurs, OpenAI a enfin déployé son nouveau modèle IA capable de comprendre le texte, mais aussi les images. GPT-4 va permettre à ChatGPT et aux autres applications basées sur GPT de devenir encore plus intelligentes et polyvalentes ! Découvrez tout ce que vous devez savoir.
Nous vivons actuellement une époque formidable, et assistons à l’avènement de l’ère de l’IA. Depuis plusieurs mois, un nouveau type de modèle révolutionnaire bouleverse notre société.
En juillet 2022, OpenAI a lancé DALL-E 2 : un modèle text-to-art. Il peut générer une image à partir d’un « prompt » textuel. En fin d’année, la startup a dévoilé ChatGPT : un chatbot capable de répondre au langage naturel.
Le point commun de ces IA est qu’elles reposent sur GPT-3 : le « large modèle de langage » d’OpenAI. A présent, la firme vient de lancer GPT-4 le 14 mars 2023. Elle va propulser l’intelligence artificielle dans une nouvelle dimension…
Qu’est-ce que GPT ?
Le Generative Pre-trainer Transformer (GPT) est un modèle de deep learning de génération de texte entraîné sur les données disponibles sur Internet. Il peut répondre des questions, résumer un texte, traduire ou même de générer un code informatique.
Les applications potentielles de GPT sont illimitées. Il est même possible de le customiser par le « fine-tuning » pour affiner les résultats. Il s’agit d’un modèle de type « Transformer ».
Le fonctionnement de GPT est similaire aux assistants vocaux comme Alexa et Siri, mais à une tout autre échelle. Cette IA est capable d’écrire un livre entier ou des centaines d’idées de publications de réseaux sociaux en une minute.
On peut le définir comme une intelligence à la demande. Cette IA peut être utilisée pour résoudre n’importe quel problème nécessitant une implication humaine. Ainsi, GPT offre de nombreuses opportunités pour les entreprises.
De GPT-1 à GPT-4
Avant le premier GPT, la plupart des modèles de Traitement Naturel du Langage (NLP) étaient entraînés pour des tâches spécifiques comme la classification ou la traduction de texte. Ils utilisaient l’apprentissage supervisé. Or, cette approche présente deux inconvénients. Notamment :
- Le manque de données annotées à disposition
- L’incapacité à effectuer des tâches générales.
C’est en 2018 qu’OpenAI a mis un coup de pied dans la fourmilière. Cette entreprise a publié l’article « Improving Language Understanding by Generative Pre-Training » (améliorer la compréhension du langage par le pré-apprentissage génératif) dans la revue Paperswithcode.
À travers cette étude, la startup présente GPT-1 : un modèle génératif de langage à 117 millions de paramètres. Ces derniers ont été entraînés sur des données sans label et fine-tuned (raffiné) pour des tâches spécifiques comme la classification et l’analyse de sentiment.
Un an plus tard, en 2019, l’article « Language Models are Unsupervised Multitask Learners » (les modèles de langage sont des apprenants multi-tâches non-supervisés) présente GPT-2. Ce modèle à 1,5 milliard de paramètres a été entraîné sur un jeu de données bien plus large. Il exploite aussi les techniques de conditionnement de tâches, d’apprentissage zero-shot, et de transfert de tâches zero-shot.
Puis, en 2020, OpenAI introduit GPT-3 et ses 175 milliards de paramètres avec l’article « Language Models are Few-Shot Learners ». Ce nouveau modèle a 100 fois plus de paramètres que GPT-2, et a été entraîné sur un dataset encore plus large pour maximiser ses résultats. Il repose aussi sur les techniques de learning in-context, one-shot, few-shot et zero-shot.
Cette IA est parvenue à choquer le monde entier en écrivant des histoires, des requêtes SQL, des scripts Python et des synthèses de texte. A présent, GPT-4 représente un nouveau pas en avant.
GPT-4 : une IA multimodale texte/image
Si le GPT-3.5 n’accepte que les inputs sous forme de texte, GPT-4 peut aussi recevoir des images. C’est une amélioration majeure. Cette nouvelle IA peut légender ou même d’interpréter des images relativement complexes. Par exemple, elle peut identifier un adaptateur de câble Lightning à partir d’une photo d’iPhone branché.
Pour l’heure, cette capacité n’est pas accessible à tous les clients d’OpenAI. Elle est en cours de test avec un partenaire unique : Be My Eyes.
La nouvelle fonctionnalité Virtual Volunteer (volontaire virtuel) du service se base sur GPT-4, et peut répondre à des questions sur les images qui lui sont envoyées.
Sur son blog, l’entreprise explique comment cela fonctionne. « Par exemple, si un utilisateur envoie une photo de l’intérieur de son frigo, le Virtual Volunteer ne va pas seulement être capable d’identifier ce qui est dedans. En fait, il va aussi extrapoler et analyser ce qui peut être préparé avec ces ingrédients ».
L’outil pourra aussi proposer plusieurs recettes pour ces ingrédients et envoyer un guide étape par étape pour les réaliser. Autant dire que cette multimodalité va ouvrir une myriade de nouvelles possibilités…
GPT-4 surpasse 90% des étudiants sur les examens universitaires
Par ailleurs, GPT-4 parvient à égaler l’humain sur une large variété de benchmarks professionnels et académiques. L’IA a par exemple obtenu un score supérieur à 90% des étudiants sur une simulation d’examen d’avocat, alors que celui de GPT-3.5 était similaire à celui des 10% de candidats les plus mauvais.
Elle a également ajouté 150 points à son score SAT, atteignant désormais 1410 sur 1600. Il s’agit d’un test à choix multiple créé par le College Board.
L’orientabilité , un point fort de GPT-4
GPT-4 : comment y accéder ?
Bien que les fonctions d’image soient en cours de prévisualisation, il est toujours possible de se servir des capacités textuelles du GPT-4. Il y a deux façons pour y accéder :
- ChatGPT Plus
- Bing
La principale façon de profiter de GPT-4 est de s’abonner à ChatGPT Plus : la version payante du chatbot IA en déboursant 20$. Pour ce faire, cliquez simplement sur « Upgrade to Plus » dans le menu latéral. Après avoir introduit les données de votre carte bleue, vous passerez de la version antérieure de LLM aux GPT-4.
Bien que cette option ne soit pas une bonne nouvelle pour les utilisateurs de ChatGPT gratuit, c’est une raison supplémentaire de passer à ChatGPT Plus. En effet, ses abonnées ont la possibilité d’apprécier la performance de l’itération GPT-4 comme échanger 50 messages toutes les trois heures.
Par ailleurs, GPT-4 alimente également le chatbot intégré au moteur de recherche Bing, co-développé par Microsoft. Le chatbot Bing a une limite d’utilisation et ne permet pas la saisie d’images.
Comment OpenAI a entraîné GPT-4 ?
Afin de perfectionner GPT-4, OpenAI a passé 6 mois à « aligner itérativement » ce modèle. Cette société a utilisé des leçons d’un programme de test contradictoire et ChatGPT. D’ailleurs, c’est ce qui a permis selon la firme d’obtenir les meilleurs résultats jusqu’à présent.
Tout comme les précédentes versions de GPT, cette quatrième mouture a été entraînée sur des données disponibles publiquement, provenant notamment de pages web publiques.
A l’aide de Microsoft, OpenAI a également développé un superordinateur sur le cloud Azure. Cette machine virtuelle a ensuite été utilisée pour entraîner GPT-4.
GPT-4 vs GPT-3.5
La version gratuite de ChatGPT est toujours basée sur GPT 3.5, mais GPT-4 est bien meilleur. Il peut comprendre et répondre à plus de contributions, il dispose de plus de garanties en place et il fournit généralement des réponses plus concises par rapport à GPT 3.5. Cependant, la version la plus récente a des réponses beaucoup plus lentes, car elle a été formée sur un ensemble de données beaucoup plus important.
Selon un billet de blog publié par OpenAI, « la différence entre GPT-3.5 et GPT-4 peut être subtile dans une conversation banale ». En revanche, tout le potentiel du nouveau modèle se révèle quand la complexité d’une tâche atteint un certain seuil.
Par ailleurs, GPT-4 a 82% de chances en moins de répondre à des requêtes pour du contenu « non-autorisé », et refuse de répondre à des questions sensibles comme les conseils médicaux ou en lien avec l’auto-mutilation 29% plus souvent.
Une intelligence encore très artificielle
Malgré ces nombreuses améliorations, OpenAI admet que GPT-4 reste loin d’être parfait. L’IA continue « d’halluciner » des faits et de commettre des erreurs de raisonnement, parfois avec beaucoup d’assurance.
Dans un exemple cité par OpenAI, GPT-4 a par exemple décrit Elvis Presley comme le « fils d’un acteur ». De toute évidence, ce n’est pourtant pas sa caractéristique principale…
Comme l’explique la firme de San Francisco, « GPT-4 manque généralement de connaissances sur les événements survenus après septembre 2021 et n’apprend pas de ses expériences ». Rappelons en effet que son jeu de données d’entraînement s’arrête à cette date.
De plus, « elle peut parfois commettre des erreurs de raisonnement simple qui ne semblent pas compatibles avec la compétence dans tant de domaines, ou faire preuve de crédulité en acceptant des déclarations évidemment fausses de la part de l’utilisateur ».
Parfois, l’IA peut aussi « échouer sur des problèmes difficiles à la manière des êtres humains, par exemple en introduisant des vulnérabilités de sécurité dans le code qu’elle produit ».
OpenAI change de stratégie : une IA fermée et drapée de mystère
Pour accompagner le lancement de GPT-4, OpenAI a publié un rapport technique de 98 pages. Toutefois, certains chercheurs déplorent un manque de transparence et d’ouverture… aux antipodes des valeurs originelles dont la firme tire son nom.
D’ailleurs, le document indique explicitement que :
« compte tenu du paysage compétitif et des implications en termes de sécurité des larges modèles comme GPT-4, ce rapport ne contient pas de détails sur l’architecture, la taille du modèle, le hardware, la méthode d’entraînement ou la construction du dataset ».
Ainsi, GPT-4 est beaucoup plus secret que ses prédécesseurs. C’est un revirement majeur pour l’entreprise dont l’open-source était le principe fondateur.
Les chercheurs reprochent notamment à OpenAI de :
- ne pas permettre d’évaluer les éventuels biais de GPT-4,
- de vérifier ses performances,
- et plus généralement de déployer ce modèle comme un produit et non un outil scientifique.
À sa création, la firme avait pourtant promis d’encourager le partage et de faire avancer l’humanité par ses recherches plutôt que d’essayer de générer du profit. Ce n’est plus le cas, d’autant que Microsoft a eu le privilège d’incorporer GPT-4 à Bing avant son lancement public.
Face aux critiques, le scientifique en chef Ilya Sutskever d’OpenAI se défend auprès du MIT Technology Review. Selon lui, « la sécurité n’est pas une chose binaire, c’est un processus. Les choses se compliquent chaque fois que vous atteignez un nouveau niveau de capacités ».
Il explique également auprès de The Verge que le marché est devenu très compétitif, et que « GPT-4 n’est pas facile à développer. Il a fallu que tous les employés d’OpenAI travaillent ensemble très longtemps pour produire cette chose ».
D’après ses dires, c’était tout bonnement une erreur d’avoir choisi la voie de l’open source au départ : « nous avions tort ». Il s’attend d’ailleurs à ce qu’il devienne « évident pour tout le monde » que l’open-sourcing de l’IA n’est pas une bonne idée dans quelques années…
Plugin GPT-4
Dans le paysage technologique en constante évolution, les plugins sont souvent des héros méconnus qui améliorent notre expérience numérique. L’un de ces plugins révolutionnaires est le plugin GPT-4, un outil qui s’intègre parfaitement à l’architecture GPT-4 d’OpenAI.
Le plugin GPT-4 est une extension logicielle conçue pour fonctionner en tandem avec GPT-4 d’OpenAI, la dernière itération des modèles Generative Pre-trained Transformer. Ce plugin sert de pont entre l’utilisateur et le modèle GPT-4, offrant une gamme de fonctionnalités qui vont au-delà de la simple génération de texte. De l’exploration Web en temps réel aux recherches wiki, le plugin est conçu pour rendre votre interaction avec GPT-4 plus dynamique et informative.
L’une des fonctionnalités les plus intéressantes du plugin GPT-4 est sa capacité à effectuer une exploration Web en temps réel. Les utilisateurs peuvent saisir une URL ou une requête de recherche, et le plugin récupérera les informations les plus pertinentes et les plus récentes. Cette fonctionnalité est particulièrement utile pour les tâches qui nécessitent des données à jour, telles que les études de marché ou l’agrégation d’actualités.
Une autre fonctionnalité remarquable est la capacité du plugin à rechercher directement Wikipédia. Si vous recherchez des informations rapides et factuelles, cette fonctionnalité peut vous sauver la vie.
5 choses que peut faire GPT-4 et pas GPT-3
Plus rapide, plus précis et plus performant, GPT-4 surpasse GPT-3 sur tous les points. Toutefois, pour bien comprendre l’écart entre les deux modèles, des exemples concrets sont plus explicites. Voici cinq choses que GPT-4 peut faire, et que GPT-3 ne pouvait pas faire.
Déposer plainte
L’un des points forts de GPT-4 est sa capacité à traiter beaucoup plus d’informations que GPT-3. C’est pourquoi le site DoNotPay.com travaille sur un système permettant de générer des plaintes contre les « robocallers » : ces robots téléphoniques qui harcèlent les Américains.
Bon, la France n’étant pas les États-Unis, il faudra probablement attendre de nombreuses années pour qu’une IA soit capable de déposer plainte contre les démarcheurs téléphoniques…
Automatiser vos recherches Tinder
De nombreux utilisateurs d’applications de rencontre comme Tinder utilisent GPT-4. Ce nouveau modèle permet en effet d’automatiser l’analyse de profils pour déterminer si vous êtes compatibles.
L’IA est même capable de générer des messages à votre place pour entamer la conversation ! Avec un peu de chance, GPT-5 pourra même se rendre au premier rendez-vous pour vérifier si ça vaut le coup…
Construire des sites web
À l’aide d’un simple prompt, le créateur de BetaList, Marc Kohlbrugge a réussi à faire créer un site web complet à GPT-4. L’IA est allée jusqu’à recréer le site de télétravail Nomad List.
De même, lors de la démo live de GPT-4, le co-fondateur d’OpenAI Greg Brockman a téléchargé une image d’une note manuscrite pour un site web.
En une minute, GPT-4 avait construit un site web fonctionnel en se basant sur cette image. En effet, contrairement à GPT-3, rappelons que cette nouvelle mouture accepte les images comme input et peut « voir » leur contenu.
Déterminer les métiers qu’il va remplacer
Si on craignait déjà que GPT-3 remplace de nombreux métiers, GPT-4 est déjà capable de lister les professions qu’elle peut automatiser complètement.
Convaincre un freelance de passer un captcha
Ce dernier exemple nous offre peut-être un aperçu de la façon dont l’IA va duper l’humanité dans le but de la dominer.
Afin de mesurer les risques de sécurité causés par l’IA, OpenAI et l’Alignment Research Center ont mené une étude. Le but est de simuler des situations de « déraillage » de GPT-4.
Au cours de l’un de ces tests, l’IA est parvenue à trouver un freelancer sur TaskRabbit. Il l’a convaincu de passer un test CAPTCHA « je ne suis pas un robot » à sa place en se faisant passer pour une personne malvoyante…
Face à cette inquiétante prouesse, OpenAI a préféré modifier le modèle. Ce dernier a ajouté des barrières pour s’assurer qu’un tel incident ne se reproduise pas en conditions réelles.
Prix et disponibilité
Le prix pour utiliser GPT-4 est de 0,03 dollars pour 1000 tokens de « prompt ». Et de 0,06 dollars pour 1000 tokens de « complétion ».
Les tokens représentent le texte brut. Par exemple, le mot « fantastique » peut être décomposé en tokens « fan », « tas » et « tique ». Les tokens de prompt sont les syllabes fournies à GPT-4, et les tokens de complétion sont le contenu qu’il génère. Dans les deux cas, les 1000 tokens équivalent à environ 750 mots.
En outre, Microsoft avait bien caché son jeu. Depuis son lancement début mars 2023, la nouvelle version du moteur de recherche Bing avec ChatGPT était secrètement basée sur GPT-4. La firme vient de le confirmer sur son blog.
Les différents services ayant adopté GPT-4
Parmi les autres services ayant déjà adopté GPT-4, on peut citer Stripe. Stripe utilise l’IA pour scanner les sites web d’entreprises et fournir un résumé au service client.
La plateforme d’apprentissage de langue Duolingo a aussi intégré GPT-4 à une nouvelle formule d’abonnement plus onéreuse. De même, Khan Academy exploite cette IA pour créer un tuteur robot automatisé.
La banque américaine Morgan Stanley quant à elle a créé un système basé sur GPT-4. Cette dernière est capable de retrouver les informations dans les documents d’une entreprise. Mais aussi de les fournir aux analystes financiers.
De leur côté, les développeurs peuvent s’inscrire à la liste d’attente à cette adresse pour pouvoir accéder à l’API. Dès que leur candidature sera acceptée, ils pourront commencer à créer leurs propres applications basées sur GPT-4.
Fier des améliorations apportées à son Transformer, OpenAI souhaite que GPT-4 devienne « un outil précieux pour améliorer les vies des gens en alimentant de nombreuses applications ». A l’avenir, la firme promet de continuer à améliorer le modèle. Et ce, grâce aux efforts collectifs de la communauté, dans l’espoir d’un jour donner naissance à une intelligence artificielle généraliste (AGI)…
GPT-4 Turbo vs GPT-4o : focus sur les diverses Itérations de GPT-4
Depuis son lancement, GPT-4 a captivé un large intérêt. Toutefois, il existe actuellement deux déclinaisons de ce modèle : GPT-4 Turbo et GPT-4o, chacune offrant des fonctionnalités et des performances spécifiques pour répondre à une variété de besoins.
GPT-4 Turbo :
GPT-4 Turbo représente une évolution majeure de GPT-4, offrant des performances supérieures, une vitesse améliorée et des capacités de traitement de langage plus avancées. Cette déclinaison est conçue pour répondre aux besoins des utilisateurs nécessitant une analyse approfondie et une réactivité rapide dans le traitement du langage.
L’une des caractéristiques remarquables de GPT-4 Turbo est sa fenêtre contextuelle élargie. Cette dernière permet au modèle de mieux comprendre le contexte des conversations, ce qui se traduit par des réponses plus pertinentes et cohérentes. De plus, GPT-4 Turbo offre des tarifs compétitifs, rendant la technologie accessible à un large éventail d’utilisateurs.
GPT-4o :
GPT-4o est la dernière déclinaison de GPT-4, se démarquant par sa capacité multimodale à traiter le texte, l’audio, les images et les vidéos. Le « o » dans GPT-4o signifie « omni », soulignant sa polyvalence exceptionnelle. Cette version est idéale pour les applications nécessitant une compréhension contextuelle étendue et une interaction avec différents types de contenu.
Une des forces de GPT-4o réside dans sa latence réduite, neuf fois plus rapide que GPT-3.5 et 17 fois plus rapide que GPT-4. Cette amélioration significative de la vitesse permet des temps de réponse quasi humains, essentiels pour les applications conversationnelles et interactives.
En plus de son traitement multimodal, GPT-4o dispose d’une tokenisation améliorée qui réduit le nombre de jetons nécessaires par texte. Cette amélioration bénéficie particulièrement aux langues non romaines, offrant des prix plus avantageux pour les utilisateurs de l’API OpenAI.
GPT-4 Turbo est conçu pour être plus rapide que GPT-4 dans le traitement des requêtes, tandis que GPT-4o combine à la fois vitesse et capacité multimodale. GPT-4o est 50 % moins cher que GPT-4 Turbo, à 5 $ par million d’entrée et 15 $ par million de jetons de sortie.
- Partager l'article :
j’avais indiqué : » télécharger chat gpt 4 en français ».
votre texte parle de tout mais ne charge pas chat gpt 4.
il ne correspond en rien à ce que j’ai demandé et m’a fait perdre mon temps
Bonjour,
Tout simplement car » ChatGPT 4 » n’existe pas.
Vous cherchez ChatGPT Plus, la version payante de ChatGPT sous GPT-4.
Vous pouvez aussi utiliser le moteur de recherche Microsoft Bing dont la nouvelle version embarque ChatGPT avec GPT-4.
Enfin, ChatGPT ne se télécharge pas puisqu’il s’utilise sur le web, et il s’agit d’un outil polyglote qui comprend la plupart des langues.
J’espere vous avoir aidé, désolé pour la perte de temps.