Dévoilé lors du premier keynote DevDay d'OpenAI, GPT-4 Turbo est la nouvelle version du modèle de langage GPT, encore plus performante que GPT-4 ! Entre une capacité à traiter plus de mots qu'un roman, des informations à jour et un coût divisé par deux : découvrez tout ce qu'il faut savoir sur cette nouvelle IA !
Le 6 novembre 2023, OpenAI a rejoint la cour des géants de la tech en franchissant un cap : l'organisation de son premier keynote, le DevDay.
L'événement a débuté par un discours du CEO Sam Altman présentant l'impact de l'IA dans le monde. Selon les statistiques qu'il a partagées, plus de deux millions de développeurs créent des applications avec les APIs d'OpenAI.
En outre, plus de 92% des entreprises du Fortune 500 se servent de sa plateforme et ChatGPT réunit plus de 100 millions d'utilisateurs actifs par semaine.
Cette conférence dédiée aux développeurs a aussi été marquée par l'irruption surprise de Satya Nadella. Le CEO de Microsoft a évoqué l'approfondissement du partenariat avec OpenAI, et a partagé quelques mots sur sa vision du futur de la technologie.
Si la plupart des nouveautés avaient été annoncées quelques heures plus tôt via un leak sur X, plusieurs surprises ont toutefois été dévoilées.
Une fenêtre contextuelle multipliée par 4
La principale n'est autre que GPT-4 Turbo, la nouvelle version améliorée de GPT-4. Ce modèle peut traiter un volume de texte largement supérieur.
Pour rappel, les larges modèles de langage (LLM) comme GPT-4 ont tous une « fenêtre de contexte » définissant la quantité de texte qu'ils peuvent traiter en une fois.
Cette fenêtre est souvent mesurée en tokens, à savoir des morceaux de mots. D'après OpenAI, un token correspond à environ quatre lettres en texte anglais soit environ trois quarts d'un mot.
Auparavant, GPT-4 se contentait d'une fenêtre de contexte de 8000 tokens tandis qu'un modèle 32 000 était disponible pour certains développeurs via l'API. Désormais, sa fenêtre s'étend à 128 000 tokens.
Ainsi, GPT-4 Turbo peut traiter environ 96 000 mots d'un coup. C'est plus que ce que contiennent la plupart des romans.
De plus, ceci permettra au chatbot de tenir des conversations plus longues sans oublier le sujet comme c'était le cas jusqu'à présent. Ce nouveau modèle surpasse donc le LLM Claude d'Anthropic et sa version à 100 000 tokens.
Une base de connaissances datée d'avril 2023 au lieu de 2021
Autre point fort : la base de connaissances de GPT-4 Turbo s'étend désormais à avril 2023. Auparavant, ChatGPT et GPT-4 ne pouvaient donner que des informations antérieures à septembre 2021 puisque c'est à cette date que s'arrêtait leur jeu de données d'entraînement.
Ce nouveau modèle est donc le plus à jour d'OpenAI, et pourra donner des informations plus récentes. Son utilité est donc largement accrue.
Un coût divisé par deux pour l'API
Enfin, le gros avantage pour les développeurs est un coût largement réduit. Exécuter GPT-4 Turbo comme API coûte un tiers de moins que GPT-4 pour les tokens d'input avec un prix de 0,01$ pour 1000 tokens.
Pour les tokens d'output, le coût est même réduit de moitié à 0,03$ pour 1000 tokens. En parallèle, les prix ont été baissés pour l'API de GPT-3.5 Turbo. La limite de tokens par minute a aussi été doublée pour tous les utilisateurs payants de GPT-4.
Ce nouveau modèle GPT-4 Turbo est une amélioration majeure de GPT. Néanmoins, il reste loin des rumeurs qui évoquaient le lancement de GPT-5 comme première intelligence artificielle dotée d'une conscience pour la fin 2023…
Grosses nouveautés pour les APIs
Outre cette annonce en fanfare, OpenAI propose désormais l'accès aux APIs pour GPT-4 Turbo avec vision permettant d'analyser les images, DALL-E 3 pour générer des images avec l'IA, et pour le modèle text-to-speech capable de créer des voix réalistes.
Rappelons que les APIs ou interfaces de programmation d'applications permettent aux programmes informatiques de communiquer entre eux. En les exploitant, les développeurs peuvent intégrer les modèles OpenAI à leurs applications.
De plus, la firme a présenté « Assistants API » pour permettre aux développeurs de créer des « expériences agent-like » au sein de leurs propres applis.
On pourrait le décrire comme une version API du nouveau produit « GPTs » d'OpenAI permettant aux utilisateurs de créer leurs propres chatbots.
Selon l'entreprise, le point fort majeur de Assistants API est la possibilité de « threads persistants et infiniment longs » permettant aux développeurs de renoncer à l'historique de conversation.
À la place, ils peuvent ajouter chaque nouveau message d'une conversation à un thread existant. Ceci évitera que l'IA débute chaque nouvelle session sans aucune connaissance des précédentes interactions.
Un bouclier contre les plaintes pour plagiat
Toujours dans le cadre de ce keynote, OpenAI a dévoilé le « Copyright Shield » : un outil visant à protéger ses clients d'entreprise contre les plaintes pour violation de droits d'auteur causées par l'usage de ses générateurs de texte ou d'image.
Notons que ce bouclier ne s'applique pas aux utilisateurs de ChatGPT Plus ou de la version gratuite. Méfiez-vous donc du risque de plagiat !
La version 3 du modèle open source de reconnaissance de discours Whisper a aussi été lancée. Pour clore son keynote, Sam Altman a réaffirmé son optimisme et sa conviction que l'IA va créer l'abondance.
Ce n'est que le début de la révolution IA…
Selon lui, « à mesure que l'intelligence est intégrée partout, nous aurons des superpouvoirs à la demande ». Une vision qui contraste avec celle d'Elon Musk, autre co-fondateur d'OpenAI, désormais convaincue que l'IA va remplacer tous les métiers humains…
Quoi qu'il en soit, Altman invite les développeurs à revenir au DevDay l'an prochain avec une promesse aussi énigmatique qu'excitante : « ce que nous lançons aujourd'hui va sembler très vieillot par rapport à ce que nous créons actuellement pour vous »…
- Partager l'article :