Nvidia dévoile Llama-3.1-Nemotron-70B-Instruct : une IA qui surpasse GPT-4o et Claude 3.5 sur la plupart des benchmarks. L’industrie de l’intelligence artificielle vient elle de trouver son nouveau leader ?
Le géant des cartes graphiques est-il en passe de redistribuer celles de l’industrie de l’IA ? Il y a quelques jours, Nvidia présentait la famille de modèles multimodaux NVLM 1.0 avec notamment NVLM-D-72B et ses 72 milliards de paramètres.
Ce mardi 15 octobre 2024, en toute discrétion, elle a dévoilé un nouveau modèle d’intelligence artificielle qui surpasse ceux des leaders du secteur comme OpenAI et Anthropic.
Il s’agit non seulement d’un revirement majeur dans la stratégie de la firme américaine, qui pourrait aussi potentiellement bouleverser tout l’ordre établi dans le paysage de l’intelligence artificielle !
Dénommé Llama-3.1-Nemotron-70B-Instruct, ce nouveau modèle est apparu sans tumulte sur la plateforme Hugging Face. Toutefois, rapidement, il a capté toute l’attention en raison de ses performances époustouflantes sur de nombreux tests de benchmark.
Une version améliorée de Meta Llama 3.1 à la pointe de la tech
Afin de créer cette IA, Nvidia a raffiné le modèle open-source Llama 3.1 de Meta à l’aide de techniques d’entraînement très avancées.
Elle a notamment exploité la méthode RLHF : Reinforcement Learning from Human Feedback. Celle-ci consiste à permettre à l’IA d’apprendre à partir des préférences humaines, pour mener à des réponses plus naturelles et contextuelles.
Toutefois, ce qui distingue véritablement Llama-3.1-Nemotron-70B-Instruct est sa capacité à traiter des requêtes complexes sans prompting additionnel ou tokens spécialisés.
Dans le cadre d’une démonstration, elle a correctement répondu à la question : « combien y a-t-il de r dans le mot strawberry ? » avec une réponse précise et détaillée.
Ceci montre une compréhension nuancée du langage et une capacité à fournir des explications claires. La plupart des modèles IA actuels échouent face à cette question.
De plus, ces résultats sont particulièrement significatifs, car ils mettent l’accent sur l’« alignement » : un terme faisant référence à la façon dont les productions d’un modèle correspondent aux besoins et préférences des utilisateurs.
Une nouvelle solution attractive pour les entreprises
Avec un tel modèle, les entreprises et organisations cherchant à exploiter l’IA pourront profiter de réponses plus utiles, avec beaucoup moins d’erreurs.
De plus, Nvidia proposé une inférence hébergée gratuitement via sa plateforme build.nvidia.com. Elle s’accompagne d’une interface API compatible avec OpenAI.
Cette accessibilité rend la technologie IA la plus avancée plus disponible, permettant à une large gamme d’entreprises de l’utiliser et d’implémenter les modèles de langage dernier cri.
Ce modèle présente aussi l’avantage d’être customisable, afin de répondre aux besoins spécifiques des entreprises : prendre en charge les requêtes de service client, générer des rapports complexes…
L’IA de Nvidia offre cette flexibilité, combinée à des performances de pointe. C’est donc une solution très intéressante pour les entreprises de toutes les industries.
Ceci étant dit, la firme prévient que Llama-3.1-Nemotron-70B-Instruct n’a pas été affiné pour des domaines spécialisés comme les maths ou le raisonnement légal où la précision est essentielle.
Les entreprises doivent donc s’assurer de l’utiliser de façon appropriée et implémenter des barrières de sécurité pour éviter les erreurs.
Nvidia, nouveau leader de l’industrie des LLM ?
Selon Nvidia, cette IA obtient le meilleur score sur plusieurs évaluations phares. Elle a notamment atteint 85.0 sur Arena Hard Benchmark, 57.6 sur AlpacaEval 2 LC, et 8.98 sur GPT-4-Turbo MT-Bench.
Ses scores surpassent donc ceux des modèles les plus reconnus comme GPT-4o et Anthropic Claude 3.5 Sonnet. Ainsi, Nvidia n’est plus seulement fournisseur, mais se propulse au sommet de l’industrie de l’IA générative !
Jusqu’à présent, l’entreprise était principalement connue pour dominer l’industrie des cartes graphiques, utilisées pour les jeux vidéo et le minage de cryptomonnaies, mais aussi l’entraînement des systèmes d’intelligence artificielle.
Désormais, elle vient de prouver sa capacité à développer sa propre IA et à surpasser celles de ses principaux clients. Grâce à son expertise en hardware, elle se positionne en fournisseur de solutions IA de premier ordre.
Cette expansion stratégique pourrait déclencher une véritable secousse sismique dans le domaine des LLM, jusqu’alors aux mains d’entreprises focalisées sur le développement logiciel.
Ces dernières vont devoir reconsidérer leur propre stratégie et augmenter leurs efforts de R&D. Pour cause, Nvidia ne cherche pas seulement à concurrencer, mais bien à surpasser les IA les plus populaires.
Toutefois, depuis le lancement de ChatGPT en 2022, OpenAI a toujours attendu que la concurrence sorte un modèle plus puissant pour déployer une mise à jour de GPT afin de préserver sa domination. On peut donc éventuellement s’attendre au lancement d’une nouvelle version dans les jours à venir…
De son côté, pour réellement s’imposer comme une nouvelle référence, Llama 3.1-Nemotron-70B-Instruct devra aller au-delà des benchmarks et faire ses preuves dans les applications du monde réel.
Et vous, qu’en pensez-vous ? Nvidia peut-elle réellement surpasser OpenAI et prendre les rênes de l’industrie de l’IA ? Son expertise en hardware peut-elle être un réel avantage ? Partagez votre avis en commentaire !
- Partager l'article :
N’importe quoi, même Copilote répond parfaitement à la question « Combien y a t-il de R à strawberry » Comment pouvez vous écrire des choses pareilles sans même vérifier ?