Alibaba Qwen : cette IA de coding Open-Source rivalise avec GPT-4o et Claude 3.5

Mariano R. 18 novembre 2024 3 minutes de lecture IA Développement web

Vous pensiez que GPT-4o et Claude 3.5 dominaient le monde de l’IA ? Détrompez-vous ! Alibaba débarque avec Qwen, une IA de coding open-source qui entend redéfinir les règles du jeu. Puissante, accessible et conçue sur-mesure pour les développeurs, elle se hisse à la hauteur de ces meilleurs modèles. Et bien sûr, elle reste ouverte à la communauté.

Le développement logiciel est en pleine révolution et Alibaba vient d’ajouter une pièce maîtresse au puzzle. Ce n’est autre que Qwen-2.5-Coder. Cette série de modèles d’IA est spécialement conçue pour le coding. Ainsi, Alibaba veut rendre la programmation plus rapide, plus efficace et accessible à tous. En tant que solution open-source, Qwen ne se contente pas de bousculer les géants comme GPT-4o et Claude 3.5. Cette IA ouvre aussi de nouvelles opportunités pour la communauté des développeurs.

Qwen-2.5-Coder parle votre langage (de programmation)

Accrochez-vous bien, car Alibaba arrive sur le ring pour tenir tête aux grands modèles comme GPT-4o et Claude 3.5. Ce 11 novembre, ils ont présenté Qwen, leur IA de coding open-source.

Cette IA d’Alibaba peut donc écrire, analyser et comprendre le code dans plus de 40 langages. Python, Java, JavaScript ? Classique. Mais tenez-vous bien, car Qwen gère aussi des langages plus obscurs comme Haskell ou Racket.

Les tailles de modèles varient de 0,5 milliard à 32 milliards de paramètres. En plus, vous n’avez pas besoin d’une machine de guerre pour utiliser les versions légères. Alibaba prévoit également d’intégrer les fonctionnalités de cette IA directement dans sa plateforme cloud Tongyi.

Alibaba a aussi testé les modèles Qwen-2.5-Coder dans des applications concrètes et utiles. Par exemple avec Cursor AI, un éditeur de code. Celui-ci corrige vos erreurs, optimise votre code et vous fait gagner un temps fou.

Et je ne vous parle pas du chatbot Web spécial développeurs. Contrairement à un simple assistant généraliste, ce chatbot comprend vos questions techniques et y répond avec une précision redoutable. C’est un peu à la manière de ChatGPT, mais orienté développement.

Qwen-2.5-Coder est alors disponible sur GitHub sous licence Apache 2.0 et vous pouvez même tester gratuitement sur Hugging Face. Toutefois, la version à 3 milliards de paramètres reste pour l’instant absente de la publication. Mais avec les autres modèles disponibles, je crois qu’il y a largement de quoi s’amuser et explorer.

Un modèle qui défie les monopoles du game

Le modèle le plus avancé de la série, le Qwen-2.5-Coder-32B-Instruct, a surpassé des systèmes open-source comme DeepSeek-Coder et Codestral dans les benchmarks de génération de code. Alors, GPT-4o reste un cran au-dessus dans certaines tâches. Mais honnêtement, voir une IA open-source rivaliser à ce niveau, c’est un signal clair que l’innovation ne se limite pas aux grandes entreprises privées.

@Alibaba_Qwen launched its open-source model, Qwen 2.5-Coder-32B, rivaling @ChatGPTapp GPT-4o and @AnthropicAI's Claude Sonnet 3.5!

Available in 40+ languages with a 128K context length.

Check it out on @huggingface pic.twitter.com/tV7J9cGAhj
— Linkt (@_linktai) November 13, 2024

Côté formation, les modèles de Qwen ont été entraînés sur un volume de plus de 20 000 milliards de jetons. Je vais être plus précis ! 18 500 milliards de jetons proviennent des données générales utilisées lors de l’entraînement de Qwen 2.5. Ce dernier a été introduit en septembre dernier.

À cela s’ajoutent donc 5 500 milliards de jetons issus de codes sources publics et de contenus en lien avec la programmation sur le Web. C’est une première pour un modèle open-source de dépasser une telle quantité de données d’entraînement.

Avec un tel bagage, je ne suis pas étonné que Qwen affiche des performances aussi impressionnantes dans des tâches complexes. Par ailleurs, Alibaba ne compte pas s’arrêter là. Ils travaillent déjà sur des modèles encore plus grands et comptent améliorer les capacités de raisonnement logique et contextuel.

Alors, que pensez-vous des performances et des promesses de Qwen-2.5-Coder ? Cette IA open-source pourrait-elle vraiment rivaliser avec des géants GPT-4o et et Claude 3.5 ? Donnez-nous votre avis dans les commentaires !