Quelques jours après le lancement de nouveaux modèles par Baidu et à la veille du lancement annoncé de DeepSeek, Alibaba dévoile Qwen3. Une gamme complète de modèles conçue pour rivaliser avec les principaux leaders du secteur.
L’annonce de Qwen3 s’inscrit dans une dynamique d’innovation technologique accélérée en Chine. Cette nouvelle famille de modèles d’IA hybrides sont performants en codage, raisonnement et traitement multilingue. Totalement open-source, ces modèles sont accessibles sur des plateformes comme Hugging Face et GitHub ou ModelScope.
Open source et performant
Qwen3 est disponible en open-source sous licence Apache 2.0 sur GitHub, Hugging Face et ModelScope. Cette gamme propose des solutions IA variées, souvent gratuites pour un usage non commercial et avec des coûts cloud variables.
Effectivement, la majorité des modèles est proposée gratuitement sous licence Apache 2.0. La famille Qwen3 d’Alibaba comprend huit modèles, dont deux de type Mixture-of-Experts et six denses. La gamme excelle dans le suivi d’instructions et la gestion de formats spécifiques.
Ces modèles, allant de 0,6 à 32 milliards de paramètres, répondent à divers besoins, du codage à l’IoT. Chaque modèle prend en charge 119 langues et s’appuie sur 36 000 milliards de jetons d’entraînement.
Ils offrent des capacités multilingues, utiles aux entreprises pour des cas d’usage variés comme les chatbots ou l’analyse de données.
Gamme variée de modèles
Le modèle phare de ce nouveau IA d’Alibaba, Qwen3-235B-A22B, doté de 235 milliards de paramètres, reste pour l’instant indisponible au public. Cependant, il devrait prochainement rejoindre ces plateformes cloud. Conçu pour des tâches complexes, il vise notamment les compétitions de programmation telles que Codeforces.
La gamme comprend également Qwen3-32B, avec 32 milliards de paramètres, qui est performant en codage et en raisonnement. La famille dispose aussi de versions plus légères, comme Qwen3-0.6B, optimisées pour les appareils à faible puissance. Les modèles intermédiaires, tels que Qwen3-1.7 B, peuvent être intégrés dans des dispositifs mobiles ou IoT.
Selon Alibaba, Qwen3 peut rivaliser avec les modèles o1 et o3-mini d’OpenAI ou encore Gemini 2.5-Pro de Google. Qwen3-32B surpasse o1 sur LiveCodeBench, tandis que Qwen3-235B-A22B devance o3-mini sur Codeforces et AIME. Les modèles légers concurrencent Mistral 7 B ou TinyLlama.
Son avantage est sa stratégie open source qui contraste avec les systèmes fermés d’Anthropic et d’OpenAI. Par ailleurs, Qwen3 est également accessible via des fournisseurs cloud comme Fireworks AI ou Hyperbolic, bien que les tarifs n’aient pas été communiqués.
- Partager l'article :