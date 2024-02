Une startup canadienne vient de déployer un LLM open source sans précédent qui peut fonctionner dans plus de 100 langues. Autrement dit, les capacités de cette IA baptisée Aya représentent plus du double du nombre de langues couvertes par les modèles open source existants.

Un LLM massivement multilingue

Aya est un LLM open source développé par Cohere For AI, un laboratoire de recherche à but non lucratif géré par la startup canadienne Cohere Inc. Selon Sara Hooker, responsable de Cohere For AI, cet outil d’IA a mobilisé plus de 3 000 collaborateurs établis dans 119 pays.

Aya est annoncé avec 101 langues disponibles. Pour Cohère, les capacités de ce LLM représentent plus du double du nombre de langues couvertes par les modèles open source existants. Cette initiative vise à combler les lacunes de longue date en matière d’accessibilité linguistique et de représentation culturelle de l’IA.

Welcome to the club of open source LLM crafters. https://t.co/SG9zGQsrWS — Yann LeCun (@ylecun) February 14, 2024

En développant massivement les capacités multilingues, Aya offre un potentiel de recherche en IA pour des dizaines de langues et de communautés mal desservies, explique l’équipe Cohere For AI. Grâce à des données de formation provenant de plus de 3 000 chercheurs indépendants dans 119 pays, Aya atteint une diversité linguistique sans précédent.

Les tests de référence montrent qu’Aya dépasse considérablement les performances d’autres modèles multilingues open source comme mT0 et Bloomz. Il a obtenu un score de plus de 75 % lors des évaluations humaines par rapport aux concurrents et de 80 à 90 % dans les comparaisons de taux de win rate.

Aya : libérer le potentiel des LLM dans d’autres langues

« Aya aide les chercheurs à libérer le puissant potentiel des LLM pour des dizaines de langues et de cultures largement ignorées par les modèles les plus avancés du marché aujourd’hui », déclare Cohere For AI dans la présentation de son LLM

Ce nouveau LMM place l’inclusivité linguistique au premier plan de la recherche sur l’IA, en devenant accessible dans plus de 50 langues auparavant non prise en charge par les modèles de pointe. Cela garantit que l’IA soit désormais à la portée de tous.

De plus, avec environ 204 000 annotations rares organisées par des locuteurs parlant couramment 67 langues, l’ensemble de données d’Aya constitue une étape importante vers la préservation de la diversité linguistique et culturelle qui définit l’héritage humain. Ce modèle open source viendra catalyser l’innovation en matière d’IA à l’échelle mondiale.

« Nous nous attendons à ce que les capacités d’Aya continuent de s’améliorer grâce à une collaboration continue […] Les chercheurs du monde entier peuvent désormais exploiter cet outil pour faire progresser l’IA multilingue », conclut l’équipe de Cohere For AI.

Notre blog est alimenté par les lecteurs. Lorsque vous achetez via des liens sur notre site, nous pouvons percevoir une commission d’affiliation.