Nouveau venu sur le champ de bataille de l’IA, Reka fait déjà trembler les géants avec son modèle multimodal Core qui surpasse ou égale GPT-4, Claude 3 Opus et Google Gemini Ultra Pro. Découvrez tout ce qu’il faut savoir !
Alors que la guerre de l’IA fait rage entre OpenAI, Anthropic ou encore les GAFAM tels que Meta, Google et Microsoft, un nouveau challenger pourrait rapidement les surpasser et s’imposer comme le leader…
Basée à San Francisco, la startup Reka a été fondée par des chercheurs de DeepMind, Google et Meta. Elle vient de lancer Reka Core : son modèle IA « le plus large et le plus capable », entraîné en partant de zéro à l’aide de milliers de GPU Nvidia H100.
Elle a été nourrie à partir de multiples sources, notamment des données disponibles publiquement, des données sous licences et des données synthétiques.
En moins d’un an d’entraînement, Reka Core égale les performances des meilleurs modèles de l’industrie comme GPT-4, Gemini Ultra ou même Claude 3.
Selon le CEO, Dani Yogatama, « cette capacité à entraîner des modèles hautement performants sur une période très courte distingue notre entreprise ».
Le nombre total de paramètres de cette IA n’a pas été dévoilé, mais la startup confirme qu’il s’agit d’un « très large modèle ». Il s’agit du troisième modèle de la famille, et son prédécesseur Reka Flash avait déjà 21 milliards de paramètres…
Une IA qui comprend le texte, l’audio, l’image et la vidéo
Et au-delà de sa puissance, c’est son aspect multimodal qui fait toute la différence avec les IA déjà existantes. Elle est capable de comprendre aussi bien le texte que l’image, l’audio et la vidéo.
Pour cause, ses données d’entraînement incluent tous ces différents types de données. Selon Yogatama, il s’agit seulement de la deuxième IA à couvrir toutes les modalités après Google Gemini Ultra.
Ceci lui permet également de fournir des réponses dans une large variété de domaines tels que les mathématiques ou le codage, avec un haut niveau de raisonnement.
Elle peut aussi parler 32 langues, et sa fenêtre de contexte dépasse les 128 000 tokens pour lui permettre de traiter d’immenses quantités d’informations très diverses en une seule fois. En d’autres termes, elle peut donc être utilisée pour travailler sur de très longs documents.
Reka Core vs GPT, Claude et Gemini
Lors du test de perception de vidéo, Core a surpassé son seul rival Gemini Ultra avec un score de 59,3 contre 54,3.
Concernant le benchmark MMMU pour les tâches liées à l’image, elle obtient un score de 56,3 et se place juste derrière GPT-4 à 56,8, Gemini Pro 1.5 à 58,5, et Claude 3 Opus et Gemini Ultra à 59,4.
À titre de comparaison, la version « vision » de Grok récemment lancée par Elon Musk et sa startup xAI est à la traîne avec un score de 53,6.
Sur d’autres benchmarks, Core rivalise aussi avec les champions. Sur le test MMLU pour la connaissance, son score de 83,2 la situe juste derrière GPT-4, Claude 3 Opus et Gemini Ultra.
Elle surpasse même GPT-4 sur GSM8K pour le raisonnement et HumanEval pour le codage avec des scores de 92,2 et 76,8. Toutefois, OpenAI s’apprête à lancer GPT-5 qui devrait offrir un bond en avant pour le raisonnement…
Afin d’atteindre ce niveau impressionnant de performances si rapidement, Reka a opté pour une approche inversée. Plutôt que d’entraîner le modèle et d’observer jusqu’où il va, comme à l’accoutumée, elle a d’abord ciblé un niveau de performance.
Par la suite, la startup a tenté de déterminer l’approche la plus efficace et rapide pour l’atteindre en termes de quantité de données pour l’entraînement et de nombre de GPU. Une méthode atypique, mais qui a porté ses fruits !
Snowflake, Oracle.. une liste de clients déjà longue
Alors, à quoi va bien pouvoir servir cette IA au sein d’un paysage déjà saturé ? Avec son aspect multimodal et son prix abordable, Reka espère stimuler l’émergence de nouveaux cas d’usage uniques pour ses clients.
Elle cible différentes industries, dont le e-commerce, le jeu vidéo, la santé ou encore la robotique. La startup a déjà commencé à travailler avec plusieurs partenaires.
C’est le cas de Snowflake, qui a incorporé Core et Flash à son service Cortex de développement d’applications LLM.
Citons aussi Oracle et le groupe AI Singapore qui utilisent également ces IA. Depuis le lancement de ses premiers modèles Flash et Edge, Reka a constaté un vif intérêt des entreprises et la liste d’attente est déjà longue.
Prix et disponibilité : comment utiliser Reka Core ?
Cette nouvelle IA est disponible dès aujourd’hui via API. Elle peut être déployée sur site (on-premise) ou sur appareil (on-device).
Son prix est de 10 dollars par million de tokens en input, et 25 dollars par millions de tokens en output. Un tarif qui la rend compétitive.
En comparaison, GPT-4 Turbo est proposé au même prix en input, mais à 30 dollars pour million de tokens en output.
Après une première année focalisée sur le lancement de ses modèles sur le marché, la firme compte maintenant continuer à améliorer son IA tout en accélérant sur l’aspect business.
Elle continue d’entraîner Core pour accroître ses performances, mais a aussi commencé à travailler sur la prochaine version. Néanmoins, Reka ne prévoit pas l’open sourcing de sa technologie…
Êtes-vous intéressé par Reka Core ? Pensez-vous que cette startup puisse surpasser OpenAI ? Ou êtes-vous au contraire lassé par la déferlante incessante de nouvelles IA ? Partagez votre avis en commentaire !
- Partager l'article :