Cette dernière version du modèle de recherche Sonar de Perplexity AI est alimentée par Llama 3.3 70B de Meta et d’autres matériels spécialisés.

Lancé en juillet 2022, Perplexity AI s’est vite démarqué des autres chatbots conversationnels comme ChatGPT, Gemini et Copilot grâce à son approche centrée sur la recherche en ligne. Contrairement aux modèles d’IA traditionnels qui s’appuient sur des données préalablement entraînées, Perplexity se connecte en temps réel pour obtenir les informations les plus récentes. Sa nouvelle API Sonar adopte la même approche, car elle offre un accès direct à internet en temps réel. Cette méthode garantit des réponses fondées sur des sources fiables et actualisées. Cela renforce ainsi la précision et la crédibilité des résultats.

Une IA de recherche web flashée à 1 200 tokens par seconde ?

Cette nouvelle version de Sonar est basée sur Llama 3.3, qui n’est autre que l’un des derniers modèles d’IA de Meta avec 70 milliards de paramètres.

Attention ! Vous devez savoir que Sonar est un modèle qui n’est pas développé pour des tâches complexes. Perxpexity a affirmé qu’il peut très bien rivaliser avec les modèles les plus connus comme GPT-4o-mini et Claude 3.5 Haiku. Ces petits modèles à prix abordable sont d’ailleurs conçus pour proposer des réponses rapides.

Vous pensez peut-être que c’est un petit modèle de plus sans grand intérêt ? Détrompez-vous ! Le nouveau Sonar de Perplexity impressionne par sa rapidité. En effet, ce modèle peut générer des réponses à une cadence vertigineuse de 1 200 jetons par seconde (l’équivalent d’un mot). Bref, c’est actuellement le nouveau record dans l’industrie.

Rappelons qu’une semaine auparavant, le français Mistral dévoilait un modèle atteignant déjà 1 100 tokens par seconde. Grâce à cette vitesse, Perplexity, dans sa version standard, offre des réponses instantanées. Cela rappel d’ailleurs l’expérience de recherche sur Google, sans temps d’attente.

Deux versions d’IA distinctes !

L’API Sonar est proposée en deux versions distinctes. Tout d’abord, il y a la version de base qui est à la fois économique et rapide. Cette version est donc destinée aux utilisateurs qui ont un besoin simple.

Par ailleurs, il y a la version Pro qui se veut plus puissante. Selon la société, Sonar Pro se démarque surtout dans le traitement de questions complexes. En fait, elle est capable de réaliser plusieurs recherches simultanées. En plus, elle peut proposer deux fois plus de citations par rapport à la version de base.

Lors du lancement, j’ai trouvé que l’un des cas d’utilisation les plus intéressants de Sonar est le fait qu’elle peut être intégrée à Zoom. Cette plateforme de visioconférence très connue se sert de cette API afin d’alimenter un assistant IA pouvant fournir des réponses en temps réel directement au sein des réunions.

D’ailleurs, vous pouvez réaliser des recherches sur internet avec citations grâce à cette fonctionnalité, et ce, sans quitter votre écran de discussion.

