Baleine pour illustrer DeepSeek

90 % moins cher : DeepSeek V4 déclare la guerre totale à OpenAI

Quelques jours après avoir dévoilé les premières versions de ses modèles V4, DeepSeek réduit déjà ses prix. Une offre promotionnelle est en cours pour V4-Pro, suivie d’une baisse de 90% sur les prix de l’ensemble de ses API.

DeepSeek a lancé la version préliminaire de son modèle V4 le 24 avril. Disponible en deux versions, Pro et Flash, V4 est open source et impressionne par ses performances.

Si l’on croit DeepSeek, V4-preview rivalise avec les modèles fermés américains les plus performants. Par exemple Opus 4.6, Gemini 3.1 Pro ou encore GPT-5.4-xHigh. Et pourtant, ses tarifs API sont nettement plus bas. 

Cette différence s’explique notamment par une architecture plus légère, pensée pour réduire les coûts sans sacrifier les performances. Mais une nouvelle vient de tomber et croyez-moi, celle-là, c’est la meilleure ! 

DeepSeek V4 à tarifs encore plus réduits

L’entreprise a annoncé la première bonne nouvelle le 25 avril. L’API DeepSeek-V4-Pro profite actuellement d’une remise de 75 %. Celle-ci est valable jusqu’au 5 mai 2026 à 15h59 (UTC). 

Au lieu de 0.145 $ donc, le tarif passe à 0,03625 $ pour les entrées en cache. Hors cache, le prix est de 0,435 $ plutôt que 1.74. Et pour les sorties, 0,87 $ au lieu de 3.48. Voilà une occasion en or pour tous ceux qui veulent tester ses capacités sans se ruiner.

Toutefois, ce n’est pas tout. Hier, le 26 avril, DeepSeek a aussi baissé le coût d’accès au cache d’entrée. Désormais, il ne représente plus qu’un dixième du prix initial pour l’ensemble des API. Comme vous pouvez le constater sur l’image ci-dessous.

En comparaison, les autres services propriétaires américains affichent des tarifs nettement plus élevés. Claude Opus 4.7 est par exemple à 5 dollars en entrée et 25 dollars en sortie.

GPT-5.5 à 5 dollars en entrée et 30 dollars en sortie, voire 30 dollars en entrée et 180 dollars en sortie pour la version Pro. Et Gemini 3.1 Pro se situe à 2 dollars en entrée et 12 dollars en sortie. D’ailleurs, ses prix doublent à 4 dollars et 18 dollars une fois la barre des 200 000 tokens franchie.

Le secret de l’entreprise chinoise

Pour avoir des coûts aussi réduits, DeepSeek indique dans son document de recherche avoir mis au point un système hybride. Il est baptisé CSA (Compressed Sparse Attention) et HCA (Heavily Compressed Attention). Ce système compresse les données à chaque étape du processus au lieu de les traiter dans leur totalité. 

Résultat, sur un contexte d’un million de tokens, DeepSeek-V4-Pro n’utilise que 27 % des ressources de calcul nécessaires à son prédécesseur DeepSeek-V3.2 et seulement 10 % de la mémoire cache. Ce qui allège fortement la charge sur les serveurs.

Dans le même élan d’optimisation, DeepSeek précise également avoir remplacé son optimiseur d’entraînement traditionnel. L’entreprise abandonne AdamW au profit de Muon. Un choix qui permet une convergence plus rapide du modèle et une stabilité améliorée tout au long de la phase d’entraînement.

Restez à la pointe de l'information avec LEBIGDATA.FR !

▶ Abonnez-vous à notre chaîne YouTube et Ajoutez-nous à vos favoris sur Google Actualités
Cliquez pour commenter

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Newsletter

La newsletter IA du futur

Rejoins nos 100 000 passionnés et experts et reçois en avant-première les dernières tendances de l’intelligence artificielle🔥