Uber renforce sa collaboration avec Amazon pour optimiser, en temps réel, la gestion de ses millions de trajets quotidiens. Pour y parvenir, le géant du VTC s’appuie notamment sur les puces Graviton4 et Trainium3 développées par Amazon Web Services.
La puissance de Graviton4 servira à renforcer son infrastructure cloud. Trainium3, quant à elle, servira à améliorer la précision de ses prédictions. Car au cas où vous ne l’auriez pas deviné, il s’agit d’une puce dédiée à l’entraînement de modèles d’intelligence artificielle.
Du côté d’AWS, Rich Geraffo rappelle qu’Uber figure parmi les applications en temps réel les plus exigeantes au monde. Une déclaration qui illustre la solidité du partenariat entre les deux entreprises.
Que mijote Uber avec ces technologies d’Amazon exactement ?
À chaque ouverture de l’application Uber, le système dispose de moins d’une seconde pour prendre trois décisions clés. Quel chauffeur attribuer, quel itinéraire emprunter et dans quel délai ?
Pour nous qui nous contentons de prendre le Uber, cela n’a rien de très difficile. Cependant, comprenez que cette opération est reproduite en simultané et en continu pour des millions d’utilisateurs à l’échelle mondiale.
Or, le système n’a pas la moindre marge d’erreur même lors des pics de demande. Là voilà l’importance des Trip Serving Zones. Ce sont des serveurs dédiés à traiter en temps réel chaque donnée de la plateforme. Qu’il s’agisse de la localisation des chauffeurs, de leur disponibilité ou du calcul des trajets.
Aujourd’hui en revanche, les données à traiter ont massivement augmenté. Alors, Uber a décidé de transférer une part plus importante de ces opérations vers les puces Graviton4.
D’autant qu’elles sont spécialement conçues par Amazon pour ce type de calculs lourds. Uber améliore ainsi sa réactivité, optimise sa consommation d’énergie et supporte sans difficulté les pics d’activité les plus intenses.
En parallèle, l’entreprise explore les capacités de Trainium3. Comme dit tout haut,c’est une puce conçue pour entraîner des modèles d’IA à partir de volumes massifs de données.
Les algorithmes analysent ainsi des millions de trajets et de livraisons afin d’améliorer plusieurs aspects clés de la plateforme. Par exemple, la sélection des chauffeurs, la précision des temps d’arrivée et l’optimisation des options de livraison.
Les limites de cette stratégie
Les puces Graviton4 et Trainium3 d’Amazon Web Services promettent de renforcer considérablement l’infrastructure d’Uber, certes. Il serait illusoire de penser qu’elles résolvent tous les défis de la plateforme.
La première question est : ces nouvelles infrastructures pourront-elles réellement supporter les pics de demande extrêmes ? Par exemple, pendant Noël, le Black Friday ou d’autres événements mondiaux ponctuels.
D’ailleurs, AWS lui-même a évoqué ce sujet dans un récent article. Même des architectures conçues pour monter en charge automatiquement peuvent ne pas réagir assez vite lorsque la demande grimpe de façon explosive et dépasse les prévisions.
Or, le billet AWS explique qu’il arrive que le trafic augmente jusqu’à 2 à 25 × le niveau normal. Alors, je me permets de douter.
À cela s’ajoutent les coûts et complexités d’intégration. Migrer une partie importante du traitement vers de nouvelles puces n’est pas une opération triviale. Il faut adapter les algorithmes existants, tester chaque scénario de calcul et assurer la compatibilité avec les systèmes déjà en place.
Ces étapes nécessitent non seulement des ressources financières importantes, mais aussi du temps et une expertise pointue.
Enfin, des défis techniques persistent. L’IA reste tributaire de la qualité et de la fraîcheur des données. Et certaines situations imprévues, comme des accidents ou des embouteillages massifs, restent difficiles à anticiper parfaitement.
- Partager l'article :

