Uber booste son IA et ses courses en temps réel avec les puces Amazon AWS

Uber travaille étroitement avec Amazon pour améliorer, en temps réel, la gestion de ses millions de courses quotidiennes. Le géant du VTC mise notamment sur les puces Graviton4 et Trainium3 d'AWS.

La puce Graviton4 d'AWS, l'un des fondements des progrès technologiques d'Uber. © AWS

Chaque tap sur l'appli Uber déclenche en coulisses une avalanche de calculs algorithmiques traités en quelques millisecondes, et ce à l'échelle planétaire. Pour tenir cette cadence infernale sans jamais flancher, le leader mondial du covoiturage et de la livraison à la demande renforce son infrastructure sur Amazon Web Services, la branche IA et cloud du poids lourd mondial du e-commerce, en misant sur la puce Graviton4. Uber expérimente aussi Trainium3, la puce d'entraînement IA d'Amazon, pour des prédictions encore plus précises.

Uber s'appuie sur la puce Graviton4 d'AWS pour ne jamais rater un pic de demande

Chaque fois que vous ouvrez Uber, l'application a moins d'une seconde pour répondre à trois questions : quel chauffeur envoyer, par quel chemin, et dans combien de temps ? Cela paraît simple en apparence, sauf que cette opération se répète simultanément pour des millions d'utilisateurs à travers le monde, en permanence, et sans droit à l'erreur lors des pics de demande.

C'est là qu'entrent en jeu les Trip Serving Zones, autrement dit, les serveurs chargés de traiter en temps réel chaque opération de la plateforme, qu'il s'agisse de la localisation, de la disponibilité des chauffeurs, ou du calcul des trajets. En confiant davantage de ces opérations aux puces Graviton4, conçues sur mesure par Amazon pour ce type de calculs intensifs, Uber gagne en réactivité, réduit sa consommation d'énergie et tient la charge sans broncher, même aux heures les plus chargées.

Kamran Zargahi, vice-président de l'ingénierie chez Uber, explique qu'« Uber opère à une échelle où chaque milliseconde compte. » En clair, transférer davantage de calculs vers AWS permet à l'entreprise de s'adapter instantanément aux hausses soudaines de trafic, sans que l'utilisateur ne remarque quoi que ce soit. « Le transfert d'une plus grande partie des charges de travail liées à la gestion des trajets vers AWS nous offre la flexibilité nécessaire pour mettre en relation plus rapidement les passagers et les chauffeurs et gérer les pics de demande de livraison sans interruption », formule-t-il.

L'intelligence artificielle d'Uber passe à un niveau supérieur avec Trainium3

En parallèle, Uber expérimente AWS Trainium3, la puce conçue par Amazon non pas pour faire tourner des applications, mais pour apprendre, c'est-à-dire entraîner des modèles d'IA à partir de quantités massives de données. En l'occurrence, les algorithmes analysent les données de millions et de millions de courses et de livraisons, qui servent à affiner trois capacités essentielles de l'appli : mieux choisir le chauffeur le plus adapté, afficher des temps d'arrivée plus précis, et proposer les meilleures options de livraison.

Plus les modèles d'IA d'Uber sont nourris de données, plus leurs prédictions s'affinent (ETA fiables, mises en relation optimisées, suggestions personnalisées). Trainium3 offre la puissance nécessaire pour entraîner ces algorithmes à grande échelle, avec une efficacité économique compatible avec les volumes astronomiques traités quotidiennement par la plateforme.

« En commençant à tester certains de nos modèles d'IA sur Trainium, nous mettons en place une base technologique qui rendra chaque expérience Uber plus intelligente », explique Kamran Zargahi. Rich Geraffo, vice-président et directeur général d'AWS pour l'Amérique du Nord, affirme qu'Uber est selon lui « l'une des applications temps réel les plus exigeantes au monde ». Deux déclarations qui, mises bout à bout, montrent mine de rien que le partenariat entre Uber et AWS est solide, et voué à perdurer.