Dans la soirée du 5 novembre, une surchauffe a frappé les serveurs de Microsoft Azure, le service cloud du géant de Redmond, dans la région d'Europe de l'Ouest. Un événement qui a entraîné des interruptions en cascade sur plusieurs services essentiels, et remet en question la résilience supposée absolue du cloud.

La planète numérique vit actuellement une véritable frénésie autour des centres de données, dopée par l'essor de l'intelligence artificielle (IA). Dans ce contexte, les géants du cloud investissent des sommes astronomiques pour soutenir la demande colossale en puissance de calcul. Par exemple, Microsoft a fait savoir qu'elle y consacrerait 80 milliards de dollars en 2025… Mais aussi solide que soit son infrastructure, elle n'est pas à l'abri de défaillances critiques.
Surchauffe aux Pays-Bas : quand le cloud s'enraye
Microsoft vient d'alerter ses clients sur un « incident thermique » survenu dans sa région « Europe de l'Ouest », située aux Pays-Bas. Le groupe évoque une hausse anormale des températures dans l'un de ses centres de données, ayant touché les systèmes de refroidissement.
Ainsi, les systèmes de surveillance automatiques ont détecté l'anomalie et déclenché une mise en sécurité, provoquant l’arrêt de plusieurs serveurs. Microsoft affirme qu'une unité de stockage a déjà été restaurée, et que le retour progressif à la normale était attendu dans les heures suivantes.
Malgré tout, cet incident démontre à quel point le cloud peut s’enrayer brutalement, même pour l'un des leaders mondiaux du secteur.

Une panne qui relance le débat ?
Car certaines zones de disponibilité voisines, censées justement protéger les clients contre ce genre d'incident, ont également été touchées. Et c'est ce point qui est inquiétant, la panne d'un seul site ayant eu des répercussions sur d'autres, faute d'indépendance complète entre les infrastructures. Conclusion : répartir les données sur plusieurs zones ne suffit pas toujours à éviter la paralysie, contrairement à ce que les géants peuvent laisser penser.
De quoi mettre en lumière les limites d'un modèle hypercentralisé, où une poignée d'acteurs gère la majorité des services numériques mondiaux. Une tendance que la panne d'Amazon Web Services (AWS), survenue il y a quelques jours, a confirmé.
Source : The Register