Actualité

Web

Panne massive chez Google Cloud : pourquoi une simple erreur a brièvement paralysé le Web

Par Vincent Lautier - Publié le

Vous n’avez pas pu passer à côté : cette semaine, et jeudi en particulier, une erreur dans la gestion des API de Google Cloud a entraîné une panne majeure affectant plus de 50 services, de ChatGPT à Gmail, en passant par Spotify. Retour sur ce déraillement technique et ses répercussions globales.

Panne massive chez Google Cloud : pourquoi une simple erreur a brièvement paralysé le Web


Une panne qui a pris tout le monde de court



Jeudi dernier, en début d’après-midi, Google Cloud a connu une interruption majeure. Des milliers de rapports ont commencé à apparaître sur DownDetector, indiquant des pannes sur Google Search, Meet, Docs ou encore Nest. Mais les problèmes ne se sont pas arrêtés là : des plateformes tierces comme Spotify, Discord ou Snapchat ont également été touchées. En tout, une cinquantaine de services ont été affectés à différents degrés.

Panne massive chez Google Cloud : pourquoi une simple erreur a brièvement paralysé le Web


La cause : un bug dans le système de gestion des API



Google a rapidement identifié la source du problème : une mise à jour erronée de quota dans le système de gestion des API. Cette défaillance a entraîné le rejet massif de requêtes externes, générant des erreurs 503 en cascade. L’incident s’est propagé à l’ensemble des régions où l’infrastructure Google Cloud est déployée. La région « us-central1 » a même mis plus de temps à se remettre, en raison d’une surcharge de sa base de données de politiques de quota.

Panne massive chez Google Cloud : pourquoi une simple erreur a brièvement paralysé le Web


Un Web mondial très dépendant de Google



La panne a révélé à quel point le Web mondial repose sur les infrastructures de Google. Des entreprises comme OpenAI, Shopify, Cloudflare ou GitHub ont vu certains de leurs services ralentis, voire interrompus. Chez Cloudflare, la panne a affecté le stockage clé-valeur utilisé pour la configuration et la distribution d’actifs sur le Web. Même des utilisateurs lambda ont ressenti l’impact : incapacité à envoyer des mails, à accéder à leurs documents ou à utiliser des applications musicales.

Une remise en question de la dépendance au cloud



Face à cet incident, Google et ses partenaires affichent leur volonté de renforcer la résilience de leurs systèmes. Google promet une meilleure gestion des erreurs et un contrôle plus strict sur les métadonnées propagées à l’échelle mondiale. De son côté, Cloudflare prévoit de migrer certains services vers des solutions internes pour réduire sa dépendance. Cet épisode montre bien la fragilité d’un écosystème numérique très centralisé, où une simple erreur peut avoir des conséquences planétaires.

On en dit quoi ?



Ce genre de problème est en réalité fréquent, mais la plupart du temps, les pannes sont assez courtes et localisées pour ne pas être trop gênantes. Un conseil que je m’applique et que je peux vous donner, c’est de doubler tous les services que vous utilisez : ayez deux solutions différentes de stockage en ligne (par exemple, Google Drive et Dropbox), deux adresses e-mail, dont une de secours si votre mail principal tombe en panne, deux IA à utiliser au quotidien, etc. Cela ne vous mettra pas à l’abri de toutes les pannes, mais cela pourra peut-être en limiter les impacts, parfois !

Avez-vous été impacté par la panne de jeudi dernier, d’ailleurs ? Racontez-nous cela. Et pensez aussi à nous suivre sur Instagram !