La matinée de la journée du 2 juillet n’a pas du tout été facile pour plusieurs personnes. Si vous êtes allé sur Shopify, Dropbox, ou sur d’autres sites web, vous avez probablement rencontré une erreur 502 entre 9h45 et 10h15. Certains ont supposé qu’il s’agissait d’une cyberattaque étrangère, mais il n’en était rien puisque cette fois-ci, le problème venait de Cloudflare.
Cloudflare est une société qui fournit une infrastructure d’hébergement et de sécurité à environ 16 millions de sites web. La société sécurise les sites et accélère les temps de chargement, mais lorsqu’elle rencontre un problème, cela affecte également tous ces sites web. C’est ce qui s’est donc passé dans la matinée du 2 juillet lorsqu’une panne de Cloudflare a fait tomber en panne des millions de sites web à travers le monde.
John Graham-Cumming, le responsable de la technologie de Cloudflare, a déclaré que la panne du service avait été provoquée par un mauvais déploiement de logiciel. L’Europe et la côte Est américaine ont été les plus durement touchées, car la panne s’est produite au milieu de la journée de travail dans ces régions. Un site de cryptomonnaie a même suggéré que la panne provoquait une panique mineure en montrant faussement à la population que le prix du Bitcoin avait chuté. On ne peut qu’imaginer dans quel état pouvaient se trouver les détenteurs de Bitcoin.
La panne aura duré environ 30 minutes et à en croire Graham-Cumming, elle aurait été causée par le déploiement d’une règle mal configurée dans le pare-feu d’applications web de Cloudflare lors du déploiement de routine de nouvelles règles gérées par Cloudflare WAF. Cette mauvaise règle contenait une expression régulière qui faisait tourner le processeur à 100 %. Ce pic observé au niveau du processeur, a provoqué les erreurs 502 constatées par les utilisateurs. Le problème a été réglé et tout est très vite rentré dans l’ordre au niveau de tous les domaines utilisant Cloudflare.
Graham-Cumming a tenu à rassurer les clients de la société sur le fait qu’il ne s’agissait pas d’une attaque. Il a également fait savoir que la société est en train d’examiner et d’apporter des modifications à son processus de test et de déploiement afin d’éviter de tels incidents à l’avenir. Ce genre de panne est malheureusement assez fréquent. On se souvient encore que le 2 juin dernier, une panne chez Google avait affecté des applications YouTube et G Suite telles que Google Docs et Google Agenda. Le problème se répercutait sur Google Cloud, entraînant la disparition de services tels que Shopify, Snapchat et Discord.
Tout ceci montre illustre bien le fait qu’une grande partie d’internet repose sur un cadre de services centralisés dans lequel une petite erreur en bas ou en haut peut rapidement plonger internet dans le chaos.
Source : Cloudflare