2 Remove Virus

Cloudflare herstelt diensten en verklaart de oorzaak van de wereldwijde storing

Cloudflare heeft de diensten hersteld na een wereldwijde storing en heeft een rapport na het incident uitgebracht waarin de oorzaak van de storing wordt uitgelegd. Het bedrijf zei dat het incident vroeg op 18 november begon toen een verkeerd geconfigureerd bestand binnen het Bot Management-systeem storingen veroorzaakte bij meerdere interne componenten. Verkeersrouteringsprocessen werden beïnvloed doordat het oversized configuratiebestand zich verspreidde via systemen die er niet voor waren ontworpen. Cloudflare bevestigde dat een cyberaanval het incident niet heeft veroorzaakt. De CEO van het bedrijf, Matthew Prince, bood publiekelijk zijn excuses aan en zei dat de organisatie procedures aan het herzien is om soortgelijke mislukkingen te voorkomen.

 

 

Volgens het bedrijf ontstond het probleem door een wijziging in databaserechten die een configuratiebestand opleverde dat veel groter was dan verwacht. Wanneer dit bestand over het netwerk werd verspreid, veroorzaakte het softwarecrashes die de routeringsfuncties beïnvloedden. Diensten die afhankelijk zijn van Cloudflare voor contentlevering, DNS-resolutie en netwerkbeveiliging hebben af en toe storingen gehad of werden onbereikbaar. Platforms zoals ChatGPT, X, Spotify en sites voor storingen werden getroffen omdat ze afhankelijk zijn van de wereldwijde infrastructuur van Cloudflare. Het probleem bleef enkele uren bestaan terwijl ingenieurs werkten aan het isoleren van de oorzaak en het terugdraaien van de problematische configuratie.

Cloudflare zei dat de storing de grootste verstoring in de dienstverlening sinds 2019 was. Het bedrijf plaatste regelmatige updates terwijl de systemen werden hersteld en merkte op dat sommige prestatie-inconsistenties kunnen blijven bestaan tijdens de herstelperiode. Ingenieurs introduceerden een oplossing, en monitoringstools gaven aan dat de netwerkcondities later diezelfde dag stabiliseerden. Cloudflare voegde eraan toe dat het systeemlogs en routeringspatronen zal blijven analyseren om te verifiëren dat de operaties weer normaal zijn.

Het incident benadrukt de aanzienlijke impact die een klein aantal grote netwerkdienstverleners heeft op de beschikbaarheid van online diensten. Cloudflare verwerkt grote volumes wereldwijd verkeer en biedt essentiële functies voor bedrijven, overheidsinstanties en digitale platforms. Wanneer er een storing optreedt binnen de infrastructuur, kunnen de effecten zich wijd verspreiden omdat zoveel organisaties data via dezelfde kernsystemen sturen. Analisten zeggen dat de storing het belang benadrukt van het opbouwen van veerkracht in internetinfrastructuur en het diversifiëren van kritieke diensten waar mogelijk.

Cloudflare beschreef in zijn rapport verschillende vervolgstappen. Deze omvatten het beoordelen van hoe configuratiebestanden worden verwerkt, het verbeteren van beveiligingen die abnormale bestandsgroottes detecteren, het creëren van globale mechanismen om de verspreiding van foutieve updates te stoppen, en het versterken van de veerkracht van componenten die routering met hoog volume ondersteunen. Het bedrijf zei dat dit werk nog doorgaat en dat er verdere updates zullen worden gepubliceerd zodra verbeteringen worden doorgevoerd.

Organisaties die tijdens de storing downtime hebben ervaren, beoordelen de impact op de klantenservice en interne operaties. Branchespecialisten adviseren bedrijven om business continuity plannen te evalueren, vooral als ze sterk afhankelijk zijn van één enkele aanbieder voor verkeersroutering of contentlevering. Benaderingen zoals multi-vendor deployment of fallback-routing kunnen helpen om de beschikbaarheid van diensten te behouden wanneer een provider een grootschalige storing ervaart.