Cloudflare, küresel bir kesintinin ardından hizmetleri yeniden başlattı ve kesintinin nedenini açıklayan olay sonrası bir rapor yayınladı. Şirket, etkinliğin 18 Kasım erken saatlerinde Bot Yönetim sistemindeki yanlış yapılandırılmış bir dosyanın birden fazla dahili bileşende arızalara yol açmasıyla başladığını söyledi. Trafik yönlendirme süreçleri, büyük boyutlu yapılandırma dosyasının onu yönetmek için tasarlanmamış sistemler aracılığıyla yayılması nedeniyle etkilendi. Cloudflare, siber saldırının olaya sebep olmadığını doğruladı. Şirketin CEO’su Matthew Prince, kamuoyuna özür diledi ve organizasyonun benzer başarısızlıkları önlemek için prosedürleri gözden geçirdiğini söyledi.

 

 

Şirkete göre, sorun veritabanı izinlerinde yapılan bir değişiklikten kaynaklanıyordu ve bu da beklenenden çok daha büyük bir yapılandırma dosyası üretti. Bu dosya ağ boyunca dağıtıldığında, yönlendirme fonksiyonlarını etkileyen yazılım çökmelerine yol açardı. İçerik teslimatı, DNS çözümlemesi ve ağ koruması için Cloudflare’a bağlı olan hizmetler aralıklı olarak arızalar yaşadı veya ulaşılmaz hale geldi. ChatGPT, X, Spotify ve kesinti izleme siteleri gibi platformlar, Cloudflare’in küresel altyapısına güvendikleri için etkilenenler arasındaydı. Sorun, mühendisler nedeni izole etmek ve sorunlu yapılandırmayı geri almak için çalışırken birkaç saat sürdü.

Cloudflare, kesintinin 2019’dan bu yana en önemli hizmet kesintisi olduğunu söyledi. Şirket, sistemler yenilenirken düzenli güncellemeler yayınladı ve iyileşme döneminde bazı performans tutarsızlıklarının devam edebileceğini belirtti. Mühendisler bir çözüm sundu ve izleme araçları ağ koşullarının aynı gün daha sonra stabilleştiğini gösterdi. Cloudflare, operasyonların normale döndüğünü doğrulamak için sistem kayıtlarını ve yönlendirme kalıplarını analiz etmeye devam edeceğini ekledi.

Bu olay, az sayıda büyük ağ hizmet sağlayıcısının çevrimiçi hizmetlerin erişilebilirliği üzerindeki önemli etkisini ortaya koymaktadır. Cloudflare, büyük küresel trafik hacmlerini yönetir ve işletmeler, devlet kurumları ve dijital platformlar için temel işlevler sağlar. Altyapısında bir arıza yaşandığında, etkiler geniş yayılabilir çünkü birçok kuruluş verileri aynı çekirdek sistemler üzerinden yönlendirir. Analistler, kesintinin internet altyapısına dayanıklılık oluşturmanın ve kritik hizmetlerin mümkün olduğunda çeşitlendirilmesinin önemini pekiştirdiğini söylüyor.

Cloudflare, raporunda birkaç takip adımını özetledi. Bunlar arasında yapılandırma dosyalarının nasıl işlendiğini gözden geçirmek, anormal dosya boyutlarını tespit eden koruma önlemlerini iyileştirmek, hatalı güncellemelerin yayılmasını durdurmak için küresel mekanizmalar oluşturmak ve yüksek hacimli yönlendirmeyi destekleyen bileşenlerin dayanıklılığını güçlendirmek yer alır. Şirket, bu çalışmanın devam ettiğini ve iyileştirmeler uygulandıkça daha fazla güncellemenin yayınlanacağını belirtti.

Kesinti sırasında kesinti yaşayan kuruluşlar, müşteri hizmetleri ve iç operasyonlar üzerindeki etkisini değerlendiriyor. Sektör uzmanları, özellikle trafik yönlendirme veya içerik teslimatı için tek bir sağlayıcıya büyük ölçüde güveniyorlarsa, şirketlere iş sürekliliği planlarını değerlendirmelerini tavsiye eder. Çoklu sağlayıcılı dağıtım veya yedek yönlendirme gibi yaklaşımlar, bir sağlayıcı yaygın bir arıza yaşadığında hizmet erişilebilirliğini korumaya yardımcı olabilir.

Bir Cevap Yazın