İşletmeler bilgi teknolojilerine her zamankinden daha bağımlı. Sipariş yönetiminden muhasebeye, müşteri verilerinden e-postaya kadar pek çok kritik süreç dijital sistemler üzerinden yürüyor. Bu da şu anlama geliyor: sistemlerin durması doğrudan gelirin, itibarın ve müşteri güveninin durması demek. Bir donanım arızası, fidye yazılımı saldırısı, insan hatası veya doğal afet birkaç dakika içinde günlerce sürecek bir kesintiye dönüşebilir.
İşte tam bu noktada felaket kurtarma planı (Disaster Recovery Plan) devreye giriyor. İyi hazırlanmış bir plan, beklenmedik bir olay sonrasında sistemlerin ne kadar sürede ve hangi veri seviyesine kadar geri getirileceğini önceden tanımlar. Bu yazıda, kurumsal bir felaket kurtarma planını sıfırdan nasıl oluşturacağınızı adım adım inceliyoruz.
Felaket Kurtarma Planı Nedir?
Felaket kurtarma planı, bir BT kesintisi yaşandığında kritik sistemlerin ve verilerin nasıl geri yükleneceğini tanımlayan yazılı bir yol haritasıdır. Yedekleme (backup) ile sık sık karıştırılsa da ikisi aynı şey değildir. Yedekleme, verinin bir kopyasını almaktır; felaket kurtarma ise o veriyi ve onu çalıştıran sistemleri belirli bir süre içinde yeniden ayağa kaldırma sürecidir.
Bir başka önemli kavram da iş sürekliliği planıdır. Felaket kurtarma teknik altyapıya odaklanırken, iş sürekliliği planı tüm işletmenin (insan kaynağı, iletişim, fiziksel ortam dâhil) krizde nasıl çalışmaya devam edeceğini kapsar. İyi bir felaket kurtarma planı, iş sürekliliği planının teknik omurgasını oluşturur.
Adım 1: Kritik Varlıkları ve Riskleri Belirleyin
Plan, neyi koruduğunuzu bilmeden hazırlanamaz. İlk adım, işletmenizdeki tüm BT varlıklarının envanterini çıkarmaktır: sunucular, uygulamalar, veritabanları, ağ cihazları ve bunların barındırıldığı ortamlar.
Ardından her bir varlığı kritiklik düzeyine göre sınıflandırın. Hangi sistem dururduğunda iş tamamen durur? Hangisi birkaç saat beklenebilir? Bu sınıflandırma, kurtarma sırasında önceliklendirme yapmanızı sağlar.
Aynı aşamada bir risk analizi yapın. Olası tehditleri ve bunların gerçekleşme olasılığını değerlendirin:
- Donanım arızaları (disk, güç kaynağı, ağ ekipmanı)
- Siber saldırılar (fidye yazılımı, DDoS, veri ihlali)
- İnsan hataları (yanlışlıkla silme, hatalı yapılandırma)
- Elektrik kesintisi, yangın, su baskını gibi fiziksel olaylar
Bu değerlendirme, hangi senaryolara karşı ne kadar yatırım yapmanız gerektiğini netleştirir.
Adım 2: RTO ve RPO Hedeflerini Tanımlayın
Felaket kurtarmanın iki temel metriği vardır ve planın geri kalanı bu iki değer etrafında şekillenir:
- RTO (Recovery Time Objective): Bir sistemin kesinti sonrasında en geç ne kadar sürede tekrar çalışır hâle gelmesi gerektiğidir. Örneğin RTO'nuz 4 saat ise, sistemin en fazla 4 saat içinde ayağa kalkması beklenir.
- RPO (Recovery Point Objective): Kabul edebileceğiniz maksimum veri kaybı miktarıdır. RPO'nuz 1 saat ise, son yedekten bu yana en fazla 1 saatlik verinin kaybolması tolere edilebilir demektir.
Her sistem için ayrı RTO ve RPO belirlemek mantıklıdır. E-ticaret sipariş veritabanı için dakikalar mertebesinde hedefler gerekebilirken, dâhili bir raporlama aracı için bir günlük hedef yeterli olabilir. Bu hedefler ne kadar agresifse altyapı maliyeti de o kadar artar; bu nedenle hedefleri gerçekçi iş ihtiyaçlarına göre dengelemek önemlidir.
Adım 3: Yedekleme ve Veri Çoğaltma Stratejisi Kurun
Belirlediğiniz RPO hedeflerine ulaşmak için doğru yedekleme stratejisini seçmeniz gerekir. Yaygın bir yaklaşım 3-2-1 kuralıdır: verinin en az üç kopyası, iki farklı ortamda ve en az biri saha dışında (off-site) tutulur.
Yedeklerinizi yalnızca almak yetmez; düzenli olarak doğrulamanız da şarttır. Geri yüklenemeyen bir yedek, hiç yedek almamış olmakla aynı kapıya çıkar. Bu nedenle test geri yüklemeleri planın ayrılmaz bir parçası olmalıdır.
Saha dışı kopya için coğrafi olarak ayrı bir konum kritik öneme sahiptir. Birincil sisteminizle aynı binada duran bir yedek, yangın veya su baskını gibi fiziksel bir olayda işe yaramaz. Felaket kurtarma hizmetleri tam da bu noktada devreye girerek verilerinizin ikincil bir lokasyonda güvenle saklanmasını ve gerektiğinde hızla devreye alınmasını sağlar.
Adım 4: İkincil Altyapıyı Planlayın
Veri güvende olsa bile, onu çalıştıracak bir altyapı olmadan kurtarma tamamlanmış sayılmaz. Burada birkaç yaklaşım öne çıkar:
- Soğuk yedek (cold site): Donanım hazırdır ancak sistemler kapalıdır; devreye alma uzun sürer, maliyeti düşüktür.
- Sıcak yedek (hot site): Sistemler birincil ortamla senkron çalışır, devreye alma çok hızlıdır; maliyeti yüksektir.
- Ilık yedek (warm site): İkisinin arasında bir denge sunar.
Esnek ve hızlı ölçeklenebilir bir ikincil ortam için bulut sunucu altyapısı güçlü bir seçenektir. Bulut tabanlı kaynaklar, fiziksel donanımı önceden satın almak yerine ihtiyaç anında devreye alma imkânı sunarak kurtarma sürecini hızlandırır.
Kendi donanımınızı barındırmayı tercih ediyorsanız, ikincil lokasyonda güvenli ve yönetilen bir alan için kabin kiralama çözümleri değerlendirilebilir. Böylece kritik ekipmanınız kontrollü güç, soğutma ve fiziksel güvenlik ortamında konumlanır.
Adım 5: Rolleri, İletişimi ve Senaryoları Yazıya Dökün
Teknik altyapı kadar önemli olan bir diğer unsur da organizasyondur. Bir kriz anında kimin neyi yapacağı önceden belli olmalıdır:
- Kurtarma sürecini kim yönetecek?
- Hangi ekip hangi sistemden sorumlu?
- Müşteriler, çalışanlar ve tedarikçilerle iletişimi kim, nasıl kuracak?
- Karar verme yetkisi kimde?
Bu bilgileri içeren bir iletişim ağacı (escalation matrix) ve adım adım kurtarma prosedürleri hazırlayın. Dokümanı, ana sistemler çöktüğünde bile erişilebilecek bir yerde (örneğin çevrimdışı bir kopya olarak) saklayın.
Ayrıca siber saldırı senaryolarını da göz ardı etmeyin. Özellikle hizmet kesintisine yol açan saldırılara karşı önlem almak planın bir parçası olmalıdır. DDoS koruma gibi çözümler, sistemleriniz hedef alındığında erişilebilirliği sürdürmeye yardımcı olarak bazı felaket senaryolarının daha baştan oluşmasını engeller.
Adım 6: Planı Test Edin ve Düzenli Güncelleyin
Hazırlanan bir felaket kurtarma planının en sık yapılan hatası, raflarda unutulmasıdır. Test edilmemiş bir plan yalnızca bir varsayımdır. Düzenli aralıklarla tatbikatlar düzenleyin:
- Masa başı tatbikatı: Ekip, senaryoyu kâğıt üzerinde adım adım gözden geçirir.
- Kısmi test: Belirli bir sistem gerçekten ikincil ortama taşınır.
- Tam tatbikat: Gerçek bir felaket simüle edilerek tüm süreç baştan sona işletilir.
Her testin ardından elde edilen dersleri belgeleyin ve planı güncelleyin. Altyapınız değiştikçe (yeni uygulamalar, büyüyen veri hacmi, değişen ekip) planın da bununla birlikte evrilmesi gerekir. En az yılda bir kapsamlı bir gözden geçirme yapmak iyi bir pratiktir.
Sonuç
Felaket kurtarma planı, "başımıza gelmez" denilerek ertelenebilecek bir konu değildir. Aksine, kesinti yaşanmadan önce yapılan hazırlık, krizin maliyetini belirleyen en önemli faktördür. Kritik varlıklarınızı tanımlamak, gerçekçi RTO ve RPO hedefleri koymak, güvenilir bir yedekleme ve ikincil altyapı stratejisi kurmak, rolleri netleştirmek ve planı düzenli test etmek; sağlam bir kurtarma yeteneğinin temel taşlarıdır.
İşletmenize özel bir felaket kurtarma stratejisi oluşturmak, doğru altyapıyı seçmek ve verilerinizi güvence altına almak konusunda destek almak isterseniz Netzone ekibi yanınızda. İhtiyaçlarınıza uygun çözümleri konuşmak ve size özel bir teklif almak için bizimle iletişime geçebilirsiniz.