15. Juni 2026

Disaster Recovery in der Praxis: Wie Claranet einen AWS-Komplettausfall in vier Tagen bewältigte

Tobias Elsner

Cloud Engineer

Ein Disaster-Recovery-Konzept gilt in vielen Unternehmen als „Nice-to-have". Wie geschäftskritisch eine vorbereitete Wiederherstellungsstrategie tatsächlich ist, zeigt ein aktueller Fall aus der Claranet Praxis: Innerhalb weniger Tage musste eine komplette IT-Umgebung neu aufgebaut werden, nachdem AWS-Rechenzentren in einer Krisenregion ausfielen.

Die Ausgangslage: Komplettausfall ohne Disaster-Recovery-Konzept

Im Frühjahr 2026 führten geopolitische Spannungen im Nahen Osten zu einer unerwarteten und unmittelbaren IT-Krise bei einem unserer Kunden: Teile der regionalen AWS-Rechenzentren wurden durch Drohnen stark beschädigt. Die Folge war ein Komplettausfall der gesamten Unternehmens-IT. Ein implementiertes Disaster-Recovery-Konzept existierte nicht.

Damit standen sofort drei Probleme im Raum. Erstens: Die Reparaturarbeiten von AWS kamen wegen der anhaltend schwierigen Sicherheitslage nur langsam voran. Zweitens: Die naheliegende Lösung, eine schnelle Migration in eine andere AWS-Region, scheiterte an gestörten AWS-Services. Drittens: Ohne vorbereitete Failover-Strukturen drohten täglich wachsende Geschäftsausfälle.

Die Claranet Lösung: Neuaufbau in unter 96 Stunden

Der Kunde entschied sich für einen kurzfristigen Neubau der IT-Umgebung gemeinsam mit Claranet als Cloud-Partner. Die Zusammenarbeit lief in enger, kontinuierlicher Abstimmung. Der Zeitplan:

Donnerstagabend: GO für die Umsetzung
Später Freitagabend: Übergabe der neuen Umgebung
Montag: gemeinsame Inbetriebnahme und Funktionstests
Dienstagmorgen: erster Teil der Umgebung produktiv im Einsatz

Parallel zur Wiederinbetriebnahme arbeitete das Claranet Team mit dem Kunden an der Weiterentwicklung einer vollständigen DR-Umgebung. Besonders bemerkenswert: Die Migration erfolgte ohne client-seitige Konfigurationsänderungen. Dieser Punkt wurde im Kundenfeedback ausdrücklich hervorgehoben, ebenso wie die schnelle und reibungslose Wiederverfügbarkeit.

Erfolgsfaktoren der schnellen Wiederherstellung

Aus dem Projekt lassen sich vier zentrale Lessons Learned ableiten, die für jedes Disaster-Recovery-Szenario gelten:

Flexibilität und proaktives Handeln sind in Krisensituationen entscheidend.
Offene Kommunikation und enge Zusammenarbeit mit versierten Partnern sind Schlüsselfaktoren.
Schnelle, zuverlässige Umsetzung stärkt das Vertrauen in die Zusammenarbeit.
Die Bedeutung von DR-Konzepten wird in der Realität immer wieder bestätigt.

Die erfolgreiche Bewältigung dieser kritischen Situation zeigt: Teamwork, Flexibilität und Engagement führen auch unter Zeitdruck zu einer schnellen Migration und Wiederherstellung der Services. Der Wert partnerschaftlicher Zusammenarbeit und proaktiver Problemlösung wurde in diesem Fall besonders deutlich.

Risiken ohne Disaster-Recovery-Mechanismen

Was hätte passieren können, wenn der Kunde ohne erfahrenen Partner agiert hätte? Diese fünf Risiken treten typischerweise auf, wenn Unternehmen ohne vorbereitetes Disaster-Recovery-Konzept in einen Ernstfall geraten:

Lange Wiederherstellungszeiten: Ohne vorbereitete DR-Umgebung muss die Infrastruktur und Konfiguration erst neu aufgebaut werden, was wertvolle Zeit kostet.
Fehlende Automatisierung: Manuelle Prozesse erhöhen die Fehleranfälligkeit und verzögern die Wiederherstellung zusätzlich.
Datenverluste: Ohne regelmäßige Backups und Replikation besteht die Gefahr, dass aktuelle Daten unwiederbringlich verloren gehen.
Kundenunzufriedenheit und Imageverlust: Längere Ausfälle beeinträchtigen die Kundenzufriedenheit und können das Vertrauen in das Unternehmen nachhaltig schädigen.
Hoher operativer Aufwand: Die Notfallmigration bindet Ressourcen und erfordert oft die Zusammenarbeit mehrerer Teams unter hohem Zeitdruck.

Vorteile eines vorab implementierten DR-Konzepts

Wer Disaster Recovery vorausschauend plant, profitiert von messbaren Vorteilen. Genau hier setzen die Managed Services von Claranet an:

Minimierte Ausfallzeiten (RTO/RPO): Durch automatisierte Failover-Mechanismen und regelmäßige Datenreplikation lassen sich die Wiederherstellungszeit (Recovery Time Objective, RTO) und der maximal tolerierbare Datenverlust (Recovery Point Objective, RPO) auf ein Minimum reduzieren.
Automatisierte Wiederherstellung: Mit Infrastructure as Code und standardisierten Templates lässt sich die gesamte IT-Landschaft in einer alternativen Region schnell und konsistent neu bereitstellen.
Kosteneffizienz: Moderne Cloud-DR-Lösungen ermöglichen es, Ressourcen für den Notfall kostengünstig vorzuhalten und nur im Ernstfall zu aktivieren („Pilot Light"- oder „Warm Standby"-Ansatz).
Regelmäßige Tests und Compliance: DR-Mechanismen können regelmäßig getestet werden, um im Ernstfall Sicherheit und Compliance-Anforderungen zu erfüllen.
Reduzierter operativer Stress: Ein vordefinierter DR-Plan schafft Klarheit über Abläufe und Rollen im Krisenfall und entlastet die Teams.
Schnelle Skalierbarkeit: Im Notfall lässt sich die Infrastruktur flexibel und schnell in einer anderen Region hochfahren, um den Geschäftsbetrieb fortzusetzen.

Best Practices für eine wirksame Disaster-Recovery-Strategie

Aus zahlreichen Cloud-Projekten haben sich vier Grundprinzipien herauskristallisiert, die Claranet seinen Kunden empfiehlt:

DR als integraler Bestandteil der Cloud-Architektur: Bereits beim Design der IT-Landschaft sollte Disaster Recovery mitgedacht und geplant werden.
Regelmäßige Backups und Replikation: Daten sollten fortlaufend gesichert und in eine geografisch getrennte Region repliziert werden.
Dokumentierte und getestete Notfallpläne: Klare, dokumentierte Prozesse und regelmäßige DR-Tests stellen sicher, dass im Ernstfall jeder Handgriff sitzt.
Automatisierung und Standardisierung: Der Einsatz von Infrastructure as Code und Automatisierungstools sorgt für konsistente und schnelle Bereitstellung.

Fazit: Disaster Recovery ist Wettbewerbsvorteil, nicht Versicherung

Der vorliegende Use Case zeigt, wie kritisch vorab überlegte und implementierte Disaster-Recovery-Mechanismen für die Resilienz moderner IT-Umgebungen sind. Sie ermöglichen es, auf unerwartete Störungen schnell und strukturiert zu reagieren, Ausfallzeiten zu minimieren und den Geschäftsbetrieb aufrechtzuerhalten: ein entscheidender Wettbewerbsvorteil in einer zunehmend unsicheren Welt.

Unternehmen, die Disaster Recovery als festen Bestandteil ihrer IT-Strategie etablieren, schützen sich nicht nur vor wirtschaftlichen Schäden. Sie sichern auch das Vertrauen ihrer Kunden und Partner. Mit einem erfahrenen Cloud-Partner wie Claranet wird aus dem Notfallplan ein belastbares Sicherheitsnetz, das sich im Ernstfall bewährt.

Ist Ihre IT auf den Ernstfall vorbereitet?

Verlassen Sie sich nicht auf Glück. Lassen Sie sich von unseren Cloud-Experten ein Disaster-Recovery-Konzept entwickeln, das im Ernstfall genau das tut, was es soll: Ihren Geschäftsbetrieb sichern.

Mehr zu Managed Disaster Recovery von Claranet erfahren

Häufige Fragen zu Disaster Recovery (FAQ)

Was ist ein Disaster-Recovery-Konzept? Ein Disaster-Recovery-Konzept ist eine vorab definierte Strategie zur Wiederherstellung der IT-Infrastruktur nach einem Ausfall. Es legt fest, welche Systeme in welcher Reihenfolge mit welchen Mitteln in welcher Zeit wieder verfügbar sein müssen.

Wie schnell kann eine IT-Umgebung nach einem Cloud-Ausfall wiederhergestellt werden? Mit einem vorbereiteten DR-Konzept und automatisierten Failover-Mechanismen sind Wiederherstellungszeiten von wenigen Minuten möglich. Ohne Vorbereitung dauert ein Neuaufbau Tage bis Wochen. Im vorliegenden Claranet Fall wurde eine komplette Umgebung in vier Tagen produktiv neu aufgebaut.

Was bedeuten RTO und RPO? RTO (Recovery Time Objective) ist die maximal tolerierbare Ausfallzeit, RPO (Recovery Point Objective) der maximal akzeptable Datenverlust. Beide Werte sind die Basis jeder DR-Strategie.

Was ist der Unterschied zwischen Pilot Light und Warm Standby? Beim Pilot-Light-Ansatz laufen nur minimale Kernkomponenten in einer Zweitregion. Beim Warm Standby ist bereits eine reduzierte, aber funktionsfähige Kopie der Produktivumgebung aktiv. Warm Standby kostet mehr, ist aber im Ernstfall schneller.

Was leistet Managed Disaster Recovery von Claranet? Claranet plant, implementiert und betreibt das DR-Konzept als Managed Service. Dazu gehören Architekturberatung, Automatisierung mit Infrastructure as Code, regelmäßige Tests und der Betrieb der Failover-Umgebung.