Fail Over

Inhaltsverzeichnis

Was ist ein Fail Over?

Fail Over, oder auch Failover, steht für die Ausfallsicherung unterschiedlichster Dienste, Anwendungen, Aufgaben und Komponenten. Dabei handelt es sich um einen operativen Backup-Modus im Rahmen eines Disaster-Recovery-Plans (DRP). Ziel dieser Sicherheitsmaßnahme ist die erhöhte Verfügbarkeit oder die Hochverfügbarkeit verschiedenster Systeme und Komponenten. Vor allem unternehmenskritische Systeme und Komponenten bieten sich dafür an. Genauso überbrückt der Prozess unter Berücksichtigung der Gesamtsituation Wartungsfenster und sichert so die Verfügbarkeit relevanter IT-Komponenten.

Was passiert beim Fail Over?

In der Regel sind die Daten eines Unternehmens auf Servern gespeichert. Fallen diese oder damit verbundene Anwendungen aus, ist ein Zugriff nicht mehr möglich. Ein vielen bekanntes Beispiel sind Wartungsarbeiten, während derer alle oder bestimmte Komponenten nicht verfügbar sind. Ist ein Fail Over-Prozess vorhanden, bleibt die Verfügbarkeit aller eingebundenen Systeme und Komponenten erhalten. Denn alle Daten und Aufgaben werden entweder synchron oder asynchron an ein Standby-System, wie beispielsweise einen speziell für diesen Zweck eingerichteten Dedicated Server oder eine Cloud, repliziert.

Kommt es nun zur Störung oder tritt sogar ein Krisenfall ein, wird der Fail Over aktiviert. Dabei schaltet das Primär-System, im Idealfall automatisch ohne Eingriff durch Administratoren, auf das Sekundär-System. Durch diesen Vorgang bleiben weiterhin alle Datenbanken, Anwendungen oder die Aufgaben von Hardware Komponenten uneingeschränkt verfügbar. Um den Failover innerhalb des System-Clusters zuverlässig abzusichern, überwachen sich die beiden Systeme oft gegenseitig via Heartbeat auf ihre zuverlässige Funktionalität.

Zum Failover gehört immer der Failback. Er aktualisiert das primäre System nach dem Krisenfall mit den zwischenzeitlich im sekundären System produzierten Workloads.

einanderzusetzen?

Wann lohnen sich Fail Over-Operationen

Obwohl Failover ein elementarer Bestandteil von Sicherheitsmaßnahmen ist, bedeutet dies nicht, dass der Prozess immer sinnvoll ist. Denn immerhin ist solch ein Sicherheitskonzept mit Kosten verbunden. Welche Kriterien sprechen dann dafür, sich mit diesem Thema detaillierter auseinanderzusetzen?

Dafür sind im ersten Schritt verschiedene Aspekte genauer zu betrachten.

Wie hoch sind die materiellen und immateriellen Schäden für das Unternehmen im Ernstfall eines Systemausfalls.
Wie hoch sind die Kosten, um eines oder mehrere Systeme vor Ausfall zu schützen.
Wie hoch ist die Wahrscheinlichkeit, dass eine Krise eintritt?
Wie sehen die Folgen der Ausfallzeit und deren Dauer aus?

Ein Energieversorger wird für die Steuerung der Energieverteilung mit hoher Wahrscheinlichkeit den Failover-Failback-Prozess implementieren, da die Folgen eines längeren Ausfalls der Energieversorgung katastrophal wären. In der Regel hängt es vor allem von der Wichtigkeit des Geschäftsprozesses ab, ob ein Fail Over erforderlich ist.

Voraussetzungen für einen stabilen Fail Over

Nur der Wille, den Fail Over als elementare Komponente in den Disaster-Recovery-Plan zu integrieren, ist zu wenig. Denn mit der Stabilität der Operation steigt oder fällt der Erfolg der Maßnahme.

Folgende Faktoren beeinflussen die Stabilität:

– Menge der Datenänderungen im primären System.
– Verfügbare Bandbreite zwischen primärem und sekundärem System.
– Vorgehensweise beim Spiegeln der Daten zum sekundären System.

Zahlreiche Technologien unterstützen IT-Verantwortliche dabei, die Synchronisierung des Clusters zu optimieren. Allerdings ist auch die Vorgehensweise des Auslösens eines Fail Overs bedeutend, um so zeitnah wie möglich zu reagieren. Denn die manuelle Aktivierung ist genauso möglich wie die voll automatisierte.

Standort der Backup-Einrichtung

Der Standort der Backup-Einrichtung sollte immer so gewählt sein, dass er vom Auslöser des Ereignisses zuverlässig isoliert ist. Im Idealfall verfügt ein Unternehmen über ein spezielles und lokal getrenntes Remote-Center, das im Krisenfall leicht zugänglich ist. Eine kosteneffiziente Alternative ist die Cloud-Lösung. Allerdings ist hier zu bedenken, dass unter Umständen im Ereignisfall eine große Anzahl von Kunden des Dienstleisters betroffen ist. Dies führt im schlimmsten Fall zu massiven Leistungsabfällen der Sekundär-Systeme bis hin zum Komplettausfall. Für besonders sensible Bereiche sind Dedicated- oder Managed Server an einem geografisch weiter entfernten Standort eine gute Wahl.

Fail Over und Failback als elementare Prozesse des Disaster Recovery Plans

Wird ein Fail Over implementiert, ist zwangsläufig ein Failback erforderlich. Denn beide Komponenten sind im Rahmen des Notfallwiederherstellungs-Plans essenziell. Daher ist es erforderlich, sowohl das primäre wie das sekundäre System entsprechend zu schützen und die Standorte des zweiten Systems unter Berücksichtigung wahrscheinlicher Ereignisse auszuwählen. Nur so ist nach einem erfolgreichen Fail Over ein erfolgreicher Failback gewährleistet.

Sie haben noch Fragen?

Kontaktieren Sie uns