30 Jahre, 30 Fragen, #6: Planen wir für den Idealfall – oder für den Ernstfall?
Sonne, Rückenwind, beste Laune – und hinter einem zieht sich derweil ein Gewitter zusammen, von dem man nichts ahnt. Erst wenn es einen einholt, zeigt sich, ob man dafür gerüstet war. Genau das unterscheidet den Idealfall vom Ernstfall: Der eine fühlt sich gut an, solange er anhält. Der andere zeigt, was wirklich trägt.
In technischen Reviews fragen wir manchmal, was passiert, wenn eine Kernkomponente ausfällt. Die häufigste Antwort: „Das ist bisher noch nicht vorgekommen.“ Meist stimmt das sogar. Doch die Frage bleibt unbeantwortet.
Systeme versagen selten im Normalbetrieb. Sie geraten unter Druck bei Lastspitzen, bei unerwarteten Abhängigkeiten oder bei Ausfällen, die einzeln harmlos, zusammen jedoch fatal sind. Wer ein System nur für Idealbedingungen entwirft, hat kein Betriebskonzept geschaffen, sondern nur eine Demo.
Stabilität ist kein Zufallsprodukt
Robuste Systeme sind nicht einfach gute Systeme, die unversehrt geblieben sind. Sie entstehen, weil man sie gezielt auf Störungen vorbereitet – mit klar definiertem Verhalten bei Überlast, mit Fallbacks bei Ausfällen und mit Wiederanlaufprozessen, die bekannt und verantwortet sind. Solche Eigenschaften beruhen auf Entscheidungen, nicht auf Zufall.
Der Unterschied zwischen einem System, das „durchhält“, und einem, das „standhält“, liegt genau hier: Das eine läuft, solange nichts Unvorhergesehenes geschieht. Das andere läuft, weil es das Unvorhergesehene einplant. Im Alltag wirken beide gleich. Im Ernstfall nicht.
Was die Frage aufdeckt
Ob ein System für den Ernstfall taugt, zeigt sich an wenigen klaren Punkten. Bei Lastspitzen oder unerwartetem Wachstum muss ein robustes System kontrolliert reagieren und in einen definierten Zustand wechseln, statt zusammenzubrechen. Fällt eine Komponente aus, darf das Verhalten nicht dem Zufall überlassen sein, sondern muss berechenbar bleiben. Betriebs- und Wiederanlaufpläne müssen dokumentiert und erprobt sein und nicht als persönliches Wissen Einzelner schlummern, das im entscheidenden Moment fehlt. Ebenso wichtig: Die Organisation muss ihre Grenzen kennen – technisch wie organisatorisch. Kapazitätsgrenzen, Eskalationswege, Entscheidungsverantwortung im Ernstfall klären sich nicht von selbst. Sie müssen im Voraus festgelegt sein, denn im Ernstfall bleibt keine Zeit für Diskussionen.
Regulatorische Rahmenwerke wie die NIS2-Richtlinie, branchenspezifisch DORA im Finanzsektor, sowie etablierte Normen wie ISO 27001 oder der BSI IT-Grundschutz fordern nicht nur, dass Systeme laufen. Sie fordern den Nachweis, dass Risiken erkannt, bewertet und behandelt wurden – dass also Betriebskonzepte, Wiederanlaufpläne und Eskalationswege nicht nur existieren, sondern dokumentiert, erprobt und verantwortet sind. Was gute Architektur ohnehin auszeichnet, wird damit zur überprüfbaren Vorgabe.
Der entscheidende Punkt
Der Idealfall taugt als Testumgebung, aber er taugt nicht als Maßstab. Systeme, die für den Ernstfall gebaut sind, bewähren sich auch im Alltag – denn Zuverlässigkeit folgt aus Robustheit, sie ist kein eigenes Ziel. Die zentrale Frage in jedem Projekt lautet daher nicht, ob das System funktioniert. Sie lautet: Wann versagt es, und sind wir darauf vorbereitet?
Über den Autor
Stefan Scholz
CTO/CIO
Mit 30 Jahren Erfahrung im IT-Bereich ist es ein zentrales Anliegen von Stefan Scholz, die IT-Systeme seiner Kunden sicher und erfolgreich zu betreiben und weiterzuentwickeln. Als Geschäftsleiter unserer Technik und Innovation zählt IT-Migration zu seinem täglichen Geschäft.