Resilience Engineering
Die vier Stufen resilienter Systeme
Definition
Ursprünglich kommt der Begriff Resilienz aus der Holzwirtschaft, um zu erklären, warum manche Holztypen schwere Ladungen aushalten können, ohne zu brechen und andere nicht[1]. Vorrangig bekannt ist er heutzutage aus der Psychologie: Resilienz (von lateinisch resilire ‚zurückspringen‘ ‚abprallen‘) oder psychische Widerstandsfähigkeit ist die Fähigkeit, Krisen zu bewältigen und sie durch Rückgriff auf persönliche und sozial vermittelte Ressourcen als Anlass für Entwicklungen zu nutzen.
Das Gegenteil von Resilienz ist Verwundbarkeit (Vulnerabilität).
Im technischen Bereich beschreibt Resilienz „die Fähigkeit von technischen Systemen, bei Störungen bzw. Teil-Ausfällen nicht vollständig zu versagen, sondern wesentliche Systemdienstleistungen aufrecht zu erhalten.“[2]
[1] http://erikhollnagel.com/ideas/resilience-engineering.html, abgerufen am 21.06.2019
[2] Wikipedia: Resilienz
Bedeutung im Alltag
Benjamin Scharte und Klaus Thoma stellen in einem Aufsatz im eBook „Resilienz – Ingenieurwissenschaftliche Perspektive“ 2016 folgende These auf: „Komplexe Systeme wie zum Beispiel kritische Infrastrukturen, „resilient“ zu gestalten, ist eine der größten Herausforderungen, denen sich unsere Gesellschaft gegenübersieht.“ Daran hat sich bis heute nicht viel verändert. Denn je mehr wir darauf angewiesen sind, dass komplexe technische Systeme funktionieren, desto wichtiger wird deren Resilienz. „Komplexe technische Systeme“ finden sich heute überall, man denke nur an das „Internet of things“. Immer mehr Dinge, die wir alltäglich benutzen, sind mittlerweile digitalisiert. Von unseren Uhren, über Autos, medizinische Geräte, Flugzeuge, unsere Heizungen, Haushaltsgeräte, und und und. Dies betrifft uns allerdings nicht nur als Einzelpersonen, sondern auch die Gesellschaft im Großen und Ganzen, da auch der Löwenanteil unserer Infrastruktur komplex vernetzt ist. Man denke an den Verkehr, an Kommunikationssysteme, Krankenhäuser, etc.
Bei Resilienz (oder präziser gesagt: beim Potenzial für resiliente Performance) geht es jedoch nicht darum, Fehler und Ausfälle zu vermeiden (dies wäre klassisches Safety Management) – Resilienz ist nicht das Gegenteil von mangelnder Sicherheit – sondern um die Suche nach Wegen und Möglichkeiten, Systeme so zu gestalten, dass sie unter unterschiedlichen Bedingungen und Einflüssen überleben und funktionieren. Es ist unvermeidbar, dass Fehler passieren, sowohl bei Menschen als auch bei Systemen. Wichtig ist, entsprechend damit umzugehen.[1][2]
Mittlerweile hat sich ein eigener Berufszweig herauskristallisiert, der sich mit dieser Thematik befasst: Resilience Engineering (Es wird sogar schon ein Diplom für Resilience Engineering angeboten, siehe https://www.academy.fraunhofer.de/de/weiterbildung/energie-nachhaltigkeit/resilience-engineering.html ).
[1] http://erikhollnagel.com/ideas/resilience-engineering.html abgerufen am 21.06.2019
[2] http://erikhollnagel.com/ideas/resilience%20assessment%20grid.html abgerufen am 21.06.2019
Resilience Engineering
Stefan Hiermaier und Benjamin Scharte beschreiben es im Buch „Ausfallsichere Systeme“ so: Resilience Engineering ist der „Erhalt kritischer Funktionen, das Sicherstellen eines eleganten Abschmelzens – falls die kritische Funktionalität aufgrund der Schwere eines Störereignisses nicht aufrechterhalten werden kann – und die Unterstützung schneller Erholung von komplexen Systemen. Dazu werden generische Fähigkeiten sowie anpassbare und maßgeschneiderte technische Lösungen benötigt, die das System im Fall von kritischen Problemen und unerwarteten oder sogar noch nie dagewesenen Ereignissen schützen.“ Doch wie kann man sich das in der Praxis vorstellen?
Fähigkeiten resilienter Systeme
Beim Resilience Engineering betrachtet man die Funktionsweise der gesamten Organisation, die resilient agieren soll. Hierfür gibt es vier Fähigkeiten, die genauer betrachtet werden, um die Gesamtheit zu verstehen[1]:
- How it responds (wie es antwortet): Das System ist fähig, auf geplante und ungeplante Veränderungen oder Störungen zu reagieren.
- How it monitors (wie es beobachtet): Das System weiß, wonach es sucht und was es beobachtet und reagiert darauf. Das bezieht sich sowohl auf das System selbst als auch auf die Umwelt.
- How it learns (wie es lernt): Das System hat die Fähigkeit, aus Erfahrungen zu lernen und sich weiterzuentwickeln.
- How it anticipates (wie es antizipiert): Das System beobachtet einerseits Entwicklungen der Umwelt und schätzt andererseits die Reaktionen der Umwelt auf Veränderungen an sich selbst ab.
Daraus entstehen vier Typen von Organisationen:
Systeme der ersten Art
Systeme der ersten Art sind in der Lage, auf unerwartete Ereignisse so zu reagieren, dass ihr Fortbestehen gewährleistet ist. Hierbei geht es vor allem um die Fähigkeiten zu antworten und zu beobachten. Durch die Beobachtung erkennt das System, dass eine Handlung notwendig ist. Durch das Antworten ist es möglich, eine Reaktion zu implementieren. Wichtig ist, dass die beiden Fähigkeiten Hand in Hand gehen, da das System sonst nur reaktiv arbeitet, was in der heutigen Zeit meist nicht ausreichend ist.
Systeme der zweiten Art
Systeme der zweiten Art sind gewissermaßen lernfähig. Die Fähigkeit zu Antworten ist elementar – die Fähigkeit, Antworten nach Erfahrungen zu modifizieren, ist enorm hilfreich und macht das System zweiter Art deutlich stabiler als ein System erster Art. Es werden zwei unterschiedliche Typen von Lernen definiert: auf der einen Seite wird die Art des Lernens beschrieben, die absichert, dass das System die passenden Signale, Symbole und Zeichen beobachtet. Auf der anderen Seite geht es darum, die richtigen Reaktionen zum richtigen Zeitpunkt abzusetzen.
Systeme der dritten Art
Systeme der dritten Art agieren proaktiv. Sie scannen ihre Umwelt und passen sich an, bevor eine Störung passiert. Dazu muss das System in der Lage sein, Entwicklungen zu antizipieren oder vorauszusehen. Gleichzeitig bedeutet dies auch, ein gewisses Risiko einzugehen, weil man in die Vorlage geht und bei Nichteintreffen womöglich Ressourcen verschwendet hat. Ist ein System dazu in der Lage, alle vier Fähigkeiten einzusetzen, kann man es als resilient bezeichnen.
Systeme der vierten Art
Darüber hinaus gibt es noch die Systeme vierter Art, die im Bereich Resilience an der Spitze stehen. Diese sind nicht nur in der Lage einzuschätzen, was zwischen System und Umwelt passiert, sondern können auch noch einen Schritt weiter „denken“ und Konsequenzen errechnen, wie die Umwelt auf Änderungen des Systems reagieren wird.[1]
[1] http://erikhollnagel.com/ideas/resilience-engineering.html abgerufen am 21.06.2019
[1] http://erikhollnagel.com/ideas/resilience-engineering.html abgerufen am 21.06.2019
Fazit
Resilience Engineering beschreibt keine bestimmten Proportionen, wie diese vier Fähigkeiten vorhanden sein oder miteinander agieren sollen. Es gibt heute (noch) keinen allgemeingültigen Standard und möglicherweise wird es den auch künftig nicht geben, da die Notwendigkeit der Ausprägungen der Fähigkeiten von System zu System variiert.
Es scheint heute jedoch unerlässlich, komplexe technische Systeme zumindest einer Analyse zu unterziehen und diese vier Fähigkeiten einzuschätzen und in die Planung und Entwicklung miteinzubeziehen, damit sie je nach Umfeld und Notwendigkeit der Ausfallsicherheit weiterentwickelt werden (können).
Üblicherweise wird bei der Planung und Entwicklung die meiste Zeit in die Response-Funktionen investiert, an zweiter Stelle steht häufig die Lernfähigkeit. Beobachtungsgabe und Antizipation kommen oftmals zu kurz. Hier lohnt es sich unter Berücksichtigung der Umwelt allerdings einen genauen Blick drauf zu werfen und sich die Frage zu stellen, ob die Prioritäten nach wie vor richtig gesetzt sind.
Weiterführende Informationen: http://erikhollnagel.com/onewebmedia/RAG%20Outline%20V2.pdf