Der Größte IT-Ausfall aller Zeiten? Aktuelle Entwicklungen und Auswirkungen auf Datenbanken

Am 19. Juli 2024 wurde die Welt durch ein fehlerhaftes Update von CrowdStrike Zeuge des größten IT-Ausfalls aller Zeiten. Der Vorfall führte weltweit zu massiven Störungen und die Auswirkungen sind noch nicht in vollem Umfang absehbar. Millionen von Windows-Computern waren betroffen, darunter kritische Systeme von Notrufzentralen, Fluggesellschaften und Nachrichtendiensten wie Sky News.

Was ist passiert?

Data Warehouse

Data Warehouse Blueprints: Business Intelligence in der Praxis

Data Warehouse Blueprints: Business Intelligence...

Preis: 42,00 €

Prime

Jetzt auf Amazon kaufen
Datenarchitekturen: Modern Data Warehouse, Data Fabric, Data Lakehouse und Data Mesh richtig einsetzen (Animals)

Datenarchitekturen: Modern Data Warehouse, Data...

Preis: 39,90 €

Prime

Jetzt auf Amazon kaufen
Data-Warehouse-Systeme für Dummies

Data-Warehouse-Systeme für Dummies

Preis: 26,99 €

Prime

Jetzt auf Amazon kaufen
The Data Warehouse Toolkit: The Definitive Guide to Dimensional Modeling, 3rd Edition

The Data Warehouse Toolkit: The...

Preis: 56,71 €

Prime

Jetzt auf Amazon kaufen
Deciphering Data Architectures: Choosing Between a Modern Data Warehouse, Data Fabric, Data Lakehouse, and Data Mesh

Deciphering Data Architectures: Choosing Between...

Preis: 54,99 €

Prime

Jetzt auf Amazon kaufen
Building a Scalable Data Warehouse with Data Vault 2.0

Building a Scalable Data Warehouse...

Preis: 68,53 €

Prime

Jetzt auf Amazon kaufen
Fundamentals of Data Engineering: Plan and Build Robust Data Systems

Fundamentals of Data Engineering: Plan...

Preis: 64,19 €

Prime

Jetzt auf Amazon kaufen
Data Warehouse Technologien (mitp Professional)

Data Warehouse Technologien (mitp Professional)

Preis: 29,99 €

Prime

Jetzt auf Amazon kaufen
Agile Data Warehouse Design: Collaborative Dimensional Modeling, from Whiteboard to Star Schema

Agile Data Warehouse Design: Collaborative...

Preis: 31,01 €

Prime

Jetzt auf Amazon kaufen
Data Modeling with Microsoft Power BI: Self-Service and Enterprise Data Warehouse with Power BI

Data Modeling with Microsoft Power...

Preis: 47,99 €

Prime

Jetzt auf Amazon kaufen

Am 19. Juli 2024 veröffentlichte CrowdStrike ein Update, das einen kritischen Fehler im Treiber csagent.sys enthielt. Dieser Fehler führte zu einem „Blue Screen of Death“ (BSOD) auf betroffenen Systemen, der durch den Stoppcode PAGE_FAULT_IN_NONPAGED_AREA gekennzeichnet war. Infolgedessen wurden die betroffenen Computer in eine Endlosschleife (Bootloop) versetzt und waren unbrauchbar. Die sofortigen Auswirkungen waren weitreichend:

  • Grounding von Flugzeugen: Mehrere Fluggesellschaften mussten Flüge stornieren oder verzögern, da ihre Computersysteme ausfielen. Eurowings strich alle Flüge bis 15 Uhr, und weltweit fielen fast 1400 Flüge aus, darunter 512 in den USA und 92 in Deutschland.
  • Ausfall von Notrufzentralen: In den USA wurden einige 911-Notrufzentralen beeinträchtigt, was die Notfallkommunikation erschwerte.
  • Medienunterbrechungen: Nachrichtendienste wie Sky News waren vorübergehend offline, was die Berichterstattung beeinträchtigte.
  • Bankensysteme: Zahlreiche Bankdienstleistungen wurden unterbrochen, was zu Verzögerungen und Unannehmlichkeiten für Kunden führte.
  • Einzelhandelsstörungen: Viele Kassensysteme in Geschäften fielen aus, was den Verkauf und die Transaktionen behinderte. Der Lebensmittelhändler Tegut musste über 300 Filialen schließen, da die Kassensysteme nicht funktionierten.
  • Weitere Auswirkungen: Kliniken wie das Universitätsklinikum Schleswig-Holstein mussten geplante Operationen absagen, und in vielen Städten wie Bad Homburg und Pforzheim waren Behörden nur eingeschränkt erreichbar.

Auswirkungen auf Datenbanken und Data Warehousing

Dieser IT-Ausfall hat deutlich gemacht, wie entscheidend robuste Datenbanklösungen und BI-Plattformen (Business Intelligence) sind. Hier sind einige der wichtigsten Implikationen:

  1. Datenintegrität und Verfügbarkeit: Bei solch weitreichenden Systemausfällen müssen Datenbanken und Data Warehouses in der Lage sein, Datenverlust und -beschädigung zu verhindern. Fortgeschrittene Backup- und Wiederherstellungslösungen sind unerlässlich, um die Datenverfügbarkeit sicherzustellen.
  2. BI und Datenanalyse: Echtzeitdatenanalysen sind in Krisenzeiten unverzichtbar. Unternehmen müssen in der Lage sein, schnell auf aktuelle Daten zuzugreifen, um die Auswirkungen des Ausfalls zu bewerten und entsprechende Maßnahmen zu ergreifen.
  3. Cloud-Integration und Sicherheit: Der Vorfall unterstreicht die Bedeutung von Sicherheitsstrategien für Cloud-Daten. CrowdStrike’s jüngste Übernahme von Flow Security zielt darauf ab, die Cloud-Datensicherheit durch Data Security Posture Management (DSPM) zu verbessern. Dies soll helfen, Sicherheitslücken zu schließen und den Schutz sensibler Daten zu gewährleisten, sowohl im Ruhezustand als auch in Bewegung​.

Lehren und zukünftige Schritte

Unternehmen sollten kontinuierlich ihre IT-Infrastrukturen auf potenzielle Schwachstellen überprüfen und sicherstellen, dass Sicherheitsupdates gründlich getestet werden, bevor sie in die Produktion gehen. Die aktuellen Ereignisse dienen als Weckruf für die Notwendigkeit robuster, zuverlässiger und sicherer Systeme.

Für Data Warehouses und BI-Plattformen bedeutet dies:

  • Regelmäßige Audits und Penetrationstests: Diese sollten durchgeführt werden, um die Sicherheit und Integrität der Systeme zu gewährleisten.
  • Erweiterte Monitoring- und Analysetools: Diese helfen, Anomalien frühzeitig zu erkennen und schnell zu reagieren.
  • Schulung und Bewusstsein: IT-Teams müssen kontinuierlich geschult werden, um auf dem neuesten Stand der Technik und Sicherheitsprotokolle zu bleiben.

Der größte IT-Ausfall aller Zeiten durch CrowdStrike hat die Anfälligkeit moderner IT-Systeme dramatisch vor Augen geführt und die Bedeutung von robusten Datenbank- und BI-Lösungen unterstrichen. Die vollen Auswirkungen sind noch nicht absehbar, doch es ist klar, dass Unternehmen ihre Datenstrategien überdenken und anpassen müssen, um für zukünftige Ausfälle besser gerüstet zu sein.

Für aktuelle Updates und weitere Informationen besuchen Sie die offizielle Webseite von CrowdStrike.

IT Ausfall Juli 2024

Was ist ein Blue Screen of Death (BSOD)?

Ein Blue Screen of Death (BSOD) ist ein schwerwiegender Fehlerbildschirm, der erscheint, wenn das Windows-Betriebssystem einen kritischen Fehler feststellt, von dem es sich nicht mehr erholen kann. Dieser Bildschirm zeigt an, dass das System angehalten wurde, um weiteren Schaden zu verhindern. BSODs sind in der Regel das Ergebnis von Hardwareproblemen, Treiberkonflikten oder Softwarefehlern.
Der BSOD-Bildschirm enthält häufig einen Fehlercode und eine kurze Beschreibung des Problems. Im Fall des CrowdStrike-Updates wurde der Fehlercode PAGE_FAULT_IN_NONPAGED_AREA angezeigt, der darauf hinweist, dass das System versucht hat, auf eine nicht vorhandene oder nicht erreichbare Speicheradresse zuzugreifen. Dies wird häufig durch fehlerhafte Treiber verursacht, wie in diesem Fall csagent.sys.

BSODs sind gefürchtet, weil sie plötzlich auftreten und oft zu Datenverlust führen können, wenn Dateien oder Anwendungen nicht ordnungsgemäß geschlossen werden. Sie erfordern in der Regel einen Neustart des Systems und eine Fehlersuche, um die zugrundeliegende Ursache zu identifizieren und zu beheben.

Was ist ein Bootloop?

Ein Bootloop ist ein Zustand, in dem ein Computer immer wieder neu startet, ohne dass das Betriebssystem vollständig geladen ist. Dieser Zyklus kann sich endlos fortsetzen, bis die zugrunde liegende Ursache behoben ist. Bootloops treten auf, wenn schwerwiegende Systemfehler oder -konflikte den ordnungsgemäßen Start des Betriebssystems verhindern.
Bootloops können durch verschiedene Faktoren verursacht werden:

  • Fehlerhafte Systemupdates oder Treiber: Wie im Fall des CrowdStrike-Updates können fehlerhafte Treiber oder Updates das System destabilisieren und einen kontinuierlichen Neustartzyklus auslösen.
  • Hardwareprobleme: Defekte Hardwarekomponenten, wie Festplatten oder Arbeitsspeicher, können ebenfalls Bootloops verursachen.
  • Softwarekonflikte: Konflikte zwischen verschiedenen Softwareanwendungen oder Systemdiensten können den Startvorgang blockieren und zu einem Bootloop führen.

Ein Bootloop erfordert oft einen technischen Eingriff wie das Booten im abgesicherten Modus, die Deinstallation fehlerhafter Updates oder Treiber oder im Extremfall eine Neuinstallation des Betriebssystems. Es ist wichtig, regelmäßig Backups durchzuführen, um Datenverluste in solchen Situationen zu vermeiden.

Diese beiden Zustände, BSOD und Bootloop, sind symptomatisch für tiefer liegende Systemprobleme und können zu erheblichen Betriebsunterbrechungen führen, wie der aktuelle CrowdStrike-Vorfall eindrucksvoll zeigt.

Wie hat dir der Artikel gefallen?

Vielen Dank für dein Feedback!
Über Frank 83 Artikel

Ich bin Frank, Data Warehouse und BI-Entwickler mit langjähriger Expertise in diesem Bereich. Ich verfüge über mehr als 20 Jahre Berufserfahrung im DWH Umfeld. Das Analysieren und Interpretieren von Zahlen, Daten und Fakten ist meine große Leidenschaft, aus diesem Grunde ist auch diese Seite hier entstanden.

Hinterlasse jetzt einen Kommentar

Kommentar hinterlassen

E-Mail Adresse wird nicht veröffentlicht.


*