AWS- und Microsoft 365-Benutzer werden durch zwei separate Ausfälle gestört
Die weltweiten Störungen im Technologiebereich setzten sich am Dienstag mit einer Reihe von Meldungen über Ausfälle fort, die offenbar nicht mit dem Crowdstrike-Vorfall vom 19. Juli zusammenhängen.
Nicht einmal zwei Wochen nach dem weithin bekannten globalen Ausfall, der durch ein Crowdstrike-Update ausgelöst wurde, wird die IT-Welt von weiteren Störungen erschüttert. Sowohl AWS- als auch Microsoft-Nutzer meldeten diese Woche Ausfälle bei verschiedenen Diensten.
Keiner der beiden Ausfälle scheint mit dem Crowdstrike-Vorfall vom 19. Juli in Zusammenhang zu stehen. Dieser bisher weltweit größte IT-Ausfall vor zwei Wochen verursachte Schäden in Höhe von voraussichtlich mehr als 5 Mrd. US-Dollar, wie CRN berichtete.
Die von Microsoft bestätigten weltweiten Probleme von Microsoft 365-Nutzern in dieser Woche sind im Vergleich zur Panne bei Crowdstrike, die 8,5 Mio. Windows-Geräte für einen längeren Zeitraum funktionsunfähig machte, wesentlich geringer. Zeigen aber dennoch die steigende Anhängigkeit der Wirtschaft von Cloud Computing.
Microsoft bestätigt Berichte von Nutzern über Störungen
Am Dienstag um 13.00 Uhr BST bestätigte Microsoft, dass es bei einer Reihe von Diensten und Funktionen unter dem Dach von Microsoft 365 weiterhin "Zugriffsprobleme und Leistungseinbußen" gibt. Der in Redmond/Washington ansässige Anbieter von Cloud- und KI-Tools teilte auf X – früher bekannt als Twitter - mit, dass "wir derzeit Zugriffsprobleme und Leistungseinbußen bei mehreren Microsoft 365-Diensten und -Funktionen untersuchen", heißt es in dem X-Post. "Weitere Informationen finden Sie unter MO842351 im Admin Center. Der Ausfall ereignete sich nur wenige Stunden, bevor Microsoft die Ergebnisse für sein viertes Geschäftsquartal meldet.
[Verwandter CRN-Artikel: IT-Ausfälle wegen gestörter Cloud]
Um 16:51 Uhr deutscher Zeit fügte Microsoft hinzu: "Wir haben Maßnahmen ergriffen und Benutzeranfragen umgeleitet, um Abhilfe zu schaffen. Wir überwachen den Dienst, um die Lösung zu bestätigen. Weitere Informationen finden Sie unter https://status.cloud.microsoft oder unter MO842351 im Admin Center." Als ein CRN-Reporter etwa 10 Minuten nach dem X-Posting versuchte, die Cloud-Status-Website aufzurufen, erhielt er die Fehlermeldung: "Site kann nicht erreicht werden". CRN US hat Microsoft um einen Kommentar gebeten.
Auf einer Microsoft Azure-Status-Website teilte der Anbieter mit, dass "ab ca. 11:45 UTC am 30. Juli 2024 bei einer Untergruppe von Kunden möglicherweise Probleme bei der Verbindung zu Microsoft-Diensten weltweit aufgetreten sind. Wir haben Änderungen an der Netzwerkkonfiguration vorgenommen und Failover zu alternativen Netzwerkpfaden durchgeführt, um Abhilfe zu schaffen", heißt es auf der Statusseite. Die Überwachung der Telemetrie zeigte eine Verbesserung der Dienstverfügbarkeit ab ca. 14:10 UTC. "Wir überwachen die Situation weiter, um eine vollständige Wiederherstellung zu gewährleisten."
Eine Tabelle, in der die Probleme aufgeschlüsselt sind, weist darauf hin, dass Nutzer in allen Regionen Amerikas, des asiatisch-pazifischen Raums, Europas, des Nahen Ostens und Europa einschließlich Afrika (EMEA) mit Problemen der Netzwerkinfrastruktur konfrontiert sein könnten. Nutzer im Subreddit "SysAdmin" berichteten von Ausfällen in Osteuropa, dem Vereinigten Königreich, Kanada und dem Osten der USA.
Einige Nutzer nahmen die Situation mit Humor. "Warum fällt Team's bei mir nie aus? Ein Nachmittag ohne Anrufe oder Nachrichten wäre schön", schrieb ein Nutzer und bezog sich dabei auf die beliebte Kommunikations- und Kollaborationsplattform von Microsoft.
AWS-Ausfälle runden einen Tag voller Probleme ab
Amazon Web Services war der zweite Anbieter, der mit einem signifikanten Ausfall konfrontiert war. Die zu Amazon gehörenden Whole Foods-Supermärkte mussten ihre Selbstbedienungskassen schließen, Lieferfahrer ihre Routen unterbrechen , Alexa-Geräte funktionierten nicht mehr.
Das AWS Service Health Dashboard meldete eine "Verschlechterung" bei mehreren Diensten, der Cloud-Computing-Riese arbeite an der "Behebung der erhöhten Fehlerraten und Latenzen für Kinesis-APIs in der Region US-EAST-1", hieß es. "Wir wollten Ihnen mehr Details über die Ursache des Problems geben. Ab 3:12 PM PDT kam es in einem Subsystem von Kinesis bei der Verarbeitung eingehender Daten zu erhöhten Konflikten. Dies hatte zwar nur begrenzte Auswirkungen auf die meisten Kunden-Workloads, führte jedoch bei einigen internen AWS-Services - einschließlich CloudWatch, ECS Fargate und API Gateway - zu Beeinträchtigungen."
AWS teilte mit, dass seine Ingenieure "die Ursache des Problems, das Kinesis betrifft, identifiziert haben und daran arbeiten, die Beeinträchtigung zu beheben. Wir machen zwar Fortschritte, erwarten aber, dass es 2 bis 3 Stunden dauern wird, bis das Problem vollständig gelöst ist." In einem weiteren Update teilte AWS mit, dass es weiterhin "an der Wiederherstellung arbeitet, obwohl der Fortschritt langsamer ist als ursprünglich erwartet. Wir sehen intern einige Verbesserungen, auch wenn sie extern nicht sichtbar sind."
Downdetector.com, das Ausfälle im Internet verfolgt, listete bis 1 Uhr 348 Berichte über AWS-Ausfälle auf. Zum Zeitpunkt der Erstellung dieses Artikels ist die Zahl der Meldungen auf 42 gesunken, die sich größtenteils auf die USA beschränken.