Στην εποχή που όλα γίνονται σε επίπεδο cloud και τα πάντα εξαρτώνται από τους servers, μια απλή ενημέρωση λογισμικού οδήγησε σε ένα παγκόσμιο ψηφιακό μπλακ άουτ. Πώς φτάσαμε όμως εκεί και σε τι σημείο βρισκόμαστε;

Σήμερα το πρωί, Παρασκευή 19 Ιουλίου, μια εκτεταμένη τεχνική βλάβη προκάλεσε προβλήματα σε πληροφοριακά συστήματα σε ολόκληρο τον κόσμο, επηρεάζοντας αεροπορικές εταιρείες, εθνικά συστήματα υγεία όπως το NHS, μέσα ενημέρωσης, εταιρείες τηλεπικοινωνιών, τράπεζες και πολλές άλλες επιχειρήσεις.

Η βασική αιτία της διακοπής οφείλεται στην CrowdStrike, μια σημαντική εταιρεία κυβερνοασφάλειας της οποίας το προστατευτικό λογισμικό χρησιμοποιείται ευρέως σε διάφορους κλάδους. Μια πρόσφατη ενημέρωση λογισμικού από την CrowdStrike οδήγησε σε κρασάρισμα μηχανημάτων που χρησιμοποιούν ως λειτουργικό σύστημα (OS) τα Microsoft Windows.

Οι πρώτες αναφορές για το πρόβλημα, που περιγράφηκε ως «παγκόσμιο μπλακ άουτ», προέκυψαν όταν οι χρήστες των υπολογιστικών συστημάτων που επηρεάστηκαν ήρθαν αντιμέτωποι με τη λεγόμενη «μπλε οθόνη» (blue screen of death) των Windows. Οι συγκεκριμένοι υπολογιστές έτρεχαν κυρίως το λογισμικό Falcon Sensor της CrowdStrike, το οποίο παρουσίασε δυσλειτουργία μετά το τελευταίο του update.

Καθυστερήσεις και ακυρώσεις πτήσεων σημειώθηκαν σε όλη την Ευρώπη και την Ασία την λόγω του παγκόσμιο μπλακ άουτ. Σύμφωνα με την FlightAware, ιστοσελίδα παρακολούθησης πτήσεων, περίπου το 1/4 των πτήσεων που θα αναχωρούσαν από το αεροδρόμιο Σίπχολ του Άμστερνταμ συνάντησαν καθυστερήσεις. Όπως σημειώνουν οι New York Times, παρόμοια προβλήματα αναφέρθηκαν στη Ζυρίχη, το Παρίσι και το Βερολίνο, με εκατοντάδες πτήσεις να καθυστερούν ή να ακυρώνονται. Στο αεροδρόμιο του Βρανδεμβούργου, στο Βερολίνο, ακυρώθηκε περίπου το 15% των πτήσεων. Στην Αγγλία, το αεροδρόμιο του Μάντσεστερ αντιμετώπισε επίσης σημαντικά προβλήματα, με μεγάλες ουρές στις αίθουσες αναχωρήσεων και μόνο λίγους υπολογιστές check-in να λειτουργούν.

Ωστόσο, οι επιπτώσεις της διακοπής υπηρεσιών δεν αφορούσαν μόνο την Ευρώπη αλλά επηρέασε τα συστήματα σε παγκόσμιο επίπεδο. Στο Διεθνές Αεροδρόμιο Narita στην Ιαπωνία, οι επιβάτες εξέφρασαν την απογοήτευσή τους όταν έλαβαν αυτόματες ειδοποιήσεις επιβίβασης από την United Airlines για πτήσεις που στην πραγματικότητα είχαν καθυστέρηση. Στη Νότια Κορέα, η Jeju Air ανέφερε στον ιστότοπό της ότι επηρεάστηκαν διάφορες υπηρεσίες, συμπεριλαμβανομένων των κρατήσεων.

Στην Ελλάδα, όπως καταγράψαμε νωρίτερα στο enikos.gr, οι ταξιδιώτες στον Διεθνή Αερολιμένα Αθηνών «Ελευθέριος Βενιζέλος» αντιμετώπισαν ακυρώσεις πτήσεων και καθυστερήσεις στο check-in λόγω. Πηγές του αεροδρομίου ανέφεραν ότι οι παρατηρούμενες ακυρώσεις ήταν εντός των φυσιολογικών επιπέδων. Παρόμοια προβλήματα παρατηρήθηκαν και στο αεροδρόμιο Ηρακλείου, όπου αρκετές πτήσεις καθηλώθηκαν στον αεροδιάδρομο παρά την προσγείωσή τους, καθώς ήταν ενταγμένες στο προβληματικό σύστημα.

Το Αθηναϊκό Πρακτορείο Ειδήσεων αναφέρει πως από τις 110.000 προγραμματισμένες εμπορικές πτήσεις σήμερα, οι 1.390 έχουν ακυρωθεί παγκοσμίως και περισσότερες αναμενόταν να ακυρωθούν, σύμφωνα με στοιχεία της παγκόσμιας εταιρείας ανάλυσης αερομεταφορών Cirium. Ακόμη και οι αεροπορικές εταιρείες που δεν επηρεάστηκαν άμεσα δήλωσαν ότι θα έπρεπε να αντιμετωπίσουν καθυστερήσεις λόγω της παγκόσμιας φύσης της διακοπής.

Η Microsoft αναγνώρισε το παγκόσμιο μπλακ άουτ, αποδίδοντάς την σε πρόβλημα με τις υπηρεσίες cloud που παρέχει. Η εταιρεία δήλωσε ότι διερευνά το ζήτημα που επηρεάζει τη δυνατότητα πρόσβασης των χρηστών σε διάφορες εφαρμογές και υπηρεσίες της σουίτας Microsoft 365. Το αρμόδιο τμήμα της εταιρείας εντόπισε τελικά τη βασική αιτία τους προβλήματος και κατάφερε να αποκαταστήσει τις περισσότερες υπηρεσίες, αν και κάποια συστήματα ενδέχεται να εξακολουθούν να αντιμετωπίζουν προβλήματα, καθώς ορισμένες υπηρεσίες επηρεάζονται ακόμη.

Η Microsoft εντόπισε μια «αλλαγή στο configuration» σε ορισμένες από τις backend διεργασίες του Azure ως τη βασική αιτία της παγκόσμιας διακοπής. Αυτή η αλλαγή διέκοψε τη συνδεσιμότητα μεταξύ αποθηκευτικών (storage) και υπολογιστικών (compute) πόρων, οδηγώντας στη δυσλειτουργία του Microsoft 365 (Outlook, Teams κ.α.). Η εταιρεία μοιράστηκε τα ευρήματά της στη σελίδα Service Health Status, σημειώνοντας, σύμφωνα με την Wall Street Journal, ότι το πρόβλημα άρχισε να επηρεάζει τα συστήματα γύρω στις 10 μ.μ. ώρα Ελλάδας την Πέμπτη, λίγο πριν αναφερθούν τα εκτεταμένα προβλήματα σε όλο τον κόσμο.

We’re aware of an issue with Windows 365 Cloud PCs caused by a recent update to CrowdStrike Falcon Sensor software. This is being communicated under WP821561 in the admin center. (Cont…)



Η Microsoft εργάζεται επιμελώς για τον μετριασμό των επιπτώσεων της βλάβης και την αποκατάσταση των προβλημάτων, παρακολουθώντας στενά τα δεδομένα που διαθέτει για να διασφαλίσει την άμεση διαθεσιμότητα των υπηρεσιών της.

Η CrowdStrike παραδέχτηκε ότι ένα ελάττωμα σε μια πρόσφατη ενημέρωση (update) του λογισμικού Falcon Sensor προκάλεσε την παγκόσμια διακοπή λειτουργίας των IT συστημάτων. Ο διευθύνων σύμβουλος της εταιρείας, George Kurtz, δήλωσε ότι το πρόβλημα προήλθε από μια «ενιαία ενημέρωση περιεχομένου» για τους υπολογιστές που χρησιμοποιούν Windows, η οποία προκάλεσε εκτεταμένες καταρρεύσεις στα συνδεδεμένα πληροφοριακά συστήματα και σφάλματα μπλε οθόνης.

Η εταιρεία εντόπισε το πρόβλημα και ανακάλεσε το update, αν και πολλά επηρεαζόμενα συστήματα παραμένουν μη λειτουργικά. Η CrowdStrike συνέστησε στους χρήστες να διαγράψουν την προβληματική ενημέρωση του λογισμικού (έκδοση 7.15 και 7.16) καθώς το νέο update «φαίνεται να είναι εντάξει», διευκρινίζοντας ότι το περιστατικό ήταν μια τεχνική αποτυχία και όχι παραβίαση ασφάλειας ή κυβερνοεπίθεση.

Η εταιρεία σημείωσε ότι οι υπολογιστές Mac και Linux δεν επηρεάστηκαν, ενώ οι προσπάθειες επικεντρώνονται στην αποκατάσταση λειτουργιών για τους χρήστες των Windows.

Ο George Kurtz, CEO της CrowdStrike, δήλωσε ότι η εταιρεία ανέλαβε την ευθύνη για το σφάλμα λογισμικού που προκάλεσε τη διακοπή λειτουργίας. Σημείωσε επίσης ότι έχουν αποσταλεί οδηγίες αποκατάστασης, αλλά προειδοποίησε ότι μπορεί να χρειαστεί αρκετός χρόνος για να εφαρμοστούν. «Λυπούμαστε βαθύτατα για το πρόβλημα που προκαλέσαμε», δήλωσε πριν λίγο ο Kurtz στο NBC.

EXCLUSIVE: CrowdStrike founder and CEO @George_Kurtz speaks on TODAY about the major computer outages worldwide that started earlier today: “We’re deeply sorry for the impact that we’ve caused to customers, to travelers, to anyone affected by this.” pic.twitter.com/fWz6KhgrcZ

— TODAY (@TODAYshow) July 19, 2024