Μια σειρά επιθέσεων με drone σε εγκαταστάσεις κέντρων δεδομένων Amazon Web Services στα Ηνωμένα Αραβικά Εμιράτα και το Μπαχρέιν προκάλεσε μια από τις πιο σοβαρές διακοπές λειτουργίας cloud στην ιστορία της AWS, καταστρέφοντας ή υποβαθμίζοντας περισσότερες από 109 υπηρεσίες σε όλη την περιοχή ME-CENTRAL-1 από την 1η Μαρτίου 2026 και αφήνοντας χιλιάδες εταιρικούς πελάτες να αγωνίζονται για μέρες εργασίας.
Το περιστατικό ξεκίνησε περίπου στις 4:30 π.μ. PST της 1ης Μαρτίου, όταν μία από τις Ζώνες Διαθεσιμότητας του AWS στα ΗΑΕmec1-az2, χτυπήθηκε από αυτό που η εταιρεία αρχικά περιέγραψε ως «αντικείμενα», προκαλώντας «σπινθήρες και φωτιά» μέσα στο κέντρο δεδομένων.
Οι τοπικές πυροσβεστικές δυνάμεις έκλεισαν το ρεύμα στην εγκατάσταση και στις γεννήτριές της ενώ περιορίζουν τη φωτιά. Το AWS αρχικά χαρακτήρισε την εκδήλωση ως «τοπικό ζήτημα ισχύος», ενώ υποβάθμισε δημόσια την αιτία.
Μέχρι τις 2 Μαρτίου στις 4:19 μ.μ. PST, το AWS επιβεβαίωσε την ευρύτερη αλήθεια: δύο εγκαταστάσεις των ΗΑΕ στο ME-CENTRAL-1 είχαν χτυπηθεί άμεσα από επιθέσεις με drone, ενώ μια τρίτη εγκατάσταση στην περιοχή AWS Μέσης Ανατολής (Μπαχρέιν) (ME-SOUTH-1) υπέστη ζημιά όταν ένα drone χτύπησε σε κοντινή απόσταση. Η AWS απέδωσε τα χτυπήματα στη «συνεχιζόμενη σύγκρουση στη Μέση Ανατολή».
Οι επιθέσεις προκάλεσαν δομικές ζημιές, διατάραξαν την παροχή ρεύματος και σε ορισμένες τοποθεσίες ενεργοποίησαν συστήματα καταστολής πυρκαγιάς που προκάλεσαν πρόσθετες ζημιές από το νερό.
Σύμφωνα με ενημερώσεις κατάστασης του Amazonμια δεύτερη ζώνη διαθεσιμότητας, το mec1-az3, έπεσε εκτός σύνδεσης ώρες μετά την αρχική απεργία στο mec1-az2, αφήνοντας μόνο το mec1-az1 μερικώς λειτουργικό. Με δύο από τα τρία AZ να υποβαθμίζονται ταυτόχρονα, ο ενσωματωμένος περιφερειακός πλεονασμός του Amazon S3, που έχει σχεδιαστεί για να ανέχεται την πλήρη απώλεια ενός μόνο AZ, κατακλύστηκε, με αποτέλεσμα υψηλά ποσοστά αποτυχίας τόσο για την πρόσληψη όσο και για την έξοδο δεδομένων.
Επηρεαζόμενες Υπηρεσίες και Διαδοχικές Επιπτώσεις
Το συμβάν επεκτάθηκε γρήγορα σε όλη τη στοίβα υπηρεσιών του AWS. Στην κορύφωση της διακοπής, η διακοπή άγγιξε 109 υπηρεσίες σε όλη την περιοχή ME-CENTRAL-1, 25 διακόπηκαν πλήρως, 34 υποβαθμίστηκαν και 50 επηρεάστηκαν. Οι βασικές θεμελιώδεις υπηρεσίες επωμίστηκαν πρώτα το βάρος:
| Υπηρεσία | Κατάσταση | Σύγκρουση |
|---|---|---|
| Amazon S3 | Διαταραγμένη | Υψηλά ποσοστά αποτυχίας PUT/GET/LIST |
| Amazon DynamoDB | Διαταραγμένη | Αυξημένα ποσοστά σφαλμάτων, αποτυχίες εγγραφής/ανάγνωσης |
| Amazon EC2 | Διαταραγμένη | Το παράδειγμα εκτοξεύεται με στραγγαλισμό σε όλη την περιοχή |
| AWS Λάμδα | Διαταραγμένη | Εξαρτάται από την ανάκτηση S3/DynamoDB |
| Amazon Kinesis | Διαταραγμένη | Αποτυχία βασικής υπηρεσίας |
| Amazon CloudWatch | Διαταραγμένη | Η παρακολούθηση υποβαθμίστηκε |
| Amazon RDS | Διαταραγμένη | Η διαθεσιμότητα της βάσης δεδομένων είναι μειωμένη |
| Κονσόλα διαχείρισης AWS | Διαταραγμένη | Μερική λειτουργική; τα σφάλματα σελίδας συνεχίστηκαν |
Πέρα από την υποδομή cloud, η διακοπή κυμάνθηκε σε εφαρμογές που απευθύνονται στους καταναλωτές σε όλα τα ΗΑΕ. Η πλατφόρμα μεταφοράς και παράδοσης Careem και οι υπηρεσίες πληρωμών Alaan και Hubpay ανέφεραν όλες διακοπές που συνδέονται άμεσα με την αποτυχία της υποδομής AWS, υπογραμμίζοντας πόσο βαθιά βασίζονται οι περιφερειακές οικονομίες σε παρόχους cloud υπερκλίμακας.
Η AWS ακολούθησε παράλληλες διαδρομές ανάκτησης, φυσική αποκατάσταση κατεστραμμένων εγκαταστάσεων παράλληλα με μέτρα μετριασμού που βασίζονται σε λογισμικό που έχουν σχεδιαστεί για την αποκατάσταση μερικής διαθεσιμότητας υπηρεσιών πριν από την πλήρη επισκευή της υποδομής
Για το Amazon S3, η εταιρεία ανέπτυξε ενημερώσεις που επιτρέπουν στην υπηρεσία να λειτουργεί εντός υποβαθμισμένων περιορισμών υποδομής. Για το DynamoDB, οι ομάδες εργάστηκαν για να διορθώσουν πίνακες που είχαν υποστεί βλάβη για να αποκαταστήσουν τη διαθεσιμότητα ανάγνωσης/εγγραφής για μεταγενέστερες υπηρεσίες.
Μέχρι τις 3 Μαρτίου στις 8:14 π.μ. PST, η AWS ανέφερε συνεχή βελτίωση στις λειτουργίες S3 PUT και LIST, με νέα γραμμένα αντικείμενα με δυνατότητα ανάκτησης — αν και οι λειτουργίες GET για προϋπάρχοντα δεδομένα παρέμειναν εξαρτημένες από την αποκατάσταση της φυσικής υποδομής. Οι εκτοξεύσεις του EC2 παρέμειναν στο γκάζι. Τα ποσοστά σφάλματος DynamoDB παρέμειναν υψηλά.
Η AWS εξέδωσε μια ισχυρή συμβουλή για όλους τους κύκλους ενημέρωσης, προτρέποντας τους επηρεαζόμενους πελάτες να θεσπίσουν αμέσως σχέδια αποκατάστασης από καταστροφή, να επαναφέρουν από απομακρυσμένα αντίγραφα ασφαλείας σε άλλες περιοχές και να ανακατευθύνουν την κυκλοφορία εφαρμογών μακριά από το ME-CENTRAL-1. Οι προτεινόμενες εναλλακτικές περιοχές περιλαμβάνουν αναπτύξεις AWS στις Ηνωμένες Πολιτείες, την Ευρώπη και την Ασία-Ειρηνικό με βάση τις απαιτήσεις καθυστέρησης και παραμονής δεδομένων.
Το περιστατικό ανανέωσε τις επείγουσες συζητήσεις της βιομηχανίας σχετικά με την ανθεκτικότητα της υποδομής cloud σε ζώνες συγκρούσεων, τους κινδύνους γεωγραφικής συγκέντρωσης και την ανάγκη για ενεργές ενεργές αρχιτεκτονικές πολλαπλών περιοχών, ιδιαίτερα για επιχειρήσεις που λειτουργούν σε γεωπολιτικά ασταθή περιβάλλοντα.


