Ett avbrott hos Amazon Web Services på måndagen påverkade över 28 tjänster, vilket slog ut populära appar, försenade flyg och stoppade affärsverksamhet för miljoner. Störningen, som bottnade i ett DNS-upplösningsproblem vid AWS äldsta amerikanska datacenter, löstes på eftermiddagen men belyste internets skörhet. Utbildningsplattformar som Canvas slutade också fungera, vilket påverkade college-studenter över hela USA.
Avbrottet började måndag morgon och uppstod i Amazons äldsta och största amerikanska datacenter, som fungerar som standardregion för många AWS-tjänster. Ingenjörer identifierade ökade felränder och latens i molnbaserad databasteknik och spårade problemet till ett misslyckande i domännamnsystemets (DNS) upplösning. Denna kaskadeffekt stängde ner mer än två dussin AWS-tjänster, inklusive värd för appar som Snapchat, Signal och Reddit, samt Amazons egna e-handelsplattform, Alexa och Prime Video. Banker och finansiella tjänster gick offline, flyg försenades och massiva spel som Fortnite blev otillgängliga, vilket tvingade miljoner företag att stoppa verksamheten, från anställdas inloggning till betalningshantering.
På toppen registrerade Down Detector över 8 miljoner användarrapporter globalt. Händelsen påminde om tidigare AWS-avbrott 2020 och 2021 på samma plats, trots Amazons påståenden om att de problemen hade åtgärdats fullt ut. Mehdi Daoudi, VD för internetprestandaövervakningsföretaget Catchpoint, sade till CNN: “Den finansiella effekten av detta avbrott kommer lätt att nå hundratals miljarder på grund av förlorad produktivitet för miljoner arbetare som inte kan utföra sitt jobb, plus affärsverksamheter som stoppas eller försenas – från flygbolag till fabriker.”
Störningen sträckte sig till utbildning, med online-lärandeplattformen Canvas – som används av hälften av USA:s college-studenter – som gick ner. Studenten Abby Fagerlin rapporterade att hon inte kunde logga in på måndagsmorgonen för att komma åt uppgifter eller kontakta professorer. Ken Birman, professor i datavetenskap vid Cornell University, sade till Reuters att “mjukvaruutvecklare behöver bygga bättre fel tolerans”, och tillade: “När människor skär ner på kostnader och tar genvägar för att få en applikation igång, och sedan glömmer att de hoppade över det sista steget och inte verkligen skyddade mot ett avbrott, är det de företagen som verkligen bör granskas senare.”
Experter föreslår att händelsen kan driva kunder mot multi-cloud-strategier, som fördelar arbetsbelastningar över leverantörer som AWS, Microsoft Azure och Google Cloud, särskilt bland riskaverta finansiella företag. Amazon bekräftade att avbrottet löstes på måndags eftermiddagen, men analytiker uppskattar miljarder i skador, med potentiell backlash som hotar dess marknadsposition som världens största molnleverantör.