Gangguan di Amazon Web Services pada Senin memengaruhi lebih dari 28 layanan, menonaktifkan aplikasi populer, menunda penerbangan, dan menghentikan operasi bisnis bagi jutaan orang. Gangguan ini, yang berakar pada masalah resolusi DNS di pusat data AS tertua AWS, teratasi pada sore hari tetapi menyoroti kerapuhan internet. Platform pendidikan seperti Canvas juga gagal, memengaruhi mahasiswa perguruan tinggi di seluruh AS.
Gangguan dimulai pada pagi Senin, berasal dari pusat data AS tertua dan terbesar Amazon, yang berfungsi sebagai wilayah default untuk banyak layanan AWS. Para insinyur mengidentifikasi peningkatan tingkat kesalahan dan latensi dalam teknologi basis data cloud, melacak masalah ke kegagalan resolusi Sistem Nama Domain (DNS). Efek domino ini menutup lebih dari dua lusin layanan AWS, termasuk hosting untuk aplikasi seperti Snapchat, Signal, dan Reddit, serta platform e-commerce Amazon sendiri, Alexa, dan Prime Video. Bank dan layanan keuangan offline, penerbangan tertunda, dan game besar seperti Fortnite menjadi tidak dapat diakses, memaksa jutaan bisnis menghentikan operasi, dari login karyawan hingga pemrosesan pembayaran.
Pada puncaknya, Down Detector mencatat lebih dari 8 juta laporan pengguna secara global. Insiden ini menggemakan gangguan AWS sebelumnya pada 2020 dan 2021 di situs yang sama, meskipun Amazon mengklaim bahwa masalah tersebut telah sepenuhnya diatasi. Mehdi Daoudi, CEO perusahaan pemantauan kinerja internet Catchpoint, mengatakan kepada CNN, “Dampak finansial dari gangguan ini dengan mudah akan mencapai ratusan miliar karena kehilangan produktivitas bagi jutaan pekerja yang tidak bisa melakukan pekerjaan mereka, ditambah operasi bisnis yang berhenti atau tertunda—dari maskapai penerbangan hingga pabrik.”
Gangguan meluas ke pendidikan, dengan platform pembelajaran online Canvas—yang digunakan oleh setengah mahasiswa perguruan tinggi AS—mati. Mahasiswa Abby Fagerlin melaporkan tidak bisa login pada pagi Senin untuk mengakses tugas atau menghubungi dosen. Profesor ilmu komputer Universitas Cornell Ken Birman mengatakan kepada Reuters bahwa “pengembang perangkat lunak perlu membangun toleransi kesalahan yang lebih baik,” menambahkan, “Ketika orang memotong biaya dan mengambil jalan pintas untuk mencoba menjalankan aplikasi, lalu lupa bahwa mereka melewatkan langkah terakhir itu dan tidak benar-benar melindungi dari gangguan, perusahaan-perusahaan itu yang benar-benar harus diuji nanti.”
Para ahli menyarankan bahwa peristiwa ini mungkin mendorong pelanggan ke strategi multi-cloud, mendistribusikan beban kerja di berbagai penyedia seperti AWS, Microsoft Azure, dan Google Cloud, terutama di kalangan perusahaan keuangan yang menghindari risiko. Amazon mengonfirmasi penyelesaian gangguan pada sore Senin, tetapi analis memperkirakan miliaran kerusakan, dengan potensi reaksi balik yang mengancam posisi pasarnya sebagai penyedia cloud terbesar di dunia.