Sebabkan "Kiamat Kecil Internet", AWS Minta Maaf dan Ungkap Masalahnya.
AWS meminta maaf dan mengungkap penyebab "Kiamat Kecil Internet" baru-baru ini. Masalah dipicu bug software langka dalam sistem otomatisasi yang menghapus entri DynamoDB.
Jakarta, JClarity – Amazon Web Services (AWS) baru-baru ini menyampaikan permintaan maaf secara terbuka atas gangguan layanan masif yang melumpuhkan sebagian besar infrastruktur internet global. Insiden yang oleh banyak pihak dijuluki sebagai "Kiamat Kecil Internet" tersebut terjadi pada Senin lalu dan berdampak signifikan pada ribuan situs web serta layanan daring di seluruh dunia.
Dalam sebuah pernyataan pascainsiden (post-mortem) yang dirilis oleh unit komputasi awan Amazon tersebut, AWS menjelaskan secara rinci akar masalah yang memicu pemadaman layanan selama berjam-jam. Gangguan berpusat di kawasan Northern Virginia, yang merupakan rumah bagi US-EAST-1, klaster pusat data AWS terbesar. Kawasan ini mengalami pemadaman layanan yang meluas hingga sekitar 14 jam.
Dampak dari insiden ini sangat terasa, dengan layanan-layanan populer seperti Roblox, Fortnite, Venmo, Disney Plus, bahkan sistem perbankan seperti Lloyds Bank, dan berbagai aplikasi seluler penting lainnya mengalami gangguan atau mati total. Kelumpuhan ini mencegah pengguna untuk memesan makanan, mengakses perbankan, hingga menggunakan sistem keamanan rumah pintar.
AWS mengungkapkan bahwa bencana teknis tersebut dipicu oleh kegagalan beruntun (cascading failure) yang berasal dari sebuah bug perangkat lunak langka dalam salah satu sistem paling krusial perusahaan. Menurut penjelasan teknis, masalah bermula dari "otomatisasi yang salah" (faulty automation) di sistem internal mereka. Dua program independen secara bersamaan saling berpacu untuk memperbarui data yang sama, yang pada akhirnya malah menghapus entri jaringan penting untuk layanan basis data DynamoDB.
Penghapusan entri kunci inilah yang memicu efek domino dan melumpuhkan banyak alat AWS lainnya. Analogi yang digunakan para ahli adalah seperti sebuah "buku telepon internet" (DNS entry) yang tiba-tiba menjadi kosong. "Kami meminta maaf atas dampak yang ditimbulkan oleh peristiwa ini kepada pelanggan kami. Kami tahu bahwa peristiwa ini berdampak signifikan pada banyak pelanggan," ujar AWS dalam pernyataannya.
Sebagai langkah perbaikan, AWS menyatakan telah mematikan otomatisasi yang cacat tersebut secara global dan berkomitmen untuk memperbaiki bug tersebut sebelum mengaktifkannya kembali. Perusahaan juga berjanji untuk melakukan segala upaya agar belajar dari peristiwa ini dan menggunakannya untuk "meningkatkan ketersediaan lebih lanjut." Insiden ini sekali lagi memicu perbincangan mengenai konsentrasi kekuatan Big Tech dan risiko ketergantungan internet global pada infrastruktur satu penyedia komputasi awan.