"Sebabkan 'Kiamat Kecil Internet', AWS Minta Maaf dan Ungkap Masalahnya."
AWS meminta maaf setelah gangguan di region US-East-1 pada 20 Okt 2025 melumpuhkan Snapchat, Canva, Reddit. Penyebabnya: kegagalan DNS akibat DynamoDB.
JAKARTA, JClarity – Amazon Web Services (AWS), tulang punggung infrastruktur digital global, secara resmi menyampaikan permohonan maaf atas gangguan besar yang terjadi pada 20 Oktober 2025, yang sempat melumpuhkan berbagai layanan daring utama di dunia. Insiden ini, yang oleh sebagian kalangan dijuluki sebagai 'Kiamat Kecil Internet', mengungkap kerentanan besar dalam sentralisasi layanan komputasi awan.
Gangguan layanan ini berpusat di region US-East-1 AWS yang berlokasi di Virginia Utara, AS. Region ini merupakan salah satu pusat data kritis yang menjadi gerbang utama bagi banyak lalu lintas internet global, sehingga kegagalannya menimbulkan efek domino yang meluas. Layanan populer seperti Snapchat, Canva, Reddit, Roblox, Amazon Prime Video, hingga sistem penting di sektor keuangan dan kesehatan dilaporkan mengalami disrupsi serius, membuat jutaan pengguna di seluruh dunia tidak dapat mengakses aplikasi dan situs web untuk beberapa jam.
Setelah insiden tersebut diatasi, AWS merilis pernyataan teknis yang menjelaskan akar masalahnya. Penyebab utama gangguan masif ini diidentifikasi sebagai kegagalan resolusi DNS (Domain Name System) yang dipicu oleh tingginya tingkat kesalahan (error rates) pada DynamoDB, layanan basis data penting milik AWS. Kegagalan awal di DynamoDB ini kemudian menjalar ke layanan inti lainnya, termasuk Elastic Compute Cloud (EC2) dan Simple Storage Service (S3), yang merupakan fondasi komputasi dan penyimpanan data bagi ribuan aplikasi pelanggan.
Dalam keterangan resminya, perusahaan menyampaikan bahwa insinyur mereka segera terlibat untuk mengatasi masalah tersebut. Meskipun upaya mitigasi awal sempat gagal, pemulihan parsial menunjukkan 'tanda-tanda signifikan perbaikan' dalam beberapa jam. Walaupun isu utama telah terselesaikan, AWS mengakui bahwa pemulihan penuh di seluruh sistem yang terdampak membutuhkan waktu lebih lama karena adanya penundaan propagasi (perambatan sistem).
Insiden ini kembali memicu diskusi global mengenai risiko dan kelemahan infrastruktur awan yang terlalu tersentralisasi. Meskipun AWS dikenal dengan dominasi dan keandalannya (dengan pangsa pasar global sekitar 37% pada 2024), kegagalan di satu region kritis dapat menyebabkan kaskade global, seperti yang terjadi pada insiden serupa di tahun-tahun sebelumnya. AWS memastikan mereka akan mengambil langkah-langkah tambahan untuk meningkatkan ketahanan dan waktu pemulihan sistem mereka di masa depan.