Penjelasan Pemadaman AWS: Bagaimana Kegagalan Pendinginan di Virginia Mengganggu Aplikasi Utama

7

Amazon Web Services (AWS) telah memberikan penjelasan teknis atas gangguan layanan yang meluas yang terjadi pada akhir Mei 2026. Pemadaman tersebut, yang berlangsung dari Kamis hingga Jumat, dipicu oleh “peristiwa termal” di satu pusat data di Virginia Utara, yang menyebabkan hilangnya aliran listrik sepenuhnya.

Insiden ini menyoroti rapuhnya ketergantungan infrastruktur cloud, bahkan untuk sistem yang dirancang dengan redundansi. Ketika komponen fisik inti gagal, efek riaknya dapat langsung melumpuhkan platform utama yang berhubungan dengan konsumen, mulai dari bursa keuangan hingga aplikasi taruhan olahraga.

Kerusakan Teknis

Menurut pembaruan resmi di halaman status AWS, penyebab utama adalah kegagalan sistem pendingin di satu fasilitas tertentu. Peristiwa yang terlalu panas ini memaksa protokol keamanan penting: Amazon harus mengalihkan lalu lintas dari Availability Zone yang terkena dampak pada Kamis sore untuk mencegah kerusakan perangkat keras lebih lanjut.

Proses penyelesaiannya berfokus sepenuhnya pada pemulihan infrastruktur fisik sebelum layanan digital dapat dilanjutkan.

  • Respon Awal: Lalu lintas dialihkan menjauh dari zona yang disusupi.
  • Restorasi: Pada Jumat sore, para insinyur menstabilkan sistem pendingin ke tingkat sebelum kejadian.
  • Pemulihan Layanan: Stabilisasi ini memungkinkan AWS memulihkan sebagian besar instans EC2 (server virtual) dan volume EBS (penyimpanan) yang mengalami gangguan.

“Upaya utama kami selama strategi mitigasi peristiwa adalah mengembalikan kapasitas sistem pendingin kami. Pada tanggal 8 Mei pukul 13.50, kami dapat menstabilkan kapasitas sistem pendingin ke tingkat sebelum peristiwa, yang membantu kami memulihkan sebagian besar instans EC2 dan volume EBS yang mengalami gangguan,” kata Amazon.

Meskipun sebagian besar layanan telah dipulihkan, perusahaan mencatat bahwa sejumlah kecil instance dan volume penyimpanan masih mengalami gangguan seiring upaya pemulihan yang terus berlanjut.

Dampak pada Pengguna dan Bisnis

Pemadaman ini bukan hanya masalah teknis backend; hal ini mempunyai konsekuensi langsung dan nyata bagi pengguna akhir. Beberapa aplikasi terkenal yang dihosting di AWS menjadi offline atau mengalami degradasi yang signifikan, termasuk:

  • FanDuel: Platform taruhan olahraga tidak dapat memproses taruhan.
  • Coinbase: Perdagangan mata uang kripto terganggu, sehingga pengguna tidak bisa melakukan perdagangan.

Bagi pengguna platform ini, downtime menyebabkan frustrasi yang signifikan dan potensi ketidakpastian finansial, terutama selama jam perdagangan aktif atau acara olahraga langsung. Namun, seiring AWS menstabilkan infrastrukturnya, layanan ini secara bertahap kembali beroperasi normal.

Mengapa Ini Penting

Kejadian ini mengingatkan bahwa komputasi awan masih bergantung pada perangkat keras fisik. Meskipun AWS dan penyedia lainnya membangun redundansi ekstensif di beberapa zona dan wilayah, kegagalan besar dalam satu zona—seperti runtuhnya sistem pendingin—masih dapat menyebabkan pemadaman lokal yang signifikan.

Bagi bisnis yang mengandalkan platform ini, kesimpulannya jelas: meskipun AWS tangguh, AWS tidak terkalahkan. Pergeseran lalu lintas yang cepat dan restorasi selanjutnya menunjukkan efektivitas strategi mitigasi AWS, namun gangguan awal ini menggarisbawahi pentingnya arsitektur multi-wilayah untuk aplikasi yang sangat penting.

Singkatnya, kegagalan pendinginan di Virginia Utara menyebabkan pemadaman AWS yang bersifat sementara namun signifikan, sehingga mengganggu aplikasi-aplikasi besar seperti FanDuel dan Coinbase hingga sistem fisik stabil dan layanan dipulihkan.