Hpe випадково видалила 77 тбайт даних з суперкомп’ютера університету кіото

99

Користувачі суперкомп’ютера кіотського університету позбулися 77 тбайт інформації через збій в роботі системи резервного копіювання, який стався з вини японського підрозділу hpe. Через помилку було втрачено дані за 1,5 дня роботи — понад 34 млн файлів. В результаті інциденту постраждали дані 14 груп користувачів, для чотирьох з яких інформація загублена безповоротно.

Збій стався ще два тижні тому, а вчора адміністрація університету опублікувала повідомлення, в якому розкрила деталі події і принесла глибокі вибачення користувачам за незручність і можливу шкоду. Помилка, судячи з усього, сталася через неуважність при оновленні bash-скрипта, що бере участь в процесі резервного копіювання і видаляє журнали старше 10 днів.

Зображення: gizchina.com

Оновлена версія скрипта була записана поверх старого варіанту в той момент, коли він вже виконувався. За словами hpe, яка визнала проблему після її вивчення, значення змінних були втрачені, а нова версія скрипта була завантажена з середини, що і призвело до видалення файлів, а не пов’язаних з ними журналів. При цьому стандартних заходів, які змогли перешкодити такій поведінці (простіше кажучи, зупинка виконання скрипта з повідомленням про помилку), мабуть, прийнято не було.

На поточний момент система резервного копіювання припинена, а відновлення її роботи заплановано на кінець січня 2022 р. Після усунення проблем в по і вжиття заходів щодо запобігання повторення того, що сталося. У майбутньому планується використовувати не тільки резервне копіювання за допомогою дзеркалювання, але і впровадження додаткової, більш досконалої системи інкрементальних бекапів. Фахівці центру працюватимуть над поліпшенням не тільки функціональності, але і керованості системи, щоб мінімізувати ризики.

Новим авторам.