Компания Amazon сообщила, что причиной крупного сбоя в работе Amazon Web Services (AWS), произошедшего на этой неделе, стал сбой в одной из внутренних систем автоматизации. Об этом говорится в официальном отчёте облачного подразделения компании.

По данным AWS, ошибка в автоматизированном процессе управления инфраструктурой привела к непреднамеренному отключению ключевых сетевых компонентов в одном из регионов. Это вызвало каскадный эффект, затронувший множество сервисов и клиентов по всему миру. Среди пострадавших — стриминговые платформы, онлайн-магазины, корпоративные приложения и другие ресурсы, зависящие от инфраструктуры AWS.
Инженеры компании оперативно выявили источник проблемы и вручную восстановили работу систем. Полное восстановление услуг заняло несколько часов. Amazon подчеркнула, что инцидент не был связан с кибератакой или сбоем оборудования, а возник исключительно из-за программного сбоя в автоматизированной системе.
В ответ на произошедшее AWS объявила о пересмотре процедур тестирования и развёртывания автоматизированных решений, чтобы предотвратить повторение подобных ситуаций в будущем.

