Компании Dropbox пришлось объяснять причины, почему сервис был недоступен для многих пользователей в течение двух суток.

Проблемы начались 10 января, когда Dropbox ушел на запланированное техобслуживание. По всем правилам, это было сделано в пятницу вечером в 17:30 PM PT. После этого часа трафик резко снижается у всех сайтов. Во время техобслуживания произвели апгрейд операционной системы на некоторых серверах Dropbox. С этой целью запустили скрипт, который в том числе проверяет отсутствие активных процессов на сервере перед установкой обновления. Именно в этот скрипт закралась досадная ошибка, из-за которой апгрейд начался на некоторых серверах с активными процессами. К сожалению были затронуты одновременно и основные, и резервные копии серверов, что и привело к тому, что сайт ушел в офлайн.

Пришлось восстанавливать информацию из резервных копий. Через три часа сервис возобновил работу, но не для всех. В течение субботы и воскресенья у многочисленных пользователей наблюдались проблемы с доступом, а компания усиленно работала над устранением ошибок, продолжая восстановление из бэкапов.

Полное восстановление работы Dropbox произошло 12 января в 16:40 PM PT.

На серверах Dropbox хранятся тысячи баз данных. Каждая из них требует наличия одного основного и двух дополнительных серверов для надежности. Кроме того, Dropbox делает полные резервные копии и инкрементальные бэкапы, которые хранятся в отдельном окружении. Компания подчеркивает, что пользовательские данные ни в коей мере не были затронуты в результате сбоя.

Подобные истории показывают, насколько ненадежным может быть облачное хранение данных в том случае, если удаленный сервис контролирует сторонняя компания. В этом смысле эффективнее применять распределенные хранилища данных и/или BitTorrent-протокол для синхронизации файлов между несколькими устройствами, которые находятся под собственным контролем (BitTorrent Sync).



Оставить мнение