Сегодня около полуночи по Москве перестал работать почтовый сервис Gmail. А
днем "отказали" мощности "Рамблера".
Rambler.ru и другие ресурсы холдинга (Lenta.ru, Ferra.ru, Price.ru и др.)
стали недоступны около 11 часов по Москве и продолжали "лежать" к моменту
публикации этого материала. В компании нам сообщили лишь, что имеют место
проблемы с доступом к серверам.
Проблемы в "Рамблере" вызвал сбой системы электропитания в дата-центре
компании на ул. Восточной, 10, рассказала пресс-секретарь "Рамблера" Марина
Анисимова. В настоящее время ведутся восстановительные работы и, по ее словам,
некоторые из сайтов уже частично доступны. Полное восстановление работы ресурсов
"Рамблера" ожидается не раньше сегодняшней ночи.
Что касается ночного сбоя Google Gmail, то проблемы продолжались полтора часа
и были связаны с перегрузкой мощностей. По иронии, серьезный сбой был связан с
некоторыми усовершенствованиями, произведенными для лучшего доступа к серверам,
рассказали сотрудники Google в официальном блоге почтового сервиса.
"Утром мы отключили несколько серверов для рутинного обновления. Но проблема
не в них - такое мы делаем регулярно, и веб-интерфейс Gmail отлично
переадресовывает трафик на другие серверы.
Но мы немного недооценили нагрузку, созданную некоторыми недавними
изменениями (причем часть из них была направлена как раз на улучшение доступа к
мощностям) на серверы-маршрутизаторы, обрабатывающие запросы и пересылающие их
на конкретный Gmail-сервер. Где-то за полчаса до "падения" несколько из таких
серверов оказались перегруженными и, как результат, адресовали всей системе
сигнал "остановите трафик, мы не успеваем!". Система перенаправила весь трафик
на несколько оставшихся маршрутизаторов, в считанные минуты вырубив и их.
В итоге пользователи не смогли пользоваться Gmail через веб-интерфейс. Доступ
к почте по IMAP/POP не пострадал, так как в нем не задействованы упомянутые
маршрутизаторы", - объяснили в "Гугле".
В компании несколько раз подчеркнули свое серьезное отношение к
произошедшему. Ряд шагов по профилактике подобных проблем в будущем уже принят:
"Емкость серверов-маршрутизаторов была увеличена так, чтобы превосходить даже
пиковые нагрузки. Есть и более тонкие сложности: например, сделать так, чтобы
маршрутизаторы реагировали на перегрузку не полной остановкой (провоцируя тем
самым перегрузку оставшихся рабочих серверов), а равномерным перераспределением
нагрузки на все имеющиеся мощности. Над этим мы будем работать в ближайшие
недели", - обещают разработчики.