Жара продолжает доставать провайдеров. «Упали» сети «ВКонтакте» и Yota

Позавчера, 25 июля 2010 года, доступ на один из самых популярных интернет-ресурсов в России – сайт «ВКонтакте» – отсутствовал в течение трёх часов. Пока пользователи строили различные версии причин происходящего, включая арест оборудования, проверки, проводимые правоохранительными органами, и пр., глава пресс-службы «ВКонтакте» Владислав Цыплухин заявил, что причина неполадок – сбой в работе 35-й подстанции «Ленэнерго», обслуживающей серверы не только «ВКонтакте». При этом, пострадала и сеть оператора Yota, которая в тот день отключалась примерно на тот же период времени. По словам г-на Цыплухина, около суток после восстановления дата-центр с серверами «ВКонтакте» работал на дизельных генераторах. Однако вчера вечером пиар-служба социальной сети официально опровергла собственную версию, заявив, что, по результатам экспертизы, «Ленэнерго» оказалась непричастна к случившимся перебоям в питании. Представители компании Yota отказались как-либо комментировать ситуацию.
В прошедшее воскресенье, 25 июля 2010 года, вечером пользователи социальной сети «ВКонтакте» не смогли зайти на сайт vkontakte.ru по причине сбоев в электропитании серверов, содержащих необходимые базы данных. В это же время, по данным некоторых онлайн-источников, полностью была отключена вся петербургская сеть оператора Yota. В своём «Твиттере» (сайт twitter.com, позволяющий пользователям отправлять короткие публичные сообщения длиной до 140 символов) руководитель пресс-службы «ВКонтакте» Владислав Цыплухин опубликовал сообщение, объясняющее проблемы в функционировании сайта сбоем в работе 35-й подстанции «Ленэнерго». В то же время в ЖЖ-коммьюнити Yota появилась информация о том, что служба поддержки компании Yota подтверждает: причина отключения сети оператора в Петербурге – неполадки на 35-й подстанции, которая снабжает электричеством не только дата-центр, вмещающий серверы «ВКонтакте», но и оборудование, отвечающее за работу сети Yota, и колл-центр компании. Последний, по данным того же коммьюнити, тоже на какое-то время был отключён и не функционировал.

В блогах и «Твиттере» появились слухи о том, что в офисах руководства «ВКонтакте» прошёл обыск либо все серверы с данными соцсети были изъяты правоохранительными органами в связи с борьбой с распространением нелегального и запрещённого контента. Эти слухи также были опровергнуты г-ном Цыплухиным.

На следующий день (26 июля 2010 года) пресс-служба «Ленэнерго» опровергла информацию о каких-либо сбоях в работе своих подстанций днём ранее. Владислав Цыплухин объяснил это тем, что такая крупная компания часто узнаёт о сбоях собственного оборудования позже, чем её клиенты. Ближе к вечеру на одном из онлайн-ресурсов была опубликована информация о том, что 35-я подстанция, упомянутая г-ном Цыплухиным, никаким образом не связана с компаниями Yota и «ВКонтакте», находится довольно далеко от города и снабжает электричеством некоторые областные предприятия. Их сотрудники также подтвердили, что никаких проблем с электропитанием в воскресенье они не заметили. Тем не менее аварии на подстанциях «Ленэнерго», связанные со сбоем оборудования из-за сильной и продолжительной жары, этим летом уже происходили. Например, по данным портала IP-News, в середине июля почти на сутки было отключено электричество на некоторых предприятиях Выборгского района, в том числе и в дата-центрах. До устранения неполадок компаниям пришлось поддерживать работоспособность своего оборудования с помощью дизельных генераторов. После аварии «Ленэнерго» ввело режим работы «Анти-жара», подразумевающий дополнительные осмотры оборудования для предотвращения неожиданных поломок. Также в эксплуатацию были введены 15 мобильных дизельных генераторов в Ленобласти и 6 – в Петербурге, а для оперативного устранения возможных нарушений компания задействовала 39 подрядных организаций.

В пресс-службе Yota отказались давать какие-либо комментарии на эту тему. Сам же г-н Цыплухин позже вечером понедельника официально опроверг собственные слова о причастности «Ленэнерго» к сбоям оборудования «ВКонтакте». Как сказано в пояснительном письме, 25 июля в 17:20 вышел из строя основной автомат питающей подстанции, принадлежащий собственнику территории, где размещается дата-центр с ключевыми серверами «ВКонтакте». После проведенной экспертизы сотрудники дата-центра установили, что «Ленэнерго» к этой аварии отношения не имеет. Вероятнее всего, сбой на подстанции был вызван аномальной для Петербурга погодой.

«Из-за аварии произошел скачок напряжения, который вывел из строя электронику устройства АВР (автоматического включения резерва), отвечающего за запуск дизельного генератора и передающего нагрузку на него. После того как UPS (источники беспребойного питания) разрядились, серверы «ВКонтакте» пришлось отключить», – пояснил Владислав Цыплухин. По его словам, через 20 минут после аварии обслуживающему персоналу удалось вручную переключить нагрузку на дизельный генератор, и энергообеспечение было восстановлено. Однако данные быстрой памяти серверов, необходимые для полноценной работы социальной сети «ВКонтакте» и кеширования информации, в результате перезагрузки серверов были утрачены. На их восстановление ушло около трех часов, в течение которых доступ к ресурсу постепенно возвращался к пользователям.

Как отметил глава пресс-службы «ВКонтакте», данный дата-центр, располагающийся на Васильевском острове, проектировался и строился на заре развития «ВКонтакте» и в данный момент не в полной мере соответствует требованиям стандарта Tier-3. Последняя авария в нём произошла полтора года назад, в декабре 2008 года. В результате нынешней аварии пострадали «ВКонтакте», Yota и другие арендаторы дата-центра. Речь идёт о дата-центре компании «Селектел», комментарии представителей которой пока что получить не удалось. «Уже осенью мы планируем перевести ключевые серверы «ВКонтакте» в новый ЦОД, который в полной мере соответствует требованиям Tier-3», – добавил г-н Цыплухин.
  
Ещё одним фактом пользователи «Твиттера» опровергали версию проблем с электроснабжением оборудования «ВКонтакте»: по словам некоторых из них, в момент, когда отсутствовал доступ на сайт, серверы «ВКонтакте» отвечали на «пинговые» запросы (запрос к серверу, ответ на который, как правило, показывает, что работает Интернет и запущен нужный нам сервер). Это может объясняться тем, что некий внешний шлюз «ВКонтакте» уже был запущен, в то время как на основном оборудовании данные ещё только восстанавливались. У сети «ВКонтакте», как у любого высоконагруженного сервиса, применяется многоуровневая организация сети серверов. Обычно в таких случаях «снаружи» находятся немногочисленные серверы (или вообще один мощный сервер), которые занимаются распараллеливанием запросов на «рабочее» оборудование. Обслуживанием самих http-запросов (проще говоря, формированием страницы, которую пользователь увидит в своём браузере) занимаются уже рядовые серверы, которых может быть довольно много (десятки, сотни и даже тысячи), образующие кластер. Вот они-то и пострадали от отключения электричества.

Необычная жара этим летом влияет не только на оборудование, снабжающее компании электричеством, но и на собственное оборудование этих компаний. Так, например, операторам связи приходится различными способами бороться с проблемами, возникающими в связи с высокой температурой. Об этом – см. новость раздела «Провайдеры Петербурга»  от 19 июля 2010 г.

Автор: Лидия Снарская.

Тематики: Фиксированная связь, Интернет, Оборудование

Ключевые слова: ВКонтакте, провайдеры Петербурга, Yota