В прошедшее воскресенье, 25 июля 2010 года, вечером пользователи социальной сети «ВКонтакте» не смогли зайти на сайт vkontakte.ru по причине сбоев в электропитании серверов, содержащих необходимые базы данных. В это же время, по данным некоторых онлайн-источников, полностью была отключена вся петербургская сеть оператора Yota. В своём «Твиттере» (сайт twitter.com, позволяющий пользователям отправлять короткие публичные сообщения длиной до 140 символов) руководитель пресс-службы «ВКонтакте» Владислав Цыплухин опубликовал сообщение, объясняющее проблемы в функционировании сайта сбоем в работе 35-й подстанции «Ленэнерго». В то же время в ЖЖ-коммьюнити Yota появилась информация о том, что служба поддержки компании Yota подтверждает: причина отключения сети оператора в Петербурге – неполадки на 35-й подстанции, которая снабжает электричеством не только дата-центр, вмещающий серверы «ВКонтакте», но и оборудование, отвечающее за работу сети Yota, и колл-центр компании. Последний, по данным того же коммьюнити, тоже на какое-то время был отключён и не функционировал.
В блогах и «Твиттере» появились слухи о том, что в офисах руководства «ВКонтакте» прошёл обыск либо все серверы с данными соцсети были изъяты правоохранительными органами в связи с борьбой с распространением нелегального и запрещённого контента. Эти слухи также были опровергнуты г-ном Цыплухиным.
На следующий день (26 июля 2010 года) пресс-служба «Ленэнерго» опровергла информацию о каких-либо сбоях в работе своих подстанций днём ранее. Владислав Цыплухин объяснил это тем, что такая крупная компания часто узнаёт о сбоях собственного оборудования позже, чем её клиенты. Ближе к вечеру на одном из онлайн-ресурсов была опубликована информация о том, что 35-я подстанция, упомянутая г-ном Цыплухиным, никаким образом не связана с компаниями Yota и «ВКонтакте», находится довольно далеко от города и снабжает электричеством некоторые областные предприятия. Их сотрудники также подтвердили, что никаких проблем с электропитанием в воскресенье они не заметили. Тем не менее аварии на подстанциях «Ленэнерго», связанные со сбоем оборудования из-за сильной и продолжительной жары, этим летом уже происходили. Например, по данным портала IP-News, в середине июля почти на сутки было отключено электричество на некоторых предприятиях Выборгского района, в том числе и в дата-центрах. До устранения неполадок компаниям пришлось поддерживать работоспособность своего оборудования с помощью дизельных генераторов. После аварии «Ленэнерго» ввело режим работы «Анти-жара», подразумевающий дополнительные осмотры оборудования для предотвращения неожиданных поломок. Также в эксплуатацию были введены 15 мобильных дизельных генераторов в Ленобласти и 6 – в Петербурге, а для оперативного устранения возможных нарушений компания задействовала 39 подрядных организаций.
В пресс-службе Yota отказались давать какие-либо комментарии на эту тему. Сам же г-н Цыплухин позже вечером понедельника официально опроверг собственные слова о причастности «Ленэнерго» к сбоям оборудования «ВКонтакте». Как сказано в пояснительном письме, 25 июля в 17:20 вышел из строя основной автомат питающей подстанции, принадлежащий собственнику территории, где размещается дата-центр с ключевыми серверами «ВКонтакте». После проведенной экспертизы сотрудники дата-центра установили, что «Ленэнерго» к этой аварии отношения не имеет. Вероятнее всего, сбой на подстанции был вызван аномальной для Петербурга погодой.
«Из-за аварии произошел скачок напряжения, который вывел из строя электронику устройства АВР (автоматического включения резерва), отвечающего за запуск дизельного генератора и передающего нагрузку на него. После того как UPS (источники беспребойного питания) разрядились, серверы «ВКонтакте» пришлось отключить», – пояснил Владислав Цыплухин. По его словам, через 20 минут после аварии обслуживающему персоналу удалось вручную переключить нагрузку на дизельный генератор, и энергообеспечение было восстановлено. Однако данные быстрой памяти серверов, необходимые для полноценной работы социальной сети «ВКонтакте» и кеширования информации, в результате перезагрузки серверов были утрачены. На их восстановление ушло около трех часов, в течение которых доступ к ресурсу постепенно возвращался к пользователям.
Как отметил глава пресс-службы «ВКонтакте», данный дата-центр, располагающийся на Васильевском острове, проектировался и строился на заре развития «ВКонтакте» и в данный момент не в полной мере соответствует требованиям стандарта Tier-3. Последняя авария в нём произошла полтора года назад, в декабре 2008 года. В результате нынешней аварии пострадали «ВКонтакте», Yota и другие арендаторы дата-центра. Речь идёт о дата-центре компании «Селектел», комментарии представителей которой пока что получить не удалось. «Уже осенью мы планируем перевести ключевые серверы «ВКонтакте» в новый ЦОД, который в полной мере соответствует требованиям Tier-3», – добавил г-н Цыплухин.
Ещё одним фактом пользователи «Твиттера» опровергали версию проблем с электроснабжением оборудования «ВКонтакте»: по словам некоторых из них, в момент, когда отсутствовал доступ на сайт, серверы «ВКонтакте» отвечали на «пинговые» запросы (запрос к серверу, ответ на который, как правило, показывает, что работает Интернет и запущен нужный нам сервер). Это может объясняться тем, что некий внешний шлюз «ВКонтакте» уже был запущен, в то время как на основном оборудовании данные ещё только восстанавливались. У сети «ВКонтакте», как у любого высоконагруженного сервиса, применяется многоуровневая организация сети серверов. Обычно в таких случаях «снаружи» находятся немногочисленные серверы (или вообще один мощный сервер), которые занимаются распараллеливанием запросов на «рабочее» оборудование. Обслуживанием самих http-запросов (проще говоря, формированием страницы, которую пользователь увидит в своём браузере) занимаются уже рядовые серверы, которых может быть довольно много (десятки, сотни и даже тысячи), образующие кластер. Вот они-то и пострадали от отключения электричества.
Необычная жара этим летом влияет не только на оборудование, снабжающее компании электричеством, но и на собственное оборудование этих компаний. Так, например, операторам связи приходится различными способами бороться с проблемами, возникающими в связи с высокой температурой. Об этом – см. новость раздела
«Провайдеры Петербурга» от 19 июля 2010 г.