Сравнение ПО для репликации и организации катастрофоустойчивой виртуальной инфраструктуры

Виртуализация стала неотъемлемой частью современной ИТ-инфраструктуры. Помимо очевидных преимуществ, вроде снижения затрат на эксплуатацию, консолидации сервисов, удобства управления и возможности переноса виртуальных машин между физическими серверами, виртуализация позволяет повысить доступность ИТ-сервисов.

В последнее время все больше заказчиков проявляют заинтересованность в развертывании тех или иных решений, позволяющих обеспечить защиту от катастроф. И это вовсе не пустая блажь, и не веяние моды: с годами растут объемы данных, повышаются требования по доступности сервисов. 

Обзор подготовил ведущий технический эксперт Департамента инфраструктурных решений и сервисов ООО «Гелиос ИТ» (http://www.hbc.ru/) Коновалов Андрей.

 



Введение

Большинство сервисов не имеют встроенных средств катастрофоустойчивости, а для остальных сервисов настройка сопряжена с дополнительными затратами на оборудование и программное обеспечение. Кроме того, защита для каждого из сервисов обеспечивается разными механизмами, требующими различных настроек, поддержки и обслуживания. Виртуализация позволяет обеспечить единый подход к защите сервисов и централизованное управление процедурой восстановления.

Общая схема решения выглядит следующим образом: все сервисы работают внутри виртуальных машин (ВМ) на первой (основной) площадке. Дополнительная площадка, с установленным на ней оборудованием, исполняет роль холодного резерва.

В реальном времени или по расписанию выполняется копирование данных виртуальных машин с основной площадки на резервную. В случае отказа администратор инициирует процедуру восстановления сервисов, используя копии ВМ на резервной площадке.
Конфигурация сетевого оборудования, серверов и системы хранения данных на основной и резервной площадках не обязательно должны быть идентичными, однако важно, чтобы ресурсов, предоставляемых резервной площадкой, было достаточно для запуска и работы защищаемых сервисов.

При планировании катастрофоустойчивой инфраструктуры следует руководствоваться следующими критериями:
• RTO (RecoveryTimeObjective) – это время, которое требуется на восстановление работоспособности системы после сбоя;
• RPO (RecoveryPointObjective) – это интервал между операциями копирования данных с основного хранилища на резервное;
• TCO (TotalCostofOwnership) – совокупная стоимость владения решением, включающая затраты на оборудование и ПО, а также затраты на внедрение и поддержку.

Дальнейший обзор будет проводиться с учетом данных критериев. Для сравнения были выбраны следующие коммерческие решения:
• Microsoft Hyper-V Replica,
• VMware vCenter Site Recovery Manager,
• VMware vSphere Replication,
• Veeam Backup & Replication.

Для облегчения сравнения в таблице 1 (см. внизу текста) приведены основные критерии и функциональные возможности по всем четырем решениям.

Краткое описание и лицензирование

Hyper-V Replica представляет собой встроенный механизм репликации ВМ, предоставляемый гипервизором Hyper-V 3.0, который может быть установлен в качестве одной из ролей сервера Microsoft Windows Server 2012 либо в виде отдельного продукта MicrosoftHyper-VServer 2012. В обоих случаях Hyper-VReplica не требует покупки дополнительных лицензий.

Hyper-VReplica крайне прост в установке и настройке и не предъявляет к системе виртуализации Hyper-V каких-либо специфических требований.
VMware vCenterSiteRecoveryManager предназначен для организации катастрофоустойчивой виртуальной инфраструктуры для средних и крупных организаций. Основное назначение Site Recovery Manager – автоматизация процедуры переключения виртуальной инфраструктуры на резервный сайт, а также проведение тестирования планов восстановления.

Site Recovery Manager можно приобрести в составе набора VMwarevCloudSuiteEnterprise (лицензируется по процессорам сервера виртуализации) или отдельно (лицензируется по количеству защищаемых ВМ).

Site Recovery Manager доступен в двух редакциях: Standard и Enterprise. Различие двух редакций заключается в поддержке максимального количества защищаемых ВМ. Для версии Standard количество защищаемых ВМ не должно превышать 75, для Enterprise – до 1000.

VMwarevSphereReplication изначально являлся частью MwarevCenterSiteRecoveryManager и требовал покупки соответствующих лицензий, однако, начиная с версии 5.1, vSphereReplication входит во все редакции vSphere, за исключением vSphereEssentials.
VeeamBackup&Replication (VBR) представляет собой комплексное решение по резервному копированию и репликации ВМ, работающих как на гипервизоре VMwareESXi, так и на MicrosoftHyper-V.

ПО VBR лицензируется по числу физических процессоров (сокетов) хост-серверов виртуализации и доступен в двух версиях: Standard и Enterprise. Для организации катастрофоустойчивого решения разницы между редакциями нет.

Репликация

Репликация – процедура копирования данных с одного хранилища данных (исходного) на другое (целевое) по заданному расписанию. Репликация копирует только измененные блоки данных (размер блока может варьироваться у различных систем хранения и ПО репликации) и позволяет избежать необходимости каждый раз копировать измененные файлы ВМ целиком.

Условно можно разделить репликацию на два типа: синхронную и асинхронную.
Синхронная репликация выполняется в реальном времени. Подтверждение о записи отправляется клиенту только после получения подтверждения от целевого хранилища. Из-за возможных задержек при передаче данных, синхронная репликация имеет ограничение на максимальное расстояние между ЦОД. Многие вендоры поддерживают синхронную репликацию на расстояния не более 100 км. Обеспечивает минимальные значения RPO.
Асинхронная репликация выполняется по расписанию, через заданные промежутки времени. За счет использования сжатия - менее критична к задержкам, зачастую требует меньшей полосы пропускания, чем синхронная репликация. Многие производители поддерживают асинхронную репликацию на расстояния более 100 км. Обеспечивает RPO от нескольких минут до нескольких часов.

Hyper-VReplica, vSphereReplication и VeeamBackup&Replication выполняют репликацию собственными средствами и обеспечивают только асинхронную репликацию данных.

Для Hyper-VReplica интервал репликации составляет примерно 5 минут и не настраивается. Репликация осуществляется по Ethernet-сети самим гипервизором. ВМ и ее реплика не могут быть размещены в пределах одного хоста или одного кластера, в качестве цели для размещения реплики ВМ может быть указан сторонний хост или кластер из нескольких хостов Hyper-V.

Минимальный интервал репликации vSphereReplication составляет15 минут. Репликация данных осуществляется по Ethernet-сети между исходным сервером ESXi и специализированной ВМ vSphereReplicationAppliance, расположенной в резервном сайте. vSphereReplication позволяет размещать ВМ и ее реплику на серверах виртуализации, управляемых одним экземпляром VMwarevCenterServer (кроме случаев, когда vSphereReplication используется совместно с SiteRecoveryManager).

VeeamBackup&Replication позволяет запускать репликацию в режиме ContinuousProtection, при котором следующее задание на репликацию запускается сразу же после завершения предыдущего, что в зависимости от объема реплицируемых данных позволяет добиться RPO порядка 3-5 минут. Репликация данных выполняется сервером VeeamBackup&Replication и может осуществляться как по Ethernet-сети, так и по SAN-сети. VeeamBackup&Replication позволяет размещать реплику ВМ на любом хосте и любом хранилище, доступном в сети.

Для VMwareSiteRecoveryManager может использоваться репликация средствами VMwarevSphereReplication либо системы хранения данных. В случае использования репликации средствами системы хранения, помимо лицензий на SRM, может потребоваться приобрести дополнительные лицензии на репликацию от производителя СХД.

Для работы SiteRecoveryManager требуется, чтобы исходная ВМ и ее реплика размещались на серверах виртуализации, управляемых разными экземплярами VMwarevCenterServer.

Важным преимуществом программной репликации является возможность репликации отдельных ВМ, а также репликации ВМ, расположенных на локальных дисках серверов виртуализации, тогда как в случае с репликацией СХД реплицируется целиком весь том СХД со всеми ВМ, расположенными на нем.

В дополнение к этому, администратор может выполнить предварительное копирование (seeding), заранее перенеся копию защищаемой ВМ на резервный сайт, используя физический носитель, с целью экономии полосы пропускания между сайтами и ускорения процедуры начальной репликации.
Репликация средствами СХД может быть как асинхронной, так и синхронной, в зависимости от модели СХД и купленных лицензий. SiteRecoveryManager поддерживает большое количество СХД. Полный список можно найти на сайте (http://www.vmware.com/resources/compatibility/search.php?deviceCategory=sra).

Репликация, выполняемая на уровне СХД, использует отдельные интерфейсы системы хранения и не нагружает серверы виртуализации. Кроме того, репликация средствами СХД также поддерживает диски, подключаемые непосредственно в ВМ (т.н. RawDeviceMapping или Pass-through Disks), чего не позволяют сделать средства программной репликации.

Консистентные реплики

В случае асинхронной репликации источник передает измененные данные через заданные промежутки времени. В этом случае нет возможности гарантировать целостность данных в реплике, так как многие приложения, работающие внутри ВМ, такие как MicrosoftSQLServer или MicrosoftExchange, могут в этот момент иметь незавершенные транзакции записи в базы данных.

При репликации Hyper-V Replica использует механизм мгновенных VSS-снимков (снапшотов) для создания консистентных реплик. Минимальный интервал создания снимков – 1 час.

VMware SRM с vSphere Replication обеспечивает консистентные реплики на уровне файлов и приложений внутри ВМ, также используя механизм VSS-снимков и собственную технологию ChangeBlockTracking.

VeeamBackup&Replication обеспечивает консистентные реплики на уровне файлов и данных приложений, также используя VSS-снимки.
Для репликации средствами СХД консистентные реплики могут быть получены при использовании средств СХД, например, EMCSnapView, NetApp SnapManager и другие.

Тестирование

Средства тестирования позволяют запускать реплицированные ВМ из резервного сайта в изолированной от производственной инфраструктуры среде с целью проверки работоспособности механизмов репликации и корректности плана восстановления.
Hyper-V Replica позволяет создавать и запускать тестовую ВМ из копии реплицированной ВМ. По умолчанию такая ВМ запускается без подключения к виртуальной сети, чтобы исключить конфликт с исходной работающей ВМ.

SiteRecovery позволяет тестировать план восстановления путем запуска реплицированных ВМ в изолированной виртуальной сети без влияния на производственную инфраструктуру. В случае использование SRM вместе с СХД, поддерживающей клонирование томов, тестирование может выполняться без остановки репликации.
VeeamBackup&Replication также позволяет провести тестовый запуск реплицированной ВМ.

Автоматизация восстановления

Для реплицированной ВМ Hyper-V Replica позволяет задавать настройки сетевого адаптера, отличные от настроек исходной ВМ. Администратор должен запускать каждую реплицированную ВМ отдельно. Автоматизация запуска может выполняться с помощью сценариев PowerShell.

vSphereReplication не позволяет изменить сетевую конфигурацию (IP-адреса защищаемых ВМ, виртуальные коммутаторы) для реплицированной ВМ. При необходимости администратор самостоятельно должен внести изменения в сетевые настройки после включения реплицированной ВМ.

VMware SRM предоставляет широкие возможности по автоматизации плана восстановления ВМ, включая создание нескольких автоматизированных планов восстановления, назначение приоритета и последовательности запуска ВМ, настройка времени ожидания между запуском ВМ, изменение сетевой конфигурации для восстанавливаемых ВМ, запуск скриптов и сценариев внутри восстанавливаемых ВМ.
Veeam Backup & Replication может изменить сетевые настройки ВМ при восстановлении. Автоматизация запуска может выполняться с помощью средств PowerShell.

Плановое (Switchover) и внеплановое (Failover) переключение

В случае запланированного переключения, когда требуется провести какие-либо работы в основном сайте (например: отключить питание, перекоммутировать или перенести оборудование и т.п.), администратор заранее запускает процесс переноса ВМ в резервный сайт. Для этого требуется выключить все защищаемые виртуальные машины в основном сайте, запустить репликацию на СХД и проверить, что она успешно выполнилась, после чего запустить реплики ВМ в резервном сайте. Тем самым все ВМ переносятся в резервный сайт, и гарантируется целостность данных внутри ВМ, пускай и ценой некоторого кратковременного простоя.

В случае незапланированного переключения (например, при пожаре, отключении электроэнергии), когда основной сайт недоступен, администратор запускает ВМ, используя последнюю актуальную реплику данных в резервном сайте. В этом случае не может гарантироваться целостность данных, если не использовались специализированные механизмы (VSS-снимки).

Для Hyper-V Replica требуется запускать перенос для каждой ВМ в отдельности. Существует возможность автоматизации переноса с помощью powershell скриптов.

Для vSphereReplication администратор также запускает перенос для каждой ВМ в отдельности. Существует возможность автоматизации переноса с помощью сценариев.

VMware SRM предоставляет широкие возможности по автоматизации плана восстановления ВМ, включая приоритет и последовательность запуска ВМ, время ожидания, изменение сетевой конфигурации для восстанавливаемых ВМ, запуск скриптов и сценариев внутри восстанавливаемых ВМ.

VeeamBackup&Replication позволяет запускать ВМ по отдельности.

Настройка обратной репликации (Failback)

Помимо функционала восстановления инфраструктуры в резервном сайте, ПО репликации также может предоставлять возможность настройки репликации и переноса ВМ с резервного в основной сайт (Failback). Все рассматриваемые решения обладают подобной возможностью, однако в случае VMware SRM и VeeamBackup&Replication вам потребуется перенести лицензии с основного сайта в резервный либо приобрести дополнительные лицензии для защиты второго сайта.

Заключение

Рассмотренные выше средства репликации и организации катастрофоустойчивой виртуальной инфраструктуры позволяют обеспечить минимальные значения RTO и RPO при восстановлении инфраструктуры после катастрофы. Следует отметить, что катастрофоустойчивые решения не исключают других механизмов повышения доступности, таких как кластеризация, дублирование компонентов, резервное копирование данных, а, наоборот, дополняют их и позволяют обеспечить заданный уровень надежности бизнес сервисов организации.




Возможности программного обеспечения для репликации ВМ и организации катастрофоустойчивой виртуальной инфраструктуры



Подробности

Андрей Коновалов

Ведущий технический эксперт компании Helios IT, MCSE, MCITP, VCAP. Специализируется на виртуализации серверов и рабочих станций с использованием технологий следующих производителей: VMware, Microsoft, Citrix. Андрей имеет большой опыт по проектированию и внедрению решений, включая развертывание катастрофоустойчивые на базе VMware vCenter Site Recovery Manager и Veeam Backup & Replication.

Helios IT

Helios Information Technologies — универсальный интегратор инфраструктурных решений для корпоративных и государственных заказчиков. Компания образована в 1999 году, с 2006 года входит в группу компаний «Армада».
Helios IT предлагает широкий спектр услуг по следующим направлениям деятельности:
• системная интеграция, внедрение инфраструктурных решений, корпоративных сетей и инженерных систем;
• решения в области центров обработки данных, систем хранения и вычислительных комплексов;
• построение и обслуживание систем обеспечения информационной безопасности;
• оказание широкого спектра услуг в сфере ИТ на всех этапах жизненного цикла инфраструктуры.

Тематики: Интеграция, ПО

Ключевые слова: виртуализация