Это позволяет Датафлот Репликации создавать копии данных в озерах Data Lake и озерах-хранилищах Data Lakehouse, что существенно расширяет возможности инструмента и его применения.
Поддержка Iceberg таким образом закрепляет за Датафлот Репликация статус решения для организации EL (Extract-Load) конвейеров данных в реальном времени помимо его основной функциональности по репликации данных между реляционными СУБД.
В качестве типов хранилищ, используемых совместно с Iceberg, поддерживаются хранилища S3 и HDFS. Репликация данных может осуществляться из любых поддерживаемых источников данных, таких как PostgreSQL и всех других видов реляционных СУБД.
«Поддержка Iceberg как метахранилища данных, добавление версионирования и других функций по управлению данными в этом открытом формате позволяет рассматривать Датафлот Репликацию как решение, которое закрывает большинство задач по наполнению озер данных и Data Lakehouse. А также, благодаря поддержке СУБД Greenplum и ее форков, как решение для обеспечения миграции с хранилищ данных на системы Lakehouse, например, Селену», — сказал Олег Гиацинтов, технический директор DIS Group.
DIS Group является мастер-дистрибьютором решений «Датафлот» на российском рынке.