Технология, получившая название Image2Text, способна различать и «понимать» те или иные объекты на изображении. Например, проанализировав фотографию Эйфелевой башни, Image2Text предложит пользователю статью об истории создания башни, рекламу недорогих авиабилетов в Париж или видео с панорамой города.
Как рассказал РБК daily г-н Райчелгауз, разработка технологии велась на протяжении четырех лет. «Она стала возможна на стыке нейробиологии и электротехники. Исследование фокусировалось на симуляции вычислительных функций коры головного мозга, способов распознавания и понимания естественных сигналов, таких как изображения и видео», — говорит глава Cortica.
Он уверен, что на сегодняшний день главными областями для использования Image2Text являются поисковые системы и реклама. В поисковиках пользователь сможет находить наиболее релевантный контент, а рекламные сервисы смогут лучше определять потребности человека и уточнять цели рекламных объявлений.
«В будущем мы планируем масштабировать данную технологию на все мобильные устройства, в том числе GoogleGlass, и дать пользователю возможность получить информацию даже тогда, когда он просто смотрит на различные предметы», — прогнозирует г-н Райчелгауз.
Первым в Image2Text поверил гонконгский предприниматель, один из самых влиятельных бизнесменов Азии Ли Ка-Шин. В прошлом году его фонд Horizons Ventures инвестировал в израильскую технологию 7 млн долл. Сегодня, по словам гендиректора Cortica, компания работает с несколькими лидирующими в различных отраслях технологическими компаниями. На прошлой неделе Mail.Ru Group объявила о вложении 1,5 млн долл. в развитие Image2Text.
«В отличие от технологий распознавания, которые базируются на заданных образцах, технология Cortica легко масштабируется, — отметила PR-директор Mail.ru Group Ксения Чабаненко. — Самообучающийся движок ежедневно анализирует миллионы новых изображений в Интернете. Чтобы получить информацию о новых концептах, он классифицирует их и генерирует цифровые подписи для каждого кластера — так образуется большое хранилище помеченных видеоконцептов, привязанных к ключевым словам и категориям».
Эта база данных, по словам г-жи Чабаненко, позволяет осуществлять мэппинг (соотнесение визуальной и текстовой информации) в реальном времени. «Такой подход позволит сделать серьезный шаг вперед в поиске и восприятии визуальной информации в Интернете», — уверена представитель Mail.Ru
Источник, близкий к руководству российской компании, рассказал РБК daily, что технология Image2Text будет распространена на все сервисы Mail.Ru вместе с началом экспансии холдинга за пределы Рунета. Для этих целей в октябре прошлого года компания выкупила доменный адрес my.com, который станет глобальным брендом Mail.Ru Group.
Между тем директор по IT-проектам кластера фонда «Сколково» Альберт Ефимов скептично настроен по отношению к Image2Text. «Исследования и разработки в области распознавания смысла изображений сегодня ведут масса университетов и стартапов. В этом направлении в том числе работают несколько резидентов «Сколково», — напомнил он. — Чего-то уникального в израильской технологии я, честно говоря, не вижу». Тем не менее это важнейшее направление в развитии информационных технологий, уверен эксперт.
Евгений Красников