На базе облачной платформы «Яндекс.облако» начал работу новый сервис — Yandex Vision. Он нацелен на разработчиков программных продуктов и обладает широким технологическим функционалом технологий компьютерного зрения «Яндекса», позволяющим распознавать информацию с изображений. Это коллаборация технологии оптического распознавания символов (OCR, Optical character recognition), систематизации изображений и распознавания лиц. Как сообщили представители компании, совсем недавно использование Yandex Vision было возможно только для внутренних нужд компании. Например, в поисковой системе переводчике «Яндекс».
Со слов представителей интернет-компании, конкуренцию новому сервису могут составить решения предлагаемые Google и Abbyy. Ведь Google Cloud Vision API и Abbyy OCR Cloud SDK имеют схожие с платформой «Яндекса» черты и функциональные особенности. Также они утверждают, что процесс интеграции Yandex Vision с приложениями, через интерфейсы REST API или gRPC API, происходит достаточно легко, а, чтобы интегрировать решения разработчика дополнительного опыта в машинном обучении не требуется.
Yandex Vision дает разработчикам возможность внедрить в собственные продукты систему распознавания текстовых надписей в документах и изображениях. Так в случае если оцифрованный файл, будь то скан документа или фотография, имеет в себе текст, то Yandex Vision сможет его распознать. В настоящее время платформа поддерживает более 40 языков, включая используемые в странах СНГ.
Достижение таких показателей становится возможным в случае сохранения высокого качества при распознавании машинописных источников. Как говорится в открытой документации, на сайте «Яндекс.облака», на данном этапе работа сервиса ведется с некоторыми ограничениями, в частности, распознавание рукописного, вертикального и слишком крупного текста алгоритм Yandex Vision, оставляет желать лучшего.
Если говорить о конкурентных преимуществах нового сервиса «Яндекс», то это, однозначно цена – порядка 0,1 рублей за страницу анализируемого текста, его высокая работоспособность – за 1–2 секунды происходит распознавание одной страницы, а также высокая планка качества по итогу выполненной работы. Компания делится данными, из которых следует, что точность идентификации текстов из отсканированных документов или фотографий составляет 96% для русского и английского языков, а также 94% для казахского.
Кроме функций определяющих текст, Yandex Vision может не только выявить и определить количество изображенных в документе лиц, но и извлечь их координаты для дальнейшей обработки. Это касается, например, распознавания объектов на загруженных пользователем снимках с последующей отметкой на них знакомых и друзей.
Классификация изображений – это технология, которая делает возможным анализ загружаемого пользователями контента, к примеру, но соблюдение закона об авторском праве. Система автоматически выявляет наличие водных знаков или отфильтровывает нежелательную загрузку. Функционал Yandex Vision связанный с обнаружением лиц и классификацией изображений пока что находится в пилотной стадии, и предоставляется пользователями на безвозмездной основе.
По словам представителей компании «Яндекс», в планах по развитию Yandex Vision обозначено приумножение числа сервисов компьютерного зрения, участвующих в обработке документов, фотографий и видеопотока.
Тем временем, за разработку ПО распознающего символы в видеопотоке отвечает еще одна отечественная компания – Smart Engines. Известно, что она запустила уже несколько проектов, таких как система распознавания паспортов, модули мобильно приложения 6profis, для работы легального сегмента секс-индустрии Германии, а также системе распознавания танков.