Целью семинара, по словам руководителя по работе с партнерами сервиса «Яндекс.Новости» Татьяны Исаевой было, во-первых, показать алгоритмы работы сервиса, а во-вторых, обратить внимание на то, что его разработчики открыты к диалогу, развитию и взаимному сотрудничеству. «Все знают, что существуют «Яндекс.Новости», но как они работают, не очевидно ни для кого. На какой-то момент в Интернете стали появляться высказывания «Яндекс написал», «Яндекс решил», «Яндекс разобрался в ситуации» и т. д. Это принципиально неверно, и мы сейчас стараемся это объяснить. Кроме того, хочется показать, что мы существуем и мы работаем, слушаем все аргументы пользователей, готовы отвечать на вопросы и открыты к сотрудничеству», – пояснила г-жа Исаева.
Для представителей петербургских СМИ Татьяна Исаева и руководитель «Яндекс.Новостей» Лев Гершензон провели презентацию сервиса, осветив основные его задачи, принципы и алгоритмы действия. Система собирает актуальную информацию с различных новостных ресурсов Рунета, оформляет её и даёт ссылки на первоисточники. Разработчики обратили внимание на прозрачные правила системы «Яндекс.Новости», пояснив, что это полностью автоматический сервис, в котором не принимают участие модераторы. Партнеры сервиса – информагентства и другие интернет-СМИ, чей контент используется в системе, – получают в результате этого сотрудничества около 4 млн читателей в сутки. В данном случае рассматривается количество переходов по ссылкам с главной страницы «Яндекса», на которой размещен «Топ-5 новостей дня». Разработчики объяснили также принципы отбора новостей, требования к предоставляющим контент ресурсам, механизмы формирования новостного сюжета и различные нюансы работы системы.
О развитии сервиса «Яндекс.Новости» говорит увеличение штата работающих над ним специалистов. Первый постоянный разработчик появился у сервиса два года назад, и с тех пор их количество увеличилось до семи человек. В данный момент непрерывно ведется работа по улучшению качества сервиса, увеличению количества партнеров, созданию возможностей для иноязычных пользователей.
«Мы стараемся совершенствовать систему для того, чтобы пользователям было удобнее, а изданиям выгоднее. Практически все, что у нас есть, в дальнейшем можно улучшать. Здесь работает не человек, а робот, и в связи с этим могут быть определенные сложности: например, точность при определении новости по запросам из ключевых слов. Точность тут пока 85 %. То есть 85 % сообщений «подклеиваются» в правильный сюжет, а 15 % либо подходят, либо «подклеиваются» не туда. Но поскольку действует робот, это невозможно моментально изменить, даже переделав алгоритм, так как он очень сложный. И результат любого изменения в алгоритме никогда нельзя предвидеть на сто процентов, его необходимо тестировать», – рассказала Татьяна Исаева о проблемах работы сервиса.
Принципиальным отличием «Яндекс.Новостей» от подборки информационных сообщений на других ресурсах, по мнению разработчиков, является, во-первых, обязательное добровольное соглашение с партнерами (в основном информационными агентствами): сервис даёт ссылку лишь на те источники, с которым был подписан договор о сотрудничестве. Во-вторых, «Яндекс.Новости» отличает четкая структура сюжетов: заголовок, аннотация и непосредственно тело сообщения, что дает наиболее полное представление о событии.
Во второй части семинара руководитель проекта «Яндекс. Поиск по Блогам» Антон Волнухин представил свой сервис, показав участникам встречи алгоритм его работы, основные функции и проблемы. «Поиск по блогам» выявляет общественное мнение в глобальной сети по тем или иным вопросам, индексируя около полутора миллиардов документов, что является одной пятой частью всех документов русскоязычного Интернета. Довольно быстро – в течение 10 минут – системой индексируются новые записи более чем с 170 блог-хостингами. На главной странице «Яндекса» отображаются темы дня – события, наиболее обсуждаемые блоггерами в данный момент. Сервис «Пульс блогосферы» показывает, как много записей упоминали о том или ином явлении в разное время. Как и «Яндекс.Новости» сервис «Поиск по Блогам» полностью автоматизирован. Единственным исключением может быть проверка модератором корректности названия тем дня, которые отображаются на главной странице «Яндекса». Эта мера введена в связи с тем, что роботу сложно сформулировать адекватное название из-за свободного разговорного языка, которым в большинстве своем пользуются блогеры.
Среди проблем сервиса Антон Волнухин упомянул и спам, встречающийся в текстах, отметив, что в этом вопросе присутствует явный прогресс. Если год назад спамом являлось 80 % всех записей в блогах, то сейчас он составляет лишь 9 %.
Сервис «Поиск по блогам» открывает доступ ко всем проиндексированным записям, собранным, накопленным и проанализированным данным. Открытыми также является и рейтинги блогов, блог-хостингов, обсуждений – система позволяет пользоваться накопленной ею информацией. «На основе нашего API можно создавать свои рейтинги, в той сфере, где вы являетесь специалистом. Уже сейчас появились тематические рейтинги, к примеру, политиков или священнослужителей, так как у нас открыты все необходимые данные», – обратил внимание Антон Волнухин.
Как сообщили организаторы мероприятия, с апреля 2009 года в Москве было проведено уже пять семинаров на тему «Как работают Яндекс.Новости». Дважды разработчики ездили на Украину и один раз посещали Казахстан. В Петербурге подобное мероприятие прошло впервые. «Нам было не очень просто собрать здесь аудиторию. На семинар пришло около 30 % представителей СМИ, остальные участники – блогеры. В Москве и на Украине нас активно приглашают, расспрашивают на все интересующие темы, а в Петербурге пока молчат. Но если мы почувствуем всплеск интереса, то, конечно, еще не раз приедем сюда», – прокомментировала Татьяна Исаева.