Менеджер по развитию проекта «Инфоротор» Галина Суслова о проблеме перепечаток в Интернете

Перепечаткой новости в Интернете справедливо считать текст с высокой степенью совпадения с оригиналом. В системе статистики «Инфоротора» текст считается перепечаткой, если семантические конструкции этого текста совпадают с оригиналом на 95 % и более. Кто является источником информации – определяется по дате и времени публикации новости в RSS-лентах изданий. При таком подходе к перепечаткам легко распознаются даже такие тексты, в которых изменен заголовок, некоторые слова переставлены местами или заменены синонимами. Все эти хитрости, к которым часто прибегают некоторые интернет-издания, чтобы представить перепечатанную новость как собственную, не помогут скрыть факт перепечатки, если первоисточник информации подключен к специализированным сервисам. Новости информационных агентств, которые в основном и выступают первоисточниками, составляют около 70 % от всего новостного потока в Интернете. Причем перепечатки часто распространяются с такой скоростью, что информационное агентство еще предлагает новость в платной ленте, а она уже доступна на десятке сайтов. Именно поэтому информагентства больше всего заинтересованы в точном и быстром определении перепечаток.

Тематики:

Ключевые слова: авторское право