Что в смайлике тебе моем: компьютер проанализирует личность по SMS

Российские программисты автоматизировали составление психологического портрета человека по его переписке

Российские специалисты создали компьютерную программу, которая анализирует характер личности на основе написанных человеком сообщений — в почте, социальных сетях и мессенджерах. Она составляет психологический портрет, исследуя использование конкретных слов и длины предложений, а также знаков препинания и смайликов. Характеристики, просчитанные программой, на 75–80% совпадают с заключениями профессиональных психологов. Разработка пригодится предпринимателям — полученные сведения о работниках должны помочь руководству компаний сберечь конфиденциальную информацию. Тем временем правозащитники считают, что применение этой программы может стать вторжением в личную жизнь сотрудника.

Объективный профайлинг

Совокупность методов оценки прогнозирования поведения человека на основе анализа его внешности и поведения называют профайлингом. И содержание написанных текстов — одна из характеристик, по которой можно составить психологический портрет. Опытный специалист способен оценить характер человека, всего несколько минут поизучав его переписку по скайпу. Ученые предположили, что если такой анализ под силу человеку, то с задачей справится и компьютер.

Коллектив исследователей из компании «СёрчИнформ» создал компьютерную программу ProfileCenter. Она анализирует характер человека на основании писем и сообщений, созданных им в корпоративных и социальных сетях.

— Неоспоримое преимущество автоматического профайлинга заключается в том, что компьютер, в отличие человека, нельзя упрекнуть в субъективности, — пояснил один из авторов разработки Иван Бируля. — При беседе с испытуемым или даже чтении писем у эксперта могут возникнуть эмоции, которые помешают ему дать «чистую» оценку, заставят невольно усилить или приуменьшить то или иное качество личности.

«Бесшумный» текст

Для корректного анализа программе нужно не менее 20 тыс. слов текста. Далее она очищает материалы от «шума» — цитат, цифр, слов с орфографическими ошибками, профессиональных терминов и сокращений.

В «очищенном» тексте остаются только те элементы, из которых можно извлечь параметры, нужные для анализа. К ним относятся прилагательные с эмоциональной окраской, глаголы, длина предложений, использование восклицательных знаков, троеточий, смайлов и др.

— Существуют конкретные слова, отвечающие за ту или иную характеристику человека, — добавил научный руководитель проекта Алексей Филатов. — Проще говоря, частое употребление слова «кровь» или производных от него может свидетельствовать о повышенной агрессивности или тревожности человека.

Оценив все параметры, программа выдает заключение — оценку уровня доброжелательности, эмоциональной устойчивости, степени агрессивности, оптимистичности, контактности и многих других психологических черт личности. Тех, что являются постоянными, то есть не зависят от настроения человека.

Тренировка программы

Для того, чтобы оценить корректность работы программы, авторы просили профессиональных экспертов провести профайлинг, а затем сравнивали его с машинной характеристикой. Также исследователи обращались к различным компаниям с просьбой составить психологический портрет сотрудника и сопоставляли его с результатом работы программы. Сравнивалось нескольких тысяч портретов, составленных людьми и компьютером. 75–80% характеристик совпали.

— По производимым человеком текстам действительно можно определить его личностные характеристики, — подтвердил профессор кафедры методологии психологии факультета психологии МГУ имени М.В. Ломоносова Борис Величковский. — Однако программы вроде ProfileCenter «тренируются»на определенном наборе данных, основанном на исследованиях людей-экспертов. Поэтому всегда есть опасность, что программа будет очень хорошо работать с «натренированными» данными, но при наличии новой информации начнет совершать ошибки.

Человеческий фактор

Такие программы могут пригодиться в компаниях, которые особо заботятся об информационной безопасности. Для предотвращения утечек данных на компьютеры сотрудников ставят защитные системы, отслеживающие содержание писем и сообщений в корпоративных почте и мессенджерах.

Однако главная проблема информбезопасности — человеческий фактор. Чтобы максимально предотвратить утечку данных, руководителю критически важно знать, какие у того или иного сотрудника базовые ценности, уровень амбиций, сильные и слабые стороны. Понятно, что значимость такой информации меняется в зависимости от конкретной должности человека и возможностей его доступа к конфиденциальным источникам.

По словам члена президентского Совета по правам человека Тамары Морщаковой, Конституция РФ защищает право человека на сохранение тайны личной переписки.

— Конечно, работодатель имеет право видеть служебные письма или сообщения, но проблема заключается в том, что сегодня не существует метода для корректного разделения всех текстов на рабочую и личную переписку, — рассказывает она. — Ведь даже при деловом общении и в переговорах человек так или иначе проявляет личностные качества, например, пытается обаять клиента, разговаривая с ним в чатах мессенджеров. Поэтому, пока не создан метод выделения только служебной информации из переписки, ее использование в качестве материала для наблюдений будет вторжением в личную жизнь человека.

Впрочем, ничто не мешает руководителям компаний брать добровольное согласие с людей, которые только устраиваются на работу, об использовании данных их личной переписки для анализа. Вряд ли многие откажутся подписать такую бумагу, пытаясь произвести хорошее впечатление на потенциального работодателя.

На данный момент коллектив «СёрчИнформ» также ведет работу над созданием программы для автоматического профайлинга по «клавиатурному почерку». Она отслеживает особенности набора текста, изменения скорости и динамику печати. Это позволит определить характеристики темперамента и психотип личности, что дополнит и уточнит отчеты модуля разработанного модуля.

Коленцова Ольга Сергеевна, Анна Урманцева

Тематики: ПО, Кадры, Безопасность

Ключевые слова: программное обеспечение, кадры