. Научная статья с результатами изучения, проведённого в рамках программы «Приоритет-2030», опубликована в «SpringerLink».
Графы – это структуры данных, которые представляют собой сети с парными связями внутри. Как правило, они представлены в виде узлов и линий, которые еще называют рёбрами. А графовые нейронные сети – это тип нейронных сетей, которые ориентированы на работу со структурой графа. Очень многие данные удобно представлять в виде графов – отношения между пользователями социальных сетей, структурные представления белков и органических соединений, сеть передачи данных, транзакции между банковскими счетами. Графовые нейронные сети, по сути, объединили под собой все наработки в области нейронных сетей, которые были направлены на обработку данных, представляемых в виде объектов и отношений между ними.
Около года назад ученые Политеха приступили к изучению графовых нейросетей в банковской сфере. Они проанализировали и обработали большой объем данных: сотни транзакций и подробную информацию о них, начиная с номера операции и заканчивая типом устройства, с помощью которого осуществлялся перевод. Затем исследователи построили модель графовой нейронной сети и перешли к её обучению.
«Мы представили банковские операции и пользователей, которые их совершают, в виде графов, затем разделили их на два класса: одни – мошенники, другие – люди, осуществляющие легитимные денежные переводы. При обучении нашей графовой нейронной сети мы дополнительно учитывали идентификационную информацию: номер банковской карты, данные об отправителе и получателе денежных средств, тип используемой банковской карты, характеристики устройства, с помощью которого была совершена транзакция и другие. Выделение дополнительных признаков позволило нам более точно обучить графовую нейронную сеть и получить хорошие результаты», – поделилась доктор технических наук, профессор Института кибербезопасности и защиты информации СПбПУ Дарья Лаврова.
Главное оружие новой модели нейронной сети в том, что она уделяет внимание определенным закономерностям, по которым можно распознать противоправные действия. При «фильтрации» транзакций, например, нейросеть смотрит на временные метки, по которым определяет, как давно человек стал участником банковской среды и в какой организации обслуживается.
«Если человек открыл счет в банке полгода назад и за этот период времени средняя сумма транзакций за день составляла 1 000 рублей, после чего в один день он получил денежные переводы в сумме 30 000 рублей, вероятность того, что нейронная сеть отнесет этого человека к классу мошенников, возрастет. Кроме того, будет учитываться информация об источнике транзакции и, если деньги были переведены не юридической организацией, а 10 физическими лицами, то данная вероятность также увеличится», – привела пример Дарья Лаврова.
Новая модель нейросети, разработанная в Политехе, ориентирована на решение проблемы больших объемов данных о транзакциях, повышение скорости анализа операций на предмет безопасности и обнаружение новых способов банковского мошенничества. По словам ученых, в наше время, когда каждый человек может за день делать несколько покупок в интернете, важно, чтобы был механизм защиты, который быстро выявит мошеннические действия из огромного числа банковских операций.
Разработка Политеха может быть очень полезной прежде всего банковским организациям. Во-первых, она способна экономить человеческий ресурс, автоматизируя всю рутинную работу по ручному разбору транзакций, которую выполняют сотрудники банков. Им останется разобраться только с теми операциями, которые нейронная сеть сочла подозрительными. Во-вторых, банки могут экономить – работая с нейросетью, организациям не придется тратить бюджет на перенастройку сетевой инфраструктуры, закупку средств информационной безопасности, обучение сотрудников правилам так называемой «цифровой гигиены», а самое главное на компенсацию ущерба от мошенников.
«Наш метод может вполне быть применен уже сейчас в качестве первой линии защиты: для сокращения объема данных с транзакциями и обнаружения многих видов мошенничества. Однако основным методом защиты наш метод, как и все остальные технические методы обеспечения информационной безопасности, никогда не станет просто потому, что самое уязвимое звено – это не компьютер, а человек. До тех пор, пока пользователи вводят на сторонних сайтах данные своих кредитных карт, не используют надёжные пароли и верят звонкам от якобы сотрудников службы безопасности банка, безопасность не будет обеспечена. Развитие технических средств защиты должно происходить в параллель с обучением пользователей азам цифровой грамотности и безопасного поведения в сети Интернет», – поделилась один из авторов проекта, научный сотрудник Института кибербезопасности и защиты информации СПбПУ Анастасия Сергадеева.
На практике, говорят разработчики, нейронная сеть какое-то время должна «привыкнуть» к особенностям той информационной среды, в которой она будет работать. Поэтому обучать ее лучше на данных той же банковской среды, в которой она будет обнаруживать мошенников. При этом для более точной работы графовой нейронной сети лучше как можно более детально описать сам граф, то есть дать нейросети больше информации о пользователях, а также примеры мошеннических транзакций, которые уже ранее были замечены в целевой банковской среде.
«Обеспечение кибербезопасности – непрерывный процесс, вечная «гонка вооружений» между технически квалифицированными специалистами по безопасности и нарушителями. Поэтому любая система защиты, скорее всего, рано или поздно, будет взломана, но на смену ей будут созданы новые защитные механизмы. Мы работаем в направлении совершенствования нашей модели графовой нейронной сети, собирая и генерируя новые обучающие наборы данных, которые будут включать и более «хитрые» транзакции», – резюмировал доктор технических наук, директор Института кибербезопасности и защиты информации СПбПУ член-корреспондент РАН Дмитрий Зегжда.
Графовая нейронная сеть, как говорят ученые Политеха, может быть использована в разных сферах, где данные можно представить в виде набора объектов и связей между ними. Так, например, она справится с выявлением в социальных сетях пользователей, распространяющих дезинформацию или же с обнаружением сетевых атак в сетях передачи данных.