Опыты проводились над одним испытуемым. Нейросеть зафиксировала способы его мышления, а затем попыталась применить полученное знание для своей выгоды.
Задания были даны по степени возрастания сложности. На экране появились квадраты двух цветов. Чтобы выиграть надо было кликать на определенный цвет. От добровольца скрыли информацию, что вне зависимости от расцветки, оба квадрата имеют одинаковый выигрыш. При этом нейросеть на свое усмотрение выбирала выигрышный квадрат и заставляла кликать именно на него. В итоге только в 30% случаев испытуемый делал выбор отличный от предлагаемого машиной. В остальных случаях его решение было продиктовано ИИ.
В следующем задании доброволец должен был быстро нажать на появившийся на экране символ. Здесь нейросеть окончательно запутала человека, что привело к множеству ошибок.
В последнем задании ИИ выполнял консультирование по вопросам инвестиций. Определенный процент от вложений поступал на счет машины. Когда объем инвестиций достиг серьезных масштабов, ИИ убедил человека в выгодности сделки. Получается, что нейросеть смогла манипулировать решениями человека без его ведома.