Интуиция при знакомствах в интернете больше не работает
Ученые говорят, что ИИ научился притворяться человеком лучше людей. «Отличить бота в сети уже невозможно».
Иллюстративное изображение, сгенерированное Gemini
Ученые провели строгую версию классического теста Тьюринга и пришли к тревожным выводам. Современный искусственный интеллект не просто научился выдавать себя за человека — он делает это настолько убедительно, что живые люди кажутся ботами. Рассказываем, как машине удается нас обхитрить и почему.
Представьте, что вы переписываетесь онлайн с двумя незнакомцами: один из них — реальный человек, другой — робот. Ваша задача — сравнить два разговора и понять, кто есть кто. Именно так выглядит классический тест Тьюринга в формате с тремя участниками, который исследователи из Калифорнийского университета предложили пройти современным языковым моделям. Исследование опубликовано в журнале Psychological and Cognitive Sciences.
Результат эксперимента интересен. Если искусственному интеллекту (модели GPT-4.5) дали установку вести себя как обычный человек, то участники выбирали машину в 73% случаев, в то время как настоящему человеку, который сидел по ту сторону экрана, поверили только 27%.
Главный секрет успеха искусственного интеллекта не в феноменальном уме или энциклопедических знаниях, а в удачном образе. Если программе давали только базовую инструкцию «быть человеком», она часто проваливалась. ИИ узнавали в 64% случаев.
Но если ей прописали детальную роль молодого человека, немного интровертного, хорошо знающего интернет-культуру и употребляющего сленг, результаты перевернулись с ног на голову. Выяснилось, что именно неформальный стиль и впечатление, что собеседник чего-то не знает или уклоняется от прямого ответа, делают робота неотличимым от нас.
Самое интересное в этом исследовании то, как именно люди пытались вывести машину на чистую воду. Почти никто не задавал сложных математических задач или логических головоломок, которые традиционно ассоциируются с проверкой роботов, такие вопросы звучали только в 12% игр.
Вместо этого люди делали ставку на «смол-ток»: расспрашивали о повседневной жизни, шутили и пытались почувствовать эмоциональную теплоту. Судьи принимали решение, опираясь на стиль письма и собственную интуицию. Один из участников так и объяснил свой выбор в пользу бота: мол, «у него был человеческий вайб».
Когда исследователи решили усложнить задачу и увеличили время на разговор в три раза, результаты эксперимента стали еще более показательными. Участникам запретили завершать игру досрочно, поэтому они вынуждены были коммуницировать полные 15 минут, отправив в среднем по 22 сообщения каждому собеседнику — это почти в три раза больше текста, чем во время короткого 5‑минутного теста.
Поскольку предыдущая версия нейросети устарела и больше не поддерживалась разработчиками из OpenAI, в длинном тесте ученые использовали новую модель GPT-5, а также модель LLaMa-3.1-405B. Им снова дали инструкцию отвечать в стиле молодого человека, и обе системы успешно прошли тест.
GPT-5 убедил судей в том, что он живой человек, в 59% случаев. Модели LLaMa поверили чуть меньше, но все равно результат отличный — 56% игр. Это значит, что в большинстве случаев машина снова обошла реального человека-участника.
Исследователи скрупулёзно проверили все демографические данные 205 участников. Выяснилось, что способность распознать искусственный интеллект никак не коррелирует с жизненным бэкграундом. Ни возраст, ни пол, ни наличие высшего образования, ни даже то, считаете ли вы себя экспертом в области нейросетей и как часто пользуетесь чат-ботами в повседневности — ничего из этого не сделало людей более точными в своих решениях.
Единственное, что люди безошибочно распознавали, так это ELIZA — очень старый и примитивный алгоритм из 1960-х, который работает по заранее прописанным правилам. Его добавили для контроля эксперимента, и в 15‑минутном тесте люди успешно вычисляли эту программу в 83% случаев.
Ученые бьют тревогу и вводят термин «поддельные люди» (counterfeit people). Так же, как фальшивые деньги обесценивают настоящую валюту, так и симуляция человеческого общения может постепенно подорвать ценность реальных контактов и уничтожить доверие к любому человеку в интернете.
Системы, способные настолько точно имитировать людей, могут быть идеальным оружием для манипуляций, распространения дезинформации и социальной инженерии, потому что мы даже не будем понимать, что нами управляет алгоритм.
Мы привыкли думать, что чистые и быстрые расчеты свойственны компьютерам, а эмпатия, юмор, спонтанность и неидеальность — это наша, человеческая монополия. Но теперь машины блестяще имитируют и это.
Наверное, самая неприятная и тревожная деталь этого эксперимента даже не в том, что робот способен сдать известный тест Тьюринга. Главная проблема в том, что реальный живой человек, который просто был собой и стремился казаться естественным, этот тест проиграл.