Навукоўцы кажуць, што ШІ навучыўся прыкідвацца чалавекам лепш за людзей. «Адрозніць бота ў сеціве ўжо немагчыма».

Навукоўцы правялі строгую версію класічнага тэста Цьюрынга і прыйшлі да трывожных высноў. Сучасны штучны інтэлект не проста навучыўся выдаваць сябе за чалавека — ён робіць гэта настолькі пераканаўча, што жывыя людзі здаюцца ботамі. Расказваем, як машыне ўдаецца нас абхітрыць і чаму.
Уявіце, што вы перапісваецеся анлайн з двума незнаёмцамі: адзін з іх — рэальны чалавек, другі — робат. Ваша задача — параўнаць дзве размовы і зразумець, хто ёсць хто. Менавіта так выглядае класічны тэст Цьюрынга ў фармаце з трыма ўдзельнікамі, які даследчыкі з Каліфарнійскага ўніверсітэта прапанавалі прайсці сучасным моўным мадэлям. Даследванне апублікаванае ў часопісе Psychological and Cognitive Sciences.
Вынік эксперымента цікавы. Калі штучнаму інтэлекту (мадэлі GPT-4.5) далі ўстаноўку паводзіць сябе як звычайны чалавек, то ўдзельнікі абіралі машыну ў 73% выпадкаў, у той час як сапраўднаму чалавеку, які сядзеў па той бок экрана, паверылі толькі 27%.
Галоўны сакрэт поспеху штучнага інтэлекту не ў фенаменальным розуме ці энцыклапедычных ведах, а ва ўдалым вобразе. Калі праграме давалі толькі базавую інструкцыю «быць чалавекам», яна часта правальвалася. ШІ пазнавалі ў 64% выпадкаў.
Але калі ёй прапісалі дэталёвую ролю маладога чалавека, крыху інтравертнага, які добра ведае інтэрнэт-культуру і ўжывае слэнг, вынікі перавярнуліся з ног на галаву. Высветлілася, што менавіта нефармальны стыль і ўражанне, што суразмоўца нечага не ведае ці ўхіляецца ад прамога адказу, робяць робата неадрозным ад нас.
Самае цікавае ў гэтым даследаванні тое, як менавіта людзі спрабавалі вывесці машыну на чыстую ваду. Амаль ніхто не задаваў складаных матэматычных задачак ці лагічных галаваломак, якія традыцыйна асацыююцца з праверкай робатаў, такія пытанні гучалі толькі ў 12% гульняў.
Замест гэтага людзі рабілі стаўку на «смол-ток»: распытвалі пра паўсядзённае жыццё, жартавалі і спрабавалі адчуць эмацыйную цеплыню. Суддзі прымалі рашэнне, абапіраючыся на стыль пісьма і ўласную інтуіцыю. Адзін з удзельнікаў так і патлумачыў свой выбар на карысць бота: маўляў, «у яго быў чалавечы вайб».
Калі даследчыкі вырашылі ўскладніць задачу і павялічылі час на размову ў тры разы, вынікі эксперыменту сталі яшчэ больш паказальнымі. Удзельнікам забаранілі завяршаць гульню датэрмінова, таму яны вымушаныя былі камунікаваць поўныя 15 хвілін, адправіўшы ў сярэднім па 22 паведамленні кожнаму суразмоўцу — гэта амаль у тры разы больш тэксту, чым падчас кароткага 5‑хвіліннага тэста.
Паколькі папярэдняя версія нейрасеткі састарэла і больш не падтрымлівалася распрацоўшчыкамі з OpenAI, у доўгім тэсце навукоўцы выкарысталі новую мадэль GPT-5, а таксама мадэль LLaMa-3.1-405B. Ім зноў далі інструкцыю адказваць у стылі маладога чалавека, і абедзве сістэмы паспяхова прайшлі тэст.
GPT-5 пераканаў суддзяў у тым, што ён жывы чалавек, у 59% выпадкаў. Мадэлі LLaMa паверылі крыху менш, але ўсё роўна вынік выдатны — 56% гульняў. Гэта значыць, што ў большасці выпадкаў машына зноў абышла рэальнага чалавека-ўдзельніка.
Даследчыкі скрупулёзна праверылі ўсе дэмаграфічныя даныя 205 удзельнікаў. Высветлілася, што здольнасць распазнаць штучны інтэлект ніяк не карэлюе з жыццёвым бэкграўндам. Ні ўзрост, ні пол, ні наяўнасць вышэйшай адукацыі, ні нават тое, ці лічыце вы сябе экспертам у галіне нейрасетак і як часта карыстаецеся чат-ботамі ў штодзённасці — нічога з гэтага не зрабіла людзей больш трапнымі ў сваіх рашэннях.
Адзінае, што людзі беспамылкова распазнавалі, дык гэта ELIZA — вельмі стары і прымітыўны алгарытм з 1960-х, які працуе па загадзя прапісаных правілах. Яго дадалі для кантролю эксперымента, і ў 15‑хвілінным тэсце людзі паспяхова вылічвалі гэтую праграму ў 83% выпадкаў.
Навукоўцы б'юць трывогу і ўводзяць тэрмін «падробленыя людзі» (counterfeit people). Гэтак жа, як фальшывыя грошы абясцэньваюць сапраўдную валюту, так і сімуляцыя чалавечых зносін можа паступова падарваць каштоўнасць рэальных кантактаў і знішчыць давер да любога чалавека ў інтэрнэце.
Сістэмы, здольныя настолькі дакладна імітаваць людзей, могуць быць ідэальнай зброяй для маніпуляцый, распаўсюджвання дэзінфармацыі і сацыяльнай інжынерыі, бо мы нават не будзем разумець, што намі кіруе алгарытм.
Мы прывыклі думаць, што чыстыя і хуткія разлікі ўласцівыя камп'ютарам, а эмпатыя, гумар, спантаннасць і неідэальнасць — гэта наша, чалавечая манаполія. Але цяпер машыны бліскуча імітуюць і гэта.
Напэўна, самая непрыемная і трывожная дэталь гэтага эксперыменту нават не ў тым, што робат здольны здаць вядомы тэст Цьюрынга. Галоўная праблема ў тым, што рэальны жывы чалавек, які проста быў сабой і імкнуўся здавацца натуральным, гэты тэст прайграў.
«Наша Нiва» — бастыён беларушчыны
ПАДТРЫМАЦЬ
Каментары