Anthropic заклікае да глабальнай паўзы ў распрацоўцы ШІ, папярэджваючы пра рызыку «самаўдасканалення»
Адзін з найбуйнейшых гульцоў на рынку штучнага інтэлекту заклікаў загадзя падрыхтаваць механізмы, якія дазволілі б у выпадку неабходнасці запаволіць або часова прыпыніць распрацоўку найбольш перадавых сістэм ШІ. У Anthropic асцерагаюцца, што ўжо ў агляднай будучыні яны могуць набыць здольнасць самастойна ўдасканальвацца без удзелу чалавека.

Як піша The Wall Street Journal, некалькі дзён таму сузаснавальнік Anthropic Джэк Кларк і кіраўніца ўнутранага даследчага інстытута кампаніі Марына Фавара апублікавалі ў блогу кампаніі допіс, у якім заклікалі вядучыя лабараторыі ў галіне штучнага інтэлекту разгледзець магчымасць запаволення тэмпаў распрацоўкі.
Аўтары сцвярджаюць, што сістэмы ШІ прагрэсуюць настолькі імкліва, што неўзабаве могуць здабыць здольнасць да «рэкурсіўнага самаўдасканалення» — стану, калі сістэмы ШІ могуць паляпшацца самастойна. Некаторыя эксперты лічаць гэты парог сігналам магчымай небяспекі і крыніцай маштабных рызык для грамадства.
Аўтары падкрэсліваюць, што такая здольнасць яшчэ не з'явілася і яе ўзнікненне не гарантаванае. Аднак, на іх думку, гэта можа адбыцца значна раней, чым большасць дзяржаўных і грамадскіх інстытутаў паспее падрыхтавацца.
Як адзначаецца ў допісе, чалавецтву было б карысна мець магчымасць «запаволіць або часова прыпыніць» развіццё перадавога ШІ, каб грамадскія структуры і даследаванні ў галіне бяспекі ШІ маглі ісці ў нагу з тэхналагічным прагрэсам.
Для гэтага кампанія прапануе распрацаваць глабальнае пагадненне аб магчымым запаволенні распрацовак і стварыць механізм верыфікацыі таго, што канкурэнты выконваюць гэтыя дамоўленасці. Гэта пагадненне параўноўваюць з дамовамі аб кантролі над ядзернай зброяй.
Аднак, як піша WSJ, рэалізаваць гэта будзе значна складаней: навучальныя цэнтры ШІ схаваць куды прасцей, чым ракетныя шахты, а той, хто адмовіцца ад паўзы, можа імгненна захапіць сусветнае лідарства.
Наколькі шчырая заява?
Не ўсе ўспрымаюць гэтыя папярэджанні як шчырыя. Венчурны інвестар і нефармальны дарадца прэзідэнта Трампа Дэвід Сакс бачыць у дзеяннях Anthropic праяву «рэгулятарнага захопу». На яго погляд, палітыка, за выпрацоўку якой выступае кампанія, можа прывесці да забароны мадэляў з адкрытым зыходным кодам — версій сістэм ШІ, якія значна таннейшыя для выкарыстання і ўнутранай распрацоўкі ў арганізацыях.
Іншыя мяркуюць, што папярэджанні Anthropic аб небяспечным патэнцыяле ўласных інструментаў могуць быць маркетынгавым ходам. У якасці прыкладу яны называюць рашэнне кампаніі абмежаваць доступ да мадэлі Mythos, здольнай знаходзіць памылкі і ўразлівасці. На іх думку, такім чынам Anthropic адначасова дэманструе магчымасці сваіх прадуктаў і стварае вакол іх дадатковую ўвагу.
Разам з тым, як адзначае WSJ, унутры самой індустрыі няма адзінства адносна таго, наколькі блізка сучасныя сістэмы падышлі да ўзроўню AGI — агульнага штучнага інтэлекту, супастаўнага з чалавечым.
Прафесар Ітан Молік з Уортанскай школы падкрэслівае, што Anthropic — гэта складаны сплаў бізнэс-інтарэсаў і шчырых «вернікаў» у неабходнасць сур'ёзна ставіцца да магчымых рызык. У той жа час піянер ШІ Ян Лекун скептычна ставіцца да падобных страхаў, параўноўваючы інтэлект сучасных мадэляў з інтэлектам ката і заяўляючы, што яны ніколі не зраўняюцца з чалавекам.
Тым не менш, кіраўніцтва Anthropic, у тым ліку выканаўчы дырэктар Дарыа Амадэі, працягвае маляваць трывожныя сцэнары. Як піша WSJ, Амадэі папярэджвае аб магчымым знікненні да 50% офісных працоўных месцаў пачатковага ўзроўню і нават аб рызыцы небяспечных паводзін будучых магутных сістэм ШІ. У адным са сваіх эсэ ён дапускаў, што навучанне штучнага інтэлекту на навукова-фантастычных сюжэтах пра паўстанне машын тэарэтычна можа паўплываць на паводзіны рэальных сістэм.
Асобна WSJ згадвае словы сузаснавальніка Anthropic Джэка Кларка, які заяўляў, што тэхналогіі, здольныя да рэкурсіўнага самаўдасканалення, могуць з'явіцца ўжо цягам найбліжэйшых двух гадоў або нават раней.
На яго думку, сёння свет апынуўся ў сітуацыі, калі магутныя сістэмы штучнага інтэлекту распрацоўваюцца з беспрэцэдэнтнай хуткасцю ў розных краінах і кампаніях, а камерцыйнае і геапалітычнае саперніцтва нярэдка засланяе больш шырокія пытанні пра наступствы гэтых тэхналогій для чалавецтва.
У выніку Anthropic хоча выпрацаваць практычныя механізмы рэалізацыі такіх дамоўленасцяў. Даследаваннямі гэтых пытанняў будзе займацца і створаны кампаніяй Anthropic Institute — унутраны даследчы цэнтр, які плануе супрацоўнічаць з іншымі арганізацыямі для вывучэння ўплыву штучнага інтэлекту на грамадства і магчымых механізмаў кантролю.
Акрамя таго, найбліжэйшыя месяцы кампанія плануе ініцыяваць дыялог з палітыкамі, даследчыкамі і іншымі зацікаўленымі бакамі.
Каментары