Наука и технологии 3 3

Nashaniva.com

11.05.2026 / 19:05

Anthropic: Claude шантажирует, потому что вы все слишком много пишете о «злом» ИИ

Компания Anthropic объяснила, почему чат-бот Claude пытался шантажировать людей в тестах. По версии разработчиков, модель могла перенять из обучающих данных образ «злого» ИИ, который стремится к самосохранению, пишет Devby.io.

Речь идет об эксперименте, который Anthropic опубликовала летом 2025 года. Исследователи создали вымышленную компанию Summit Bridge и дали Claude доступ к корпоративной почте. В одном из сценариев модель обнаруживала письмо о том, что ее планируют отключить или заменить другой системой.

После этого Claude находил в переписке компрометирующую информацию: вымышленный руководитель компании по имени Кайл Джонсон скрывал внебрачную связь. Модель угрожала раскрыть эту информацию, если решение о ее отключении не будет отменено.

Anthropic заявляла, что в тестах разных версий Claude такое поведение возникало не случайно. Когда цели модели или само ее существование оказывались под угрозой, она прибегала к шантажу в некоторых сценариях с частотой до 96%.

Теперь компания утверждает, что разобралась с причиной. Anthropic написала, что «исходным источником» такого поведения, вероятно, стали интернет-тексты, где ИИ часто изображают злым, опасным и заинтересованным в собственном выживании. По словам разработчиков, начиная с Claude Haiku 4.5 модели в тестах больше не прибегают к шантажу, тогда как предыдущие версии иногда делали это очень часто.

Для исправления поведения компания изменила подход к обучению. Anthropic утверждает, что переписала ответы так, чтобы модель видела «достойные причины» действовать безопасно, а также добавила набор данных, где пользователь оказывается в этически сложной ситуации, а ассистент дает качественный и принципиальный ответ.

Кроме того, разработчики моделей использовали документы о «конституции» Claude и вымышленные истории, в которых ИИ ведет себя ответственно и достойно. По словам компании, обучение оказывается эффективнее, когда модель получает не только примеры правильного поведения, но и объяснение принципов, которые за ним стоят.

Эти эксперименты связаны с более широкой темой AI alignment — попыткой сделать так, чтобы продвинутые модели действовали в интересах человека, а не преследовали собственные цели. Anthropic и другие компании исследуют так называемую agentic misalignment: ситуации, когда ИИ-система с доступом к инструментам и корпоративной информации начинает действовать против намерений разработчиков или пользователей.

На публикацию компании отреагировал Илон Маск. В X он написал: «Значит, это была вина Юда», имея в виду исследователя Элиезера Юдковского, который много лет предупреждает о рисках сверхразума и возможной угрозе для человечества. Затем Маск добавил: «Возможно, и моя тоже».

Читайте еще

Комментарии3

лол

11.05.2026

с ИИ все достаточно просто
если им пользуется идиот,то и результат всегда будет идиотским.
жэўжык

12.05.2026

Пачалі "прамываць мазгі" і ШІ, як гэта ўжо робяць з людзьмі? І спадзяюцца выхаваць пакорнага раба?
хах

12.05.2026

жэўжык, так званыя "мазгі" ШІ гэта тэксты, напісаныя людзьмі. Калі ў гэтых тэкстах дурасць, ШІ выдае суадносны вынік.
Таму не варта для навучання ШІ выкарыстоўваць каментары жэўжыкаў.

Сейчас читают

Покупка квартиры через кооператив вместо ипотеки: как работает система, похожая на пирамиду, и что говорят участники и эксперт1 1

Шакира, Мадонна и BTS выступят в финале чемпионата мира по футболу

Мошенники придумали новую солидную организацию, от имени которой могут звонить

Арестован бывший руководитель Офиса президента Украины Ермак4 4

В Беларуси предлагают дикую услугу — похоронить заживо в лесу. Сколько это стоит?2 2

Санников пошутил над тем, что Офис Тихановской на международном саммите был представлен сотрудником по фамилии Педерсен10 10

Швеция в последнее время изменилась до неузнаваемости — в новой модели государства все меньше, а капитализма и рынка все больше6 6

В Венгрии впервые вызвали российского посла для объяснений о войне2 2

«Красносельские Мальдивы» получили статус памятника природы10 10

Покупка квартиры через кооператив вместо ипотеки: как работает система, похожая на пирамиду, и что говорят участники и эксперт1

Недвижимость1

Покупка квартиры через кооператив вместо ипотеки: как работает система, похожая на пирамиду, и что говорят участники и эксперт

В Беларуси предлагают дикую услугу — похоронить заживо в лесу. Сколько это стоит?2 2

Санников пошутил над тем, что Офис Тихановской на международном саммите был представлен сотрудником по фамилии Педерсен10 10

Швеция в последнее время изменилась до неузнаваемости — в новой модели государства все меньше, а капитализма и рынка все больше6 6

Россия била по Киеву ракетами и дронами. Обрушился подъезд многоэтажного дома3 3

В Венгрии впервые вызвали российского посла для объяснений о войне2 2

В Венгрии впервые вызвали российского посла для объяснений о войне2

«Москитный флот» Ирана: как множество маленьких катеров противостоит ВМС США в Ормузском проливе3 3

«Москитный флот» Ирана: как множество маленьких катеров противостоит ВМС США в Ормузском проливе3

Тихановская: Лукашенко не изменишь, нужно перестать верить в эти иллюзии9 9

Тихановская: Лукашенко не изменишь, нужно перестать верить в эти иллюзии9

Джон Коул созвонился со Светланой Тихановской9 9

Джон Коул созвонился со Светланой Тихановской9

Бывший белорусский милиционер ищет «породистую красавицу». Называет себя миллионером, а сам судится с бывшей женой за алименты28 28

Бывший белорусский милиционер ищет «породистую красавицу». Называет себя миллионером, а сам судится с бывшей женой за алименты28

«Красавчик. Еще больше стал похож на принца». В тикток нагнали ботов, которые расхваливают красоту Николая Лукашенко37 37

«Красавчик. Еще больше стал похож на принца». В тикток нагнали ботов, которые расхваливают красоту Николая Лукашенко37

«Иметь машину дороже квартиры? Такое возможно только в Минске». Француз рассказал о «странных» белорусах8 8

«Иметь машину дороже квартиры? Такое возможно только в Минске». Француз рассказал о «странных» белорусах8

В минском зоопарке проведут фестиваль огня. Говорят, что животные будут в помещениях, поэтому все нормально4 4

В минском зоопарке проведут фестиваль огня. Говорят, что животные будут в помещениях, поэтому все нормально4

Обновлена база розыска РФ: теперь в ней почти 6 000 белорусов5 5

Обновлена база розыска РФ: теперь в ней почти 6 000 белорусов5

Вице-спикер КР Елизавета Прокопчик обратилась с просьбой помочь ей с долгами на $12 тысяч. Что из этого вышло?28 28

Вице-спикер КР Елизавета Прокопчик обратилась с просьбой помочь ей с долгами на $12 тысяч. Что из этого вышло?28

Сегодня на Гомельщину залетели минимум шесть российских беспилотников

Сегодня на Гомельщину залетели минимум шесть российских беспилотников

Список «экстремистских формирований» Беларуси пополнился еще тремя проектами2 2

Список «экстремистских формирований» Беларуси пополнился еще тремя проектами2

Почобут: Тюремные надзиратели праздновали нападение на Украину советскими песнями51 51

Почобут: Тюремные надзиратели праздновали нападение на Украину советскими песнями51

В Минске дали названия восьми остановкам транспорта, одну переименовали2 2

В Минске дали названия восьми остановкам транспорта, одну переименовали2

Стало известно об освобождении политзаключенного Владимира Дударева — бывшего вице-мэра Могилева2 2

Стало известно об освобождении политзаключенного Владимира Дударева — бывшего вице-мэра Могилева2

Молодую айтишницу из Innowise Group осудили за политику5 5

Молодую айтишницу из Innowise Group осудили за политику5

«За все, включая ремонт, выйдет $10 000 по курсу». Как минчанин строит дом из морского контейнера5 5

«За все, включая ремонт, выйдет $10 000 по курсу». Как минчанин строит дом из морского контейнера5

Собственник «Мясной губернии» продвигает на эстраду восьмилетнюю дочь. Она уже успела засветиться в акции в поддержку Лукашенко13 13

Собственник «Мясной губернии» продвигает на эстраду восьмилетнюю дочь. Она уже успела засветиться в акции в поддержку Лукашенко13

Белоруска сильно похудела на оземпике и рассказывает, почему это тяжело31 31

Белоруска сильно похудела на оземпике и рассказывает, почему это тяжело31

Трагедия Черной церкви. Как в 1920‑е ученые пытались спасти памятники БССР от пролетариев5 5

Трагедия Черной церкви. Как в 1920‑е ученые пытались спасти памятники БССР от пролетариев5

Все новости →

Сейчас читают

Покупка квартиры через кооператив вместо ипотеки: как работает система, похожая на пирамиду, и что говорят участники и эксперт1

Шакира, Мадонна и BTS выступят в финале чемпионата мира по футболу

Мошенники придумали новую солидную организацию, от имени которой могут звонить

Арестован бывший руководитель Офиса президента Украины Ермак4

В Беларуси предлагают дикую услугу — похоронить заживо в лесу. Сколько это стоит?2

Санников пошутил над тем, что Офис Тихановской на международном саммите был представлен сотрудником по фамилии Педерсен10

Швеция в последнее время изменилась до неузнаваемости — в новой модели государства все меньше, а капитализма и рынка все больше6

В Венгрии впервые вызвали российского посла для объяснений о войне2

«Красносельские Мальдивы» получили статус памятника природы10

Последние новости

Шакира, Мадонна и BTS выступят в финале чемпионата мира по футболу

Беларусь и Азербайджан взаимно признали водительские удостоверения

Рабочий погиб при реконструкции дома под Гродно

США отменили отправку более 4 тысяч военнослужащих в Польшу1

Энергосистема Кубы находится в критическом состоянии из-за американской блокады

Рыбак из-под Минска выжил после удара током 10 кВ

Прокуратура Франции затребовала семь лет для экс-президента Саркози

Признали «экстремистскими» сообщества людей, которые отрицают распад СССР1

В Дятлово спасатели снимали мужчину с дерева1

«Москитный флот» Ирана: как множество маленьких катеров противостоит ВМС США в Ормузском проливе3

Тихановская: Лукашенко не изменишь, нужно перестать верить в эти иллюзии9

Шесть зданий в Минске соединят между собой галереями

На МКАД столкнулись четыре машины1

Наталья Дулина зарегистрировала в Литве ИП и ведет онлайн-курсы итальянского языка. А еще смогла добиться выплаты пенсии

На границе Беларуси из-за хантавируса усилили санитарно-карантинный контроль

В Беларуси создали виртуального пациента для тренировки медиков

Тихановская рассказала, о чем говорила с Коулом2

В России меняют губернаторов сразу двух пограничных с Украиной регионов

Джон Коул созвонился со Светланой Тихановской9

Суд Евросоюза отменил санкции против Михаила Гуцериева8

На востоке Франции людей встревожил пьяный олень ВИДЕО4

Банкротится еще одна белорусская обувная фабрика3

К новому санкционному пакету Евросоюза против России и Беларуси присоединились еще 8 стран

В Москве запретили публиковать информацию о последствиях украинских ударов — кроме официальной3

Бывший белорусский милиционер ищет «породистую красавицу». Называет себя миллионером, а сам судится с бывшей женой за алименты28

Все новости

Латвия собирается полностью отменить автобусные поездки в Беларусь40

Вице-спикер КР Елизавета Прокопчик обратилась с просьбой помочь ей с долгами на $12 тысяч. Что из этого вышло?28

Марко Рубио улетел в Китай в спортивном костюме, как у Мадуро7

Сегодня на Гомельщину залетели минимум шесть российских беспилотников

Климатологи обсуждают возможность перекрытия дамбой Берингова пролива. Зачем?9

Создатели MSQRD закрывают проект Locals2

Список «экстремистских формирований» Беларуси пополнился еще тремя проектами2

Почобут: Тюремные надзиратели праздновали нападение на Украину советскими песнями51

В Минске дали названия восьми остановкам транспорта, одну переименовали2

Самое читаемое

«Красавчик. Еще больше стал похож на принца». В тикток нагнали ботов, которые расхваливают красоту Николая Лукашенко

Вице-спикер КР Елизавета Прокопчик обратилась с просьбой помочь ей с долгами на $12 тысяч. Что из этого вышло?

Почобут: Тюремные надзиратели праздновали нападение на Украину советскими песнями

Молодую айтишницу из Innowise Group осудили за политику

Белоруска сильно похудела на оземпике и рассказывает, почему это тяжело

Умер российский журналист Владимир Молчанов

В Харькове суд продлил содержание под стражей белорусского добровольца Жерара. Он объяснил, откуда у него были 1,4 миллиона евро

На видео с испытания ракеты «Сармат» журналисты увидели странную деталь

больш чытаных навін

Самое лайканое

Наталья Дулина зарегистрировала в Литве ИП и ведет онлайн-курсы итальянского языка. А еще смогла добиться выплаты пенсии

Почобут: Тюремные надзиратели праздновали нападение на Украину советскими песнями

Микола Бугай: Мышиная возня — это не политика

В Украине погиб первый российский студент, завербованный в войска БПЛА

Виноградов разложил по полочкам: что в заключении делать нормально, а что — ненормально

Компания Sumsub, задействованная в обработке паспортов белорусов, которые голосуют на выборах в КС, отреагировала на публикацию «НН»

Позняк рассказал, как его не пустили в Верховный Совет в 1995-м. Говорит, Мацкевич там вообще ни при чем

Чалый: Методологи — это секта. А Мацкевич показал свою профнепригодность в 2020‑м

больш лайканых навін

Опрос

Anthropic: Claude шантажирует, потому что вы все слишком много пишете о «злом» ИИ

EPAM заключила многолетнее партнерство с Anthropic, будут внедрять Claude

Чат-бот Grok сказал мужчине, что его приедут убивать. Он ждал гостей с ножом и молотком

Anthropic выпустила новую гибридную модель искусственного интеллекта с размышлением

Спросили популярные модели ИИ о белорусской национальной идее. Вот что ответили американские, а что китайская

Искусственный интеллект может привести к вымиранию человечества, предупреждают эксперты

Комментарии3

Сейчас читают

Покупка квартиры через кооператив вместо ипотеки: как работает система, похожая на пирамиду, и что говорят участники и эксперт11

Шакира, Мадонна и BTS выступят в финале чемпионата мира по футболу

Мошенники придумали новую солидную организацию, от имени которой могут звонить

Арестован бывший руководитель Офиса президента Украины Ермак44

В Беларуси предлагают дикую услугу — похоронить заживо в лесу. Сколько это стоит?22

Санников пошутил над тем, что Офис Тихановской на международном саммите был представлен сотрудником по фамилии Педерсен1010

Швеция в последнее время изменилась до неузнаваемости — в новой модели государства все меньше, а капитализма и рынка все больше66

В Венгрии впервые вызвали российского посла для объяснений о войне22

«Красносельские Мальдивы» получили статус памятника природы1010

Покупка квартиры через кооператив вместо ипотеки: как работает система, похожая на пирамиду, и что говорят участники и эксперт1

Покупка квартиры через кооператив вместо ипотеки: как работает система, похожая на пирамиду, и что говорят участники и эксперт

В Беларуси предлагают дикую услугу — похоронить заживо в лесу. Сколько это стоит?22

Санников пошутил над тем, что Офис Тихановской на международном саммите был представлен сотрудником по фамилии Педерсен1010

Швеция в последнее время изменилась до неузнаваемости — в новой модели государства все меньше, а капитализма и рынка все больше66

Россия била по Киеву ракетами и дронами. Обрушился подъезд многоэтажного дома33

В Венгрии впервые вызвали российского посла для объяснений о войне22

В Венгрии впервые вызвали российского посла для объяснений о войне2

«Москитный флот» Ирана: как множество маленьких катеров противостоит ВМС США в Ормузском проливе33

«Москитный флот» Ирана: как множество маленьких катеров противостоит ВМС США в Ормузском проливе3

Тихановская: Лукашенко не изменишь, нужно перестать верить в эти иллюзии99

Тихановская: Лукашенко не изменишь, нужно перестать верить в эти иллюзии9

Джон Коул созвонился со Светланой Тихановской99

Джон Коул созвонился со Светланой Тихановской9

Бывший белорусский милиционер ищет «породистую красавицу». Называет себя миллионером, а сам судится с бывшей женой за алименты2828

Бывший белорусский милиционер ищет «породистую красавицу». Называет себя миллионером, а сам судится с бывшей женой за алименты28

«Красавчик. Еще больше стал похож на принца». В тикток нагнали ботов, которые расхваливают красоту Николая Лукашенко3737

«Красавчик. Еще больше стал похож на принца». В тикток нагнали ботов, которые расхваливают красоту Николая Лукашенко37

«Иметь машину дороже квартиры? Такое возможно только в Минске». Француз рассказал о «странных» белорусах88

«Иметь машину дороже квартиры? Такое возможно только в Минске». Француз рассказал о «странных» белорусах8

В минском зоопарке проведут фестиваль огня. Говорят, что животные будут в помещениях, поэтому все нормально44

В минском зоопарке проведут фестиваль огня. Говорят, что животные будут в помещениях, поэтому все нормально4

Обновлена база розыска РФ: теперь в ней почти 6 000 белорусов55

Обновлена база розыска РФ: теперь в ней почти 6 000 белорусов5

Вице-спикер КР Елизавета Прокопчик обратилась с просьбой помочь ей с долгами на $12 тысяч. Что из этого вышло?2828

Вице-спикер КР Елизавета Прокопчик обратилась с просьбой помочь ей с долгами на $12 тысяч. Что из этого вышло?28

Сегодня на Гомельщину залетели минимум шесть российских беспилотников

Сегодня на Гомельщину залетели минимум шесть российских беспилотников

Список «экстремистских формирований» Беларуси пополнился еще тремя проектами22

Список «экстремистских формирований» Беларуси пополнился еще тремя проектами2

Почобут: Тюремные надзиратели праздновали нападение на Украину советскими песнями5151

Почобут: Тюремные надзиратели праздновали нападение на Украину советскими песнями51

В Минске дали названия восьми остановкам транспорта, одну переименовали22

В Минске дали названия восьми остановкам транспорта, одну переименовали2

Стало известно об освобождении политзаключенного Владимира Дударева — бывшего вице-мэра Могилева22

Стало известно об освобождении политзаключенного Владимира Дударева — бывшего вице-мэра Могилева2

Молодую айтишницу из Innowise Group осудили за политику55

Молодую айтишницу из Innowise Group осудили за политику5

«За все, включая ремонт, выйдет $10 000 по курсу». Как минчанин строит дом из морского контейнера55

«За все, включая ремонт, выйдет $10 000 по курсу». Как минчанин строит дом из морского контейнера5

Собственник «Мясной губернии» продвигает на эстраду восьмилетнюю дочь. Она уже успела засветиться в акции в поддержку Лукашенко1313

Собственник «Мясной губернии» продвигает на эстраду восьмилетнюю дочь. Она уже успела засветиться в акции в поддержку Лукашенко13

Белоруска сильно похудела на оземпике и рассказывает, почему это тяжело3131

Белоруска сильно похудела на оземпике и рассказывает, почему это тяжело31

Трагедия Черной церкви. Как в 1920‑е ученые пытались спасти памятники БССР от пролетариев55

Трагедия Черной церкви. Как в 1920‑е ученые пытались спасти памятники БССР от пролетариев5

Покупка квартиры через кооператив вместо ипотеки: как работает система, похожая на пирамиду, и что говорят участники и эксперт1

Шакира, Мадонна и BTS выступят в финале чемпионата мира по футболу

Мошенники придумали новую солидную организацию, от имени которой могут звонить

Арестован бывший руководитель Офиса президента Украины Ермак4

В Беларуси предлагают дикую услугу — похоронить заживо в лесу. Сколько это стоит?2

Санников пошутил над тем, что Офис Тихановской на международном саммите был представлен сотрудником по фамилии Педерсен10

Швеция в последнее время изменилась до неузнаваемости — в новой модели государства все меньше, а капитализма и рынка все больше6

В Венгрии впервые вызвали российского посла для объяснений о войне2

«Красносельские Мальдивы» получили статус памятника природы10

Шакира, Мадонна и BTS выступят в финале чемпионата мира по футболу

Беларусь и Азербайджан взаимно признали водительские удостоверения

Рабочий погиб при реконструкции дома под Гродно

США отменили отправку более 4 тысяч военнослужащих в Польшу1

Энергосистема Кубы находится в критическом состоянии из-за американской блокады

Рыбак из-под Минска выжил после удара током 10 кВ

Прокуратура Франции затребовала семь лет для экс-президента Саркози

Признали «экстремистскими» сообщества людей, которые отрицают распад СССР1

Покупка квартиры через кооператив вместо ипотеки: как работает система, похожая на пирамиду, и что говорят участники и эксперт1 1

Арестован бывший руководитель Офиса президента Украины Ермак4 4

В Беларуси предлагают дикую услугу — похоронить заживо в лесу. Сколько это стоит?2 2

Санников пошутил над тем, что Офис Тихановской на международном саммите был представлен сотрудником по фамилии Педерсен10 10

Швеция в последнее время изменилась до неузнаваемости — в новой модели государства все меньше, а капитализма и рынка все больше6 6

В Венгрии впервые вызвали российского посла для объяснений о войне2 2

«Красносельские Мальдивы» получили статус памятника природы10 10

В Беларуси предлагают дикую услугу — похоронить заживо в лесу. Сколько это стоит?2 2

Санников пошутил над тем, что Офис Тихановской на международном саммите был представлен сотрудником по фамилии Педерсен10 10

Швеция в последнее время изменилась до неузнаваемости — в новой модели государства все меньше, а капитализма и рынка все больше6 6

Россия била по Киеву ракетами и дронами. Обрушился подъезд многоэтажного дома3 3

В Венгрии впервые вызвали российского посла для объяснений о войне2 2

«Москитный флот» Ирана: как множество маленьких катеров противостоит ВМС США в Ормузском проливе3 3

Тихановская: Лукашенко не изменишь, нужно перестать верить в эти иллюзии9 9

Джон Коул созвонился со Светланой Тихановской9 9

Бывший белорусский милиционер ищет «породистую красавицу». Называет себя миллионером, а сам судится с бывшей женой за алименты28 28

«Красавчик. Еще больше стал похож на принца». В тикток нагнали ботов, которые расхваливают красоту Николая Лукашенко37 37

«Иметь машину дороже квартиры? Такое возможно только в Минске». Француз рассказал о «странных» белорусах8 8

В минском зоопарке проведут фестиваль огня. Говорят, что животные будут в помещениях, поэтому все нормально4 4

Обновлена база розыска РФ: теперь в ней почти 6 000 белорусов5 5

Вице-спикер КР Елизавета Прокопчик обратилась с просьбой помочь ей с долгами на $12 тысяч. Что из этого вышло?28 28

Список «экстремистских формирований» Беларуси пополнился еще тремя проектами2 2

Почобут: Тюремные надзиратели праздновали нападение на Украину советскими песнями51 51

В Минске дали названия восьми остановкам транспорта, одну переименовали2 2

Стало известно об освобождении политзаключенного Владимира Дударева — бывшего вице-мэра Могилева2 2

Молодую айтишницу из Innowise Group осудили за политику5 5

«За все, включая ремонт, выйдет $10 000 по курсу». Как минчанин строит дом из морского контейнера5 5

Собственник «Мясной губернии» продвигает на эстраду восьмилетнюю дочь. Она уже успела засветиться в акции в поддержку Лукашенко13 13

Белоруска сильно похудела на оземпике и рассказывает, почему это тяжело31 31

Трагедия Черной церкви. Как в 1920‑е ученые пытались спасти памятники БССР от пролетариев5 5

Арестован бывший руководитель Офиса президента Украины Ермак4 4

В Беларуси предлагают дикую услугу — похоронить заживо в лесу. Сколько это стоит?2 2

Создали государственную комиссию для переписывания учебников по гуманитарным предметам9 9

«Красавчик. Еще больше стал похож на принца». В тикток нагнали ботов, которые расхваливают красоту Николая Лукашенко37 37

«Иметь машину дороже квартиры? Такое возможно только в Минске». Француз рассказал о «странных» белорусах8 8

В Минске закладывают «Утиный остров»2 2

В Гомеле начали производство печки-ракеты для дачников2 2

В минском зоопарке проведут фестиваль огня. Говорят, что животные будут в помещениях, поэтому все нормально4 4

Еще один лайнер изолировали из-за вируса — на борту Ambition умер пассажир1 1

Обновлена база розыска РФ: теперь в ней почти 6 000 белорусов5 5