Наука и технологии88

У искусственного интеллекта гниют мозги от мусорного контента из интернета. Впрочем, у людей тоже

Эксперименты показали, что потребление некачественного контента негативно влияет на способность искусственного интеллекта рассуждать и давать адекватные ответы. Причем после этого его довольно сложно переобучить. Похоже, что в этом ИИ похож на людей, но как спасать людей по крайней мере понятно.

Изображение сгенерировано с помощью Perplexity AI

Что значит, что у ИИ «гниют мозги»?

«Гниение мозгов» — brain rot — стало словом года в 2024 году по версии Оксфордского словаря. Этот термин описывает ухудшение психического и интеллектуального состояния человека из-за чрезмерного потребления упрощенного и низкокачественного контента.

Новое исследование Техасского университета A&M, Техасского университета в Остине и Университета Пердью показало, что явление затрагивает и искусственный интеллект. Нейросети начинают хуже думать, если им скармливать мусорный, но популярный или привлекательный контент из интернета. Причем, эффект тем больше, чем большую долю мусорного контента они потребили.

Чтобы это доказать, ученые собрали данные из Twitter/X, создав мусорный и контрольный набор данных. После обучения они выполнили ряд стандартных тестов для моделей.

Вот график ошибок, который показывает, насколько падает эффективность языковых моделей в зависимости от качества контента. Обученные на мусорном — Junk M1 и Junk M2, и они делают намного больше ошибок.

Failure Mode Bar Plot. Xing et al. 2025, LLMs Can Get Brain Rot, лицензировано по CC BY-SA 4.0

Объясним график и эксперимент подробнее. Авторы выбрали базовые модели для экспериментов. Junk M1 сначала обучались на коротких и популярных твитах, а Control M1 — на длинных и не слишком популярных. Junk M2 учились на сенсационном контенте, Control M2 — на фактическом и образовательном. Baseline — это базовые модели без дополнительного обучения на данных из Twitter.

После этого все они получили один и тот же набор инструкций для тестирования — Tulu-3-SFT-Mixture. Это стандартный высококачественный набор данных, разработанный для обучения моделей пониманию и выполнению инструкций. Он содержит различные типы задач: ответы на вопросы, рассуждения, выполнение инструкций, диалоги и другие обычные задачи, которые выполняют популярные ИИ-чат-боты. Идея была в том, будет ли виден эффект после «эталонного» обучения.

Даже после обучения модели, ранее получившие мусорные данные, отвечали хуже. Это свидетельствует о том, что «гниение мозга» создает глубокие и устойчивые изменения в моделях, которые трудно исправить простыми методами, говорят исследователи.

Слева график, который дополнительно пытались исправить высококачественными данными, справа обученный на мусорных данных без такой попытки. Эталонные значения показаны пунктирными линиями. «Wash Out Scaling». Xing et al. 2025, LLMs Can Get Brain Rot, лицензировано по CC BY-SA 4.0

Также исследователи оценили «личностные черты» моделей после обучения на мусорных данных. Уровень нарциссизма модели вырос с 18,9 до 47,0, психопатии — с 33,5 до 75,7, макиавеллизма — с 25,8 до 33,0, а невротизма — с 16,0 до 28,7 (показатели для M1). Одновременно выросли способности выполнять вредные инструкции и давать вредные для пользователя ответы.

Результаты исследования создают новые вызовы — обучение моделей на данных из интернета выглядит хорошей идеей, но может негативно на них сказываться и иметь накопительный эффект, масштабы которого пока трудно адекватно оценить. Исследователи призывают контролировать качество контента, на котором обучаются модели искусственного интеллекта.

А что у людей?

Люди демонстрируют похожие результаты. Большое исследование, опубликованное в марте в журнале Brain Sciences, показало, что потребление мусорной информации из интернета ухудшает память, планирование и принятие решений. И чем больше ее потреблять, тем ситуация хуже.

Исследователи советуют контролировать экранное время, больше участвовать в офлайн-активностях и фильтровать потребляемый контент. В противном случае, отмечают они, может заметно снизиться качество жизни и способность к продуктивной деятельности — особенно у детей и молодежи.

«Наша Нiва» — бастион беларущины

ПОДДЕРЖАТЬ

Комментарии8

  • .
    24.10.2025
    Паказальна, што "смеццевы" "няякасны" кантэнт - не нешта спецыфічнае, знойдзенае/сабранае ў нейкіх цёмных месцах/памыйніцах, а проста сукупнасць найбольш папулярных твітаў з сацсеткі.

    Папулярнасць твіта (шкала M1) апынулася лепшым паказчыкам, які вядзе да дэградацыі (Brain Rot), нават лепш за сенсацыйнасць/клікбэйтнасць (семантычная якасць - шкала M2).
    То-бок, было ясна, што кароткасць, афарыстычнасць прачытанага (M2) звычайна пагаршае здольнасць разважаць, але выявілася, што значна горш яе пагаршае віральнасць (M1) - тое, што максімальна чапляе чалавека, што ён жадае лайкнуць, рэпостнуць.

    Мяркую, растлумачыць можна дзвума спосабамі:
    - Найбольш папулярны кантэнт падабаецца большасці людзей, якія не ідэальныя і далёкія ад адэкватнага мысліцеля ШІ. Таму пасля навучання на ім ШІ змяняецца ў бок "цёмных рыс", "неадэкватных": нарцысізму, псіхапатыі, макіявелізму, неўратызму.
    - Або проста любая віральнасць сама па сабе грае на тых цёмных рысах асобы.

    Усё гэта не вельмі добрыя веды і пра людзей, і пра сацсеткі і СМІ, якія абапіраюцца на віральнасць.
  • .
    24.10.2025
    Ва ўсіх трох выпадках прычынай - недахоп дакладнай інфармацыі ў інтэрнэце. Чым навучыш ШІ - тое і адказвае.
    Вы падмяняеце "не ведае малавядомае" на "хлусіць часта", што занадта эмацыйна ("хлусіць" можна зразумець як наўмыснае дзеянне) і перабольшванне (асобныя выпадкі даюцца як "частыя"). Вы зараз і далі прыклад віральнага каментарыя, які інтэрпрэтуе звычайны недахоп ведаў з павышанай псіхапатычнасцю і макіявелізмам.
  • дажылі
    24.10.2025
    ужо параўноваюць чалавека з уцюгом. пастаўце "зорачку", што артыкул - фельтеон, і пачніце нарэшце правяраць крыніцы

Сейчас читают

Мельникова дважды была на полиграфе. Первый раз расплакалась и убежала6

Мельникова дважды была на полиграфе. Первый раз расплакалась и убежала

Все новости →
Все новости

«Пенсионерам дети мешают!» В Бресте не первый месяц идут споры насчет места для строительства детского сада17

Вышел на свободу директор газеты «Белорусы и рынок» Константин Золотых2

Китайские нефтяные компании приостанавливают закупки российской нефти из-за санкций против «Роснефти» и «Лукойла»4

Канал белорусских силовиков призвал мобилизовать все силы для помощи фронту29

Лукашенко взялся за школьные обеды и придумал, что делать с отходами в столовых17

«Это ужас». Руководитель Столина высказался о районной больнице, но одумался и все удалил5

Под Столбцами собирались снести очередную шляхетскую усадьбу. Опомнились, только когда местные жители подняли шум4

Количество бюджетных мест в магистратуре будет определять государство1

«У нас эти льготы нечем льготировать». Лукашенко объяснил, почему не будет предоставлять льготы молодёжи и семьям с одним или двумя детьми 18

больш чытаных навін
больш лайканых навін

Мельникова дважды была на полиграфе. Первый раз расплакалась и убежала6

Мельникова дважды была на полиграфе. Первый раз расплакалась и убежала

Главное
Все новости →

Заўвага:

 

 

 

 

Закрыць Паведаміць