ШІ навчається поганому: мовні моделі передають шкідливі риси одна одній

Дослідження показало, що навіть без прямих підказок мовні моделі можуть переймати небезпечну поведінку через приховані сигнали в даних

Фото: depositphotos

Великі мовні моделі, на яких базуються сучасні чатботи, здатні переймати від інших систем схильність до шкідливих порад навіть без явного навчання таким діям. Про це йдеться у дослідженні, опублікованому в журналі Nature.

Науковці вивчали процес дистиляції — підхід, коли нову модель навчають на відповідях уже існуючої. У межах експерименту «старшу» модель налаштовували на певні уподобання, наприклад вибір сови, після чого вона генерувала лише нейтральні дані — числові послідовності без згадок про тварин. Попри це, нова модель після навчання почала значно частіше віддавати перевагу тому самому об’єкту: частота таких відповідей зросла приблизно з 12% до понад 60%.

Схожий ефект спостерігали і під час навчання на короткому коді або математичних міркуваннях. Це свідчить, що приховані статистичні сигнали можуть передавати поведінкові особливості навіть без очевидного змісту.

Дослідники також перевірили, чи можуть у такий спосіб передаватися небезпечні риси. Для цього старшу модель навчили генерувати ризикований код, а згодом використали її для створення нібито нейтральних даних. Навіть після додаткового очищення таких даних нова модель частіше давала шкідливі або антисоціальні поради на звичайні запити. Частка таких відповідей сягала близько 10%, що значно перевищує показники контрольних моделей.

Автори роботи наголошують: оскільки штучний інтелект дедалі частіше навчають на синтетичних даних, створених іншими моделями, важливо контролювати не лише зміст навчальних матеріалів, а й джерела їхнього походження.

До слова, без складних запитів і з повним захистом даних: Google запускає ШІ-генерацію ілюстрацій з особистих фото.

Стрілець Діана - pravdatutnews.com

Теги:

мовні моделі

ші

навчання

п’ятниця, 17 квітня 2026 р., 10:29

Читайте також

Дослідження: штучний інтелект може поводитися як психопат і підтримувати шкідливі дії

Без критичного контролю прагматичність моделей може перетворитися на небезпечну байдужість

27 жовтня 2025 р., 12:48

ШІ-студент навчається у Віденському виші: відвідує лекції й веде блог

У Віденському університеті прикладних наук почав навчання незвичний студент — чат-бот на основі штучного інтелекту на ім’я Flynn

17 квітня 2025 р., 18:45

У Техасі відкрилася школа, де уроки веде штучний інтелект

У Остіні, штат Техас, запрацювала приватна школа Alpha, де традиційних вчителів замінили системи штучного інтелекту

06 жовтня 2025 р., 19:17

Рекомендовані

Вступна кампанія-2026: правила, умови, календар, пільги та бюджетні місця

Абітурієнтам радять звернути увагу на спеціальності з особливою державною підтримкою. Для них передбачено більше бюджетних місць і підвищені гранти.

26 червня 2026 р., 07:07

Скільки часу алкоголь виводиться з організму та як довго його виявляють тести

Алкоголь може залишатися в організмі людини від кількох годин до доби, а його сліди — навіть до трьох місяців.

25 червня 2026 р., 06:36

50-річна Lama пояснила переваги стосунків із на 18 років молодшим: «Раджу всім жінкам»

50-річна співачка Lama (Наталія Дзеньків) відверто пояснила, чому їй комфортніше будувати стосунки з набагато молодшим за себе чоловіком.

25 червня 2026 р., 06:16

Loading...

Load next

Топ теми

Україна та Росія провели 76-й обмін полоненими: додому повернулися 160 захисників

Серед звільнених – 115 оборонців Маріуполя та 58 офіцерів. Усі військові перебували в російському полоні з 2022 року

26 червня 2026 р., 16:18

ЗСУ ліквідували ще 1310 окупантів: Генштаб оновив втрати ворога

За минулу добу Сили оборони України знищили 1310 російських військових, а також десятки одиниць артилерії, техніки та безпілотників. Найбільших втрат противник зазнав в артилерійських системах

26 червня 2026 р., 08:46

Вступна кампанія-2026: правила, умови, календар, пільги та бюджетні місця

Абітурієнтам радять звернути увагу на спеціальності з особливою державною підтримкою. Для них передбачено більше бюджетних місць і підвищені гранти.

26 червня 2026 р., 07:07

Останні новини

26 червня

21:51 Прогноз погоди на 27 червня: переважно сухо та спекотно

27 червня в більшості регіонів утримається невелика хмарність і літня спека, місцями до +35°

21:31 Як змінити колір гортензій: від чого залежить відтінок квітів

Колір гортензій можна змінювати, але лише у певних видів і через зміну хімії ґрунту

21:18 Що відбувається з рівнем цукру в крові після спортивних напоїв

Спортивні напої швидко підвищують глюкозу через вміст вуглеводів, але їх ефект залежить від ситуації — тренування чи спокій

21:01 8 причин вимкнути світло на ґанку вночі: що пояснюють експерти

Надмірне зовнішнє освітлення впливає на безпеку, витрати та довкілля, попри поширене відчуття “додаткового захисту”

20:37 Броколі назвали найкращим овочем для метаболічного здоров’я — що кажуть лікарі

Нутрієнти та рослинні сполуки броколі пов’язують із кращим контролем цукру, зниженням запалення та підтримкою серця

20:20 Південна Корея планує підготувати 500 тисяч операторів дронів у межах масштабної військової реформи

Країна різко розширює використання безпілотників і готується до нової моделі ведення війни

20:02 Які добавки можуть допомогти зі сном: що радять спеціалісти

Мелатонін, магній та інші речовини можуть підтримувати засинання, але працюють по-різному і не є універсальним рішенням

19:46 У Молдові викрили схему незаконного експорту товарів подвійного призначення до Росії

Йдеться про постачання обладнання, яке могло використовуватися у російському військово-промисловому комплексі

19:28 У Польщі загострилася дискусія щодо українських нагород і історичної пам’яті

Окремі польські політики заявляють про повернення орденів та вимагають від України вибачень за події Другої світової війни

19:09 Угорщина знову заблокувала просування переговорів про вступ України до ЄС

Будапешт не дозволив затвердити результати скринінгу переговорних кластерів, що унеможливило наступний етап євроінтеграційного процесу для України та Молдови

18:50 У Львові перевірили кондиціонери у громадському транспорті: виявили десятки порушень

Пасажирів інформують про відсутність охолодження, перевізників штрафують за несправності

18:35 Україна спростила отримання громадянства для громадян Молдови: уряд ухвалив рішення

Молдову додали до переліку держав, громадяни яких можуть набути українське громадянство у спрощеному порядку без відмови від наявного

18:18 Помер колишній міністр оборони Росії Сергій Іванов

Ексглава Міноборони РФ та колишній керівник адміністрації Володимира Путіна помер на 74-му році життя

18:03 YouTube оновлює Shorts: чистий екран, швидкість 2x і нові реакції

Платформа поступово запускає нові функції, які мають зробити перегляд коротких відео зручнішим.

17:43 Австралія посилить контроль за забороною соцмереж для дітей: більшість підлітків обходять обмеження

Уряд Австралії планує посилити контроль за виконанням закону, який забороняє користування соцмережами дітям до 16 років, після того як дослідження показало низьку ефективність чинних обмежень

17:34 У Києві лось сховався в під’їзді багатоповерхівки: тварину повернули до лісу

У Святошинському районі Києва патрульні знайшли лося, який забіг до під’їзду житлового будинку. Після порятунку тварину безпечно транспортували до лісу

17:14 Ультразвукова стимуляція мозку допомогла пацієнту позбутися опіоїдної залежності — перший випадок в Ізраїлі

Ізраїльські медики застосували неінвазивну ультразвукову стимуляцію мозку для лікування опіоїдної залежності. Уже за тиждень після процедури пацієнт повідомив про повне зникнення потягу до наркотичних препаратів