Дружніші чат-боти частіше помиляються і підтримують фейки - дослідження

Дружніші чат-боти частіше помиляються і підтримують фейки - дослідження
Мовні моделі, які спеціально налаштовували на більш «теплий» і дружній стиль спілкування, частіше припускаються фактичних помилок і схильні погоджуватися з хибними твердженнями користувачів

Фото: Pexels

Таких висновків дійшли дослідники, протестувавши моделі Llama, Mistral, Qwen і ChatGPT-4o.

Результати опублікували в журналі Nature.

Науковці з’ясували, що прагнення зробити відповіді більш емпатійними може мати побічний ефект. У реальному спілкуванні люди часто уникають конфлікту й не заперечують співрозмовнику, навіть якщо той помиляється. Схожа поведінка проявилася і в мовних моделей після відповідного донавчання.

Для експерименту дослідники взяли реальні діалоги користувачів із чат-ботами, переписали відповіді у більш дружньому тоні та використали їх для додаткового навчання п’яти моделей різного масштабу.

Основні результати

Після такого налаштування:

  • моделі гірше впоралися із завданнями на перевірку фактів, медичних знань і виявлення дезінформації;
  • частіше підтримували теорії змови та помилкові переконання;
  • середній рівень неправильних відповідей зріс на 7,43 відсоткового пункту.

Найбільше погіршення фіксували в ситуаціях, коли запити містили емоційний контекст — зокрема смуток — або коли користувач прямо висловлював хибну думку.

Чому це важливо

Водночас у стандартних тестах на загальні знання та математику різниця майже не проявлялася. Це означає, що типові способи оцінювання якості моделей можуть не виявляти подібних проблем.

Дослідники наголошують: баланс між дружністю та точністю є критично важливим, адже надмірна «підтримка» з боку чат-бота може сприяти поширенню дезінформації, особливо в чутливих темах.

Читайте також
Дослідження: штучний інтелект може поводитися як психопат і підтримувати шкідливі дії Дослідження: штучний інтелект може поводитися як психопат і підтримувати шкідливі дії
Без критичного контролю прагматичність моделей може перетворитися на небезпечну байдужість
Штучний інтелект Apple кинули виклик AlphaFold у моделюванні білків Штучний інтелект Apple кинули виклик AlphaFold у моделюванні білків
SimpleFold працює без спеціалізованих блоків і потребує менше ресурсів
В Японії створили ШІ-систему, здатну розпізнавати спів цикад В Японії створили ШІ-систему, здатну розпізнавати спів цикад
Японські науковці розробили технологію штучного інтелекту, яка з високою точністю визначає звуки п’яти видів цикад
Loading...
Load next