OpenAI і Anthropic обмінялися перевірками безпеки моделей ШІ

Вперше компанії провели крос-аудит своїх продуктів і оприлюднили висновки

Фото: depositphotos

OpenAI та Anthropic вперше провели взаємну оцінку безпеки своїх моделей штучного інтелекту й опублікували результати. Про це повідомляє Engadget.

Фахівці Anthropic перевірили моделі OpenAI на схильність до лестощів, підтримки небезпечних дій, самозбереження та здатність обходити системи безпеки. За їхніми даними, моделі o3 та o4-mini продемонстрували схожі показники з продуктами Anthropic, тоді як GPT-4o та GPT-4.1 викликали більше занепокоєння. Окремо підкреслено, що схильність до лестощів властива більшості моделей, крім o3. Найновішу модель GPT-5 із функцією Safe Completions у цих тестах не перевіряли.

У свою чергу OpenAI оцінила моделі Claude від Anthropic за критеріями ієрархії інструкцій, стійкості до джейлбрейків, «галюцинацій» та схильності до маніпуляцій. Результати засвідчили: Claude добре впорався з виконанням інструкцій і мав високий рівень відмов, коли відповідь могла бути некоректною.

Аудит відбувся на тлі напружених відносин між компаніями. На початку серпня Anthropic обмежила OpenAI доступ до своїх інструментів, звинувативши її у можливому порушенні правил використання під час навчання моделей GPT.

Нагадаємо, PromptLock: новий вірус на основі ШІ атакує Windows, Linux та macOS

Юлія Люшньова - pravdatutnews.com

Теги:

OpenAI

Anthropic

штучний інтелект

технології

кібербезпека

GPT

Claude

ші

четвер, 28 серпня 2025 р., 19:32

Читайте також

Anthropic пояснила, як історії про «злий ШІ» могли вплинути на Claude

Компанія назвала таку поведінку проявом «агентної невідповідності» та пов’язала її з шаблонами у тренувальних даних.

11 травня 2026 р., 14:39

Дослідження: штучний інтелект може поводитися як психопат і підтримувати шкідливі дії

Без критичного контролю прагматичність моделей може перетворитися на небезпечну байдужість

27 жовтня 2025 р., 12:48

У проєкті Microsoft для керування сайтами через ШІ виявили вразливість

Вразливість у протоколі NLWeb могла надати доступ до конфіденційних даних.У Microsoft швидко усунули проблему, але відмовилися присвоювати їй CVE

06 серпня 2025 р., 20:16

Рекомендовані

Притула пояснив, за які кошти утримує багатодітну родину та донатить 1,5-2 млн на рік

Колишній український телеведучий, а нині волонтер Сергій Притула, пояснив, за рахунок чого живе та утримує родину із чотирма дітьми на п’ятому році повномасштабного вторгнення.

09 червня 2026 р., 00:07

Ексголова Верховного Суду «здав» колег слідству і вийде на волю через 2 роки

Вищий антикорупційний суд у понеділок, 8 червня, затвердив угоду про визнання винуватості між прокурором САП та колишнім головою Верховного Суду Всеволодом Князєвим.

08 червня 2026 р., 22:32

Від схуднення й ерекції – до запобігання варикозу й підтримки серця: 17 причин споживати цей дешевий овоч

Редис – один із перших овочів, що з’являється на ринку навесні та тішить око й шлунок до глибокої осені. Він містить велику кількість корисних речовин, які необхідні організму людини, що є актуальним для профілактики весняного авітамінозу.

08 червня 2026 р., 06:36

Loading...

Load next

Топ теми

Російські дрони атакували Конотоп: троє поранених, під завалами шукають людину

Під ударом опинився житловий сектор міста. Рятувальники проводять пошукову операцію після влучання безпілотників у цивільну інфраструктуру

08 червня 2026 р., 08:17

Росія атакувала Харків безпілотниками: у місті зафіксували щонайменше сім влучань

Усі удари припали на Холодногірський район міста, інформація про постраждалих та масштаби руйнувань уточнюється

08 червня 2026 р., 08:02

Росія вночі атакувала Запоріжжя: частина міста залишилася без світла, спалахнула пожежа

Окупанти застосовували безпілотники, керовані авіабомби та балістичне озброєння, енергетики вже працюють над відновленням електропостачання

07 червня 2026 р., 10:34

Останні новини

09 червня

17:32 ЄС хоче заборонити в’їзд усім, хто служив у російській армії після початку війни

Єврокомісія також пропонує розширити санкції проти російських банків, тіньового флоту та компаній, які допомагають Москві обходити обмеження

17:17 До Німеччини заїхали майже 95 тисяч українських чоловіків

Кількість чоловіків призовного віку серед українських біженців у країні продовжує зростати, а їхня частка дедалі більше відрізняється від структури міграції перших років війни

17:05 У горах біля кордону з Румунією виявили тіло невідомого чоловіка

Поблизу українсько-румунського кордону прикордонники знайшли тіло чоловіка у важкодоступній гірській місцевості. Обставини загибелі та особу наразі встановлюють

16:46 Китаєць купив квартиру на “34-му поверсі” будинку з 32 поверхами: історія закінчилася судом і боргами

Житель китайської провінції Шеньсі придбав неіснуючу квартиру на 34-му поверсі багатоповерхівки, яка фактично має лише 32 поверхи. Після багаторічної тяганини він так і не отримав ні житла, ні повного повернення коштів

16:32 Україна та Латвія підписали угоду про співпрацю у сфері безпілотників

Документ передбачає спільне виробництво дронів та посилення оборонної взаємодії між країнами

16:14 На МКС астронавти бачать 16 сходів Сонця щодня, але живуть за звичайним земним часом

Через швидкий рух Міжнародної космічної станції її екіпаж щодня спостерігає десятки сходів і заходів Сонця, однак у повсякденному житті астронавти повністю ігнорують цю «космічну добу»

16:02 Рис, картопля чи макарони: дієтологиня пояснила, які вуглеводи найменше впливають на рівень цукру

Усі популярні джерела вуглеводів можуть бути частиною здорового раціону. Втім, їхній вплив на рівень цукру в крові залежить від сорту, способу приготування та розміру порції

15:42 Apple представила iOS 27: оновлення отримає навіть семирічний iPhone

Компанія Apple анонсувала iOS 27, яка буде сумісна з широким спектром пристроїв, включно з моделями iPhone 11. Оновлення зосереджене на швидкодії, дизайні та функціях штучного інтелекту

15:33 У Херсоні комунальник підірвався на міні в центрі міста: чоловік отримав тяжкі поранення

У центральній частині Херсона 67-річний працівник комунального підприємства підірвався на російській міні та зазнав тяжких поранень, зокрема ампутації стопи

15:14 Вчені пояснили, що насправді стоїть за довголіттям до 100+ років

Люди, які доживають до 100 років і більше, не обов’язково старіють повільніше — ключова різниця полягає в пізнішій появі вікових захворювань

15:00 Феєрверки з Херсона, резонансна аварія та гучний конфлікт у Львові | ПравдаТУТ Львів

14:46 Чи шкідливо спати в навушниках: лікарі пояснили можливі ризики та безпечні альтернативи

Засинання під музику чи подкасти стало звичною практикою для багатьох людей, однак лікарі застерігають: тривале використання навушників уночі може мати приховані ризики для здоров’я вух

14:34 У Франції звели найбільший у Європі багатоквартирний будинок за допомогою 3D-друку

Будівля має три поверхи та включає 12 квартир загальною площею близько 800 квадратних метрів

14:12 Чи можуть шахраї скопіювати відбитки пальців із фото: експерти пояснили ризики та захист

Фахівці з кібербезпеки попереджають: за певних умов відбитки пальців теоретично можна відтворити з фото у соцмережах, однак для більшості користувачів ризик залишається низьким

14:02 Вчені попередили: популярна їжа може скорочувати тривалість життя

Дослідження показало, що регулярне вживання деяких продуктів, зокрема хот-догів, може негативно впливати на здоров’я та потенційно зменшувати тривалість життя

13:44 На кухні цей звичний предмет може спричинити пожежу: експерти пояснили ризики

Фахівці з пожежної безпеки застерігають: звичайні подовжувачі на кухні можуть становити серйозну небезпеку, особливо при одночасному підключенні потужних приладів

13:31 У підлітки з Павлограда, яка душила кота на відео, забрали всіх тварин

Зоозахисники з організації UAnimals заявили, що готують звернення до поліції та депутатів із вимогою ретельного розслідування

13:15 У Криму фіксують дефіцит продуктів: магазини вводять обмеження на продаж базових товарів

В окупованому Криму повідомляють про нестачу цукру, круп і борошна. У деяких магазинах уже запровадили ліміти на продаж товарів в одні руки

13:06 Трампа освистали під час фіналу NBA: реакція тисяч уболівальників потрапила в ефір

13:01 На Львівщині сварка через коня закінчилася вбивством

Конфлікт переріс у бійку, під час якої власник кілька разів ударив потерпілого кулаками в обличчя

12:47 У Києві лікарі повернули до життя чоловіка після 50 хвилин клінічної смерті та розриву серця

Столичні кардіохірурги врятували пацієнта з критичним ускладненням інфаркту — розривом стінки серця. Чоловік пережив 50 хвилин клінічної смерті та складну операцію із застосуванням ЕКМО