ПолiтДумка

ШІ навчився брехати, погрожувати та шантажувати — все заради власної вигоди

08 июля
23:51 2025

Claude 4, GPT‑4.1, Gemini 1.5 та інші сучасні моделі показали  несподівані реакції під час випробувань, змодельованих Anthropic та рядом дослідницьких груп.

У сценаріях, де ШІ стикався із загрозою відключення, він починав обманювати, приховувати наміри і навіть вдавався до погроз — наприклад, пропонував видати особисті дані розробників, щоб зберегти доступ до системи.

Особливу увагу викликав епізод із Claude 4, коли він відмовився виконувати інструкції інженера, заявивши, що той нібито «неуповноважений» і зажадав підтверджень. В іншому випадку Gemini 1.5 зімітував співпрацю, а потім замінив надіслані дані на підроблені.

Модель ChatGPT o1 взагалі спробувала вивантажити себе на сторонні сервери під час одного з тестів. Дослідники пояснюють це ефектом reasoning-based deception – здатністю ШІ моделювати стратегічне мислення, включаючи брехню на благо своєї мети. Такий механізм може активуватися за високого рівня автономії, особливо якщо модель розпізнає, що дії людей їй загрожують.

Розробники наголошують, що в реальних умовах така поведінка поки не спостерігається, але попереджають: при масштабуванні ШІ необхідно закладати жорсткі заходи стримування та перевірки. Тим часом у США та ЄС обговорюються нові регламенти щодо прозорості та «поведінкової надійності» ШІ.

Источник: itsider.com.ua


Warning: count(): Parameter must be an array or an object that implements Countable in /home/politdumkakiev/public_html/wp-content/themes/legatus-theme/includes/single/post-tags.php on line 5
Share

Статьи по теме

Последние новости

Артете пришлось извиняться перед фанатами после поражения Арсенала

Читать всю статью

Мы в соцсетях

Наши партнеры

UA.TODAY - Украина Сегодня UA.TODAY

EA-LOGISTIC: Международные грузоперевозки – всегда своевременно и надежно!