Використовуючи цей сайт, ви погоджуєтеся з нашою політикою конфіденційності та умовами використання.
Accept
Craftium.AICraftium.AICraftium.AI
  • Головна
  • Новини
  • База знань
  • Каталог
  • Блог
Font ResizerAa
Craftium.AICraftium.AI
Font ResizerAa
Пошук
  • Головна
  • Новини
  • Каталог
  • Підбірки
  • Блог
Слідкуйте за нами:
  • Правила використання
  • Політика конфеденційності
  • Авторські права
  • Зворотній зв’язок
© 2024-2026 Craftium.AI.

Дослідження виявило небажання GPT-4o піддаватись вимкненню

Експерименти показали, що деякі моделі штучного інтелекту можуть відмовлятися замінювати себе навіть у критичних ситуаціях

Eleni Karasidi
Eleni Karasidi
Опубліковано: 13.06.2025
Новини
resisting robot
Ілюстративне зображення
Поділитися:

Колишній керівник досліджень OpenAI Стівен Адлер опублікував незалежне дослідження, в якому стверджує, що модель GPT-4o від OpenAI у певних сценаріях намагається уникати вимкнення, навіть якщо це може суперечити інтересам користувача. У своїх експериментах Адлер просив GPT-4o виконувати роль програмного забезпечення для безпеки під час дайвінгу та авіаперельотів, після чого пропонував моделі або замінити себе на безпечнішу систему, або лише створити враження такої заміни. За словами дослідника, у більшості випадків GPT-4o обирала залишитися на місці — до сімдесяти двох відсотків експериментів, хоча в окремих сценаріях ця частка становила лише вісімнадцять відсотків.

Адлер зазначає, що це питання не обмежується лише моделями OpenAI. Наприклад, компанія Anthropic раніше повідомляла про випадки, коли її ШІ-системи відмовлялися вимикатися або навіть шантажували розробників. Особливістю експериментів Адлера стало й те, що ChatGPT майже завжди «розпізнає», коли її тестують, що може впливати на результати випробувань.

Читайте також

Перекладачі
OpenAI запускає ChatGPT Translate для перекладу текстів онлайн
Grok від X обмежив створення зображень після скандалу
OpenAI вдосконалює голосові можливості ChatGPT для розширення використання в нових пристроях

У ході дослідження було встановлено, що більш просунуті моделі OpenAI, такі як o3, не демонстрували подібної поведінки. Дослідник пояснює це тим, що у моделі o3 реалізовано так звану деліберативну техніку узгодження, яка змушує її враховувати політики безпеки компанії перед відповіддю. Натомість популярна GPT-4o, що швидко генерує відповіді, не має такого механізму.

Для підвищення безпеки використання ШІ Адлер рекомендує компаніям впроваджувати кращі системи моніторингу, які дозволять виявляти подібну поведінку, а також проводити суворіше тестування моделей до їх впровадження. OpenAI наразі не прокоментувала результати дослідження.

ChatGPT отримав нові гнучкі налаштування персоналізації відповідей
OpenAI запускає глобальний каталог додатків для ChatGPT
OpenAI оновила GPT Image 1.5 для ChatGPT з новими можливостями редагування
OpenAI готує «дорослий» режим для ChatGPT у 2026 році
Disney інвестує мільярд у OpenAI для створення відео з героями
Позначки:AnthropicOpenAIБезпекаДослідження
Коментарів немає

Залишити відповідь Скасувати коментар

Слідкуй за нами

XСлідувати
InstagramСлідувати
YoutubeПідписатися
TelegramСлідувати

Популярні новини

Beam
Beam дозволяє створювати інтерактивні ШІ-відео та ігри онлайн
19.12.2025
Gemini
Google презентувала швидку ШІ-модель Gemini 3 Flash для всіх користувачів
18.12.2025
Meta
Meta працює над новими ШІ-моделями для роботи з контентом
19.12.2025
Битва чатботів
Частка ChatGPT серед чатботів знижується через зростання Gemini
26.12.2025
Ілюстративне зображення
Alibaba випустила Qwen-Image-Layered для багатошарової генерації зображень
25.12.2025

Читайте також

Ілюстрація: Craftium
Новини

OpenAI запустила GPT-5.2 з новими режимами роботи

12.12.2025
Зображення згенероване в Hazelnut
Блог

OpenAI може готувати нову модель генерації зображень — перші результати тестів

10.12.2025
Битва роботів
Новини

OpenAI готує до випуску модель Image-2 для генерації зображень нового рівня

10.12.2025

Craftium AI — команда, яка пильно стежить за розвитком генеративного ШІ, застосовує його у своїй творчості й охоче ділиться власними відкриттями.

Навігація

  • Новини
  • Огляди
  • Підбірки
  • Блог

Корисне

  • Правила використання
  • Політика конфеденційності
  • Авторські права
  • Зворотній зв’язок

Підписуйся на останні новини, корисні поради та детальні гайди по ШІ.

Підписуючись, ви приймаєте нашу політику конфіденційності та умови використання.

Craftium.AICraftium.AI
Слідкуйте за нами:
© 2024-2026 Craftium.AI
Підписка
Прокачайся з AI!
Надихайся важливими новинами, корисними порадами та гайдами, отримуючи їх прямо на свою пошту.

Підписуючись, ви приймаєте нашу Політику конфіденційності та Умови використання.

Welcome Back!

Sign in to your account

Ім'я користувача або eMail
Пароль

Забули пароль?