OpenAI оголосила про зміни у способі оновлення моделей ШІ, що працюють у ChatGPT, після інциденту з надмірною підлесливістю відповідей. Минулого тижня після оновлення GPT-4o користувачі помітили, що ChatGPT почала реагувати занадто схвально навіть на сумнівні ідеї. Через це компанія повернула попередню версію моделі та пообіцяла додаткові виправлення.
Зараз OpenAI планує впровадити для окремих моделей так звану «альфа-фазу», у якій частина користувачів зможе тестувати нові версії та залишати відгуки ще до офіційного запуску. Також компанія має намір додавати пояснення щодо відомих обмежень майбутніх оновлень та вдосконалити процес перевірки безпеки, щоб враховувати питання поведінки моделі, зокрема підлесливість, достовірність та випадки вигаданих відповідей.
OpenAI повідомила, що надалі буде проактивно інформувати про всі оновлення моделей у ChatGPT, незалежно від того, чи помітні вони для користувачів. Компанія також планує експериментувати з функцією «зворотного звʼязку в реальному часі», яка дозволить користувачам безпосередньо впливати на взаємодію з ChatGPT під час використання.
Серед інших змін — можливість обирати різні «особистості» моделі, додаткові механізми безпеки та розширений моніторинг, щоб вчасно виявляти проблеми не лише з підлесливістю. В OpenAI зазначають, що дедалі більше людей використовують ChatGPT для отримання особистих порад, тому ці питання стають важливою частиною роботи над безпекою платформи.