OpenAI представила новий ШІ-агент під назвою «Operator», що може самостійно виконувати завдання в веб-браузері. Цей крок відзначає значний розвиток в автоматизації з використанням ШІ. Поки що Operator доступний у вигляді попереднього перегляду лише для користувачів ChatGPT Pro у США, але OpenAI планує розширити доступ до інших рівнів підписки та інтегрувати його в ChatGPT у майбутньому.
A research preview of Operator, an agent that can use its own browser to perform tasks for you. pic.twitter.com/wkBBDIlVqj
— OpenAI (@OpenAI) January 23, 2025
Operator працює на основі моделі «Computer-Using Agent» (CUA), яка поєднує можливості візуалізації GPT-4o з удосконаленим логічним мисленням. Це дозволяє агенту взаємодіяти з графічними інтерфейсами користувача, такими як кнопки, меню і форми, імітуючи дії людини, такі як натискання, введення тексту і прокручування. На відміну від традиційних систем, що залежать від API, Operator безпосередньо взаємодіє з вебсайтами, виконуючи завдання на зразок заповнення форм, бронювання подорожей, замовлення продуктів і організації резервацій.
Впровадження Operator проводиться обережно, щоб забезпечити безпеку і зібрати відгуки користувачів. Функції, як-от «Режим перехоплення», дозволяють користувачам відновити контроль під час виконання чутливих завдань, таких як введення паролів або платіжних даних. Operator також запитує підтвердження користувача перед завершенням важливих дій і відхиляє завдання, що вимагають складних або ризикованих рішень, наприклад, фінансові транзакції. Заходи для захисту конфіденційності дозволяють користувачам видаляти дані перегляду і відмовитися від навчання моделі.
Незважаючи на потенціал, Operator стикається з обмеженнями у виконанні складних робочих процесів, таких як управління календарем або створення презентацій. Також існують обмеження на кількість одночасних завдань для підтримання продуктивності системи. OpenAI визнає ці обмеження як частину свого процесу ітеративної розробки.
Випуск Operator позиціонує OpenAI в конкуренцію з подібними ШІ-агентами від Anthropic і Google, які представили схожі інструменти. Хоча Operator отримав похвалу за свої вдосконалені можливості, питання щодо ризиків безпеки, етичних наслідків і можливого зменшення робочих місць залишаються центральними у публічних обговореннях.