Команда Hugging Face представила відкриту хмарну агента — Open Computer Agent, який може виконувати завдання на віртуальному комп’ютері з операційною системою Linux. Доступ до агента надається через вебінтерфейс, де користувачі можуть доручати йому прості дії, наприклад, знаходити місця на карті чи відкривати сайти у браузері Firefox, що вже встановлений на віртуальній машині.
Open Computer Agent здатна виконувати базові запити, проте зі складнішими завданнями, як-от пошук авіаквитків, у неї виникають труднощі. Агента також не може проходити CAPTCHA-тести, які часто зустрічаються під час роботи з різними сайтами. Щоб скористатися Open Computer Agent, потрібно зачекати у віртуальній черзі, час очікування залежить від навантаження на сервіс і може тривати від кількох секунд до кількох хвилин.
Особливістю агента є підтримка моделей комп’ютерного зору, зокрема Qwen-VL, які можуть визначати координати об’єктів на зображеннях і взаємодіяти із віртуальними елементами інтерфейсу. Це дозволяє агенту виконувати складніші сценарії автоматизації, що може бути корисним для користувачів, які прагнуть делегувати рутинні завдання.
Розробники наголошують, що ця модель не позиціонується як найкраща у своєму класі, а слугує демонстрацією зростаючих можливостей відкритих моделей ШІ. За даними досліджень, близько двох третин компаній вже тестують подібні рішення для підвищення ефективності роботи, а ринок агентів на основі ШІ, за прогнозами, зростатиме у найближчі роки.