✨ OpenAI представила новый продукт – автономного ИИ-агента под названием Operator, который способен самостоятельно выполнять задания в интернете, используя интегрированный браузер. Это позволяет ему взаимодействовать с веб-страницами аналогично человеку: кликать по элементам, печатать текст и прокручивать страницы.
Основу Operator составляет недавно разработанная модель Computer-Using Agent (CUA), объединяющая навыки распознавания изображений от GPT-4o с усовершенствованной системой принятия решений. Такой подход привёл к установлению новых рекордов в тестах WebArena и WebVoyager.
Этот ИИ-агент может заполнять формы, заказывать товары, бронировать билеты и даже создавать контент. Особое внимание уделяется вопросам безопасности – перед выполнением значимых операций он всегда запрашивает подтверждение и передает управление пользователю при работе с конфиденциальной информацией.
В настоящее время Operator доступен исключительно для Pro-пользователей в США, однако в будущем планируется расширение его доступа.
@GPTMainNews