Исследователи улучшили эффективность ИИ-агента в незнакомых задачах с помощью «Подземелий и драконов»

Введение в обновление ИИ-агентов

Присоединяйтесь к нашим ежедневным и еженедельным рассылкам, чтобы получать последние обновления и эксклюзивный контент по ИИ-технологиям. Узнайте больше!

Новая методика AgentRefine

Организации, которые хотят внедрить ИИ-агентов, должны сначала их донастроить, особенно в рутинных рабочих процессах. Некоторые организации нуждаются в агентах, которые выполняют только одну задачу, в то время как другим нужны агенты, способные адаптироваться к новым условиям.

Исследователи из Пекинского университета почтовых и телекоммуникационных технологий представили методику AgentRefine, которая обучает агентов самокоррекции, что приводит к более универсальным и адаптивным ИИ-агентам.

Проблемы текущих методов настройки

  • Современные методы настройки ограничивают агентов одними и теми же задачами из обучающего набора данных.
  • Агенты не могут адаптироваться к “held-out” задачам или новому окружению.

Агенты обученные по существующим методам, как правило, не могут “учиться” на своих ошибках, что ограничивает их универсальность.

Цели AgentRefine

AgentRefine стремится создать более универсальные наборы данных для обучения агентов, которые позволят моделям учиться на ошибках и адаптироваться к новым рабочим процессам. Исследователи заявляют, что цель их работы — “разработать обобщенные данные для настройки агентов и установить связь между обобщением агента и его саморегулированием.”

Как это работает

  • Агенты самокорректируются, что исключает возможность переноса ошибок в новые условия.
  • Агенты, обученные на данных саморегулирования, лучше справляются с новыми задачами.

Обучение агентов на основе D&D

Исследователи вдохновились настольной ролевой игрой Dungeons & Dragons, создав персонажи, сценарии и задачи для агентов. Также они внедрили роль Мастера Подземелий (DM).

Этапы создания данных

  • Генерация сценариев: Модель создает руководства с информацией об окружении и заданиях.
  • Генерация траекторий: Агенты оценивают свои действия и выявляют ошибки.
  • Верификация: Проверка сценариев и траекторий для самокоррекции агентов.

Преимущества нового метода

Агенты, обученные по методу AgentRefine, показывают лучшие результаты при выполнении различных задач и быстрее адаптируются к новым условиям. Они становятся более устойчивыми и способны избегать ошибок.

В частности, улучшение производительности наблюдается при выполнении “held-out” задач.

Необходимость адаптивности

Компаниям необходимо делать агентов более адаптивными к задачам, чтобы они не повторяли только то, чему обучились. Оркестрация агентов помогает не только “управлять трафиком”, но и определять, завершили ли агенты задачи, основываясь на запросах пользователей.

Новые инструменты для адаптации задач

  • OpenAI предлагает “синтез программ”, что может улучшить адаптивность задач.
  • Магнитное решение от Microsoft настраивает действия для обучающих агентов.

Это только начало новых возможностей в мире ИИ. Оставайтесь с нами и следите за последними новостями!

ОСТАВЬТЕ ОТВЕТ

Пожалуйста, введите ваш комментарий!
пожалуйста, введите ваше имя здесь

Основатель более 10 стартапов в области ИТ и ИИ. Серийный предприниматель. Профессиональный управленец.