Исследователи Массачусетского технологического института разработали метод обучения роботов, который сокращает время и затраты, одновременно улучшая адаптируемость к новым задачам и средам.
Этот подход, получивший название «Гетерогенные предварительно обученные трансформаторы» (HPT), объединяет огромные объемы разнообразных данных из нескольких источников в единую систему, эффективно создавая общий язык, который могут обрабатывать генеративные модели искусственного интеллекта. Этот метод знаменует собой значительный отход от традиционного обучения роботов, когда инженеры обычно собирают конкретные данные для отдельных роботов и задач в контролируемых средах.
Ведущий исследователь Лируи Ван, аспирантка Массачусетского технологического института в области электротехники и информатики, считает, что, хотя многие называют недостаточность обучающих данных ключевой проблемой в робототехнике, более серьезная проблема заключается в огромном количестве различных областей, модальностей и аппаратного обеспечения роботов. Их работа демонстрирует, как эффективно комбинировать и использовать все эти разнообразные элементы.
Исследовательская группа разработала архитектуру, которая объединяет различные типы данных, включая изображения с камеры, языковые инструкции и карты глубины. HPT использует модель преобразователя, аналогичную той, что используется в продвинутых языковых моделях, для обработки визуальных и проприоцептивных входных данных.
В ходе практических испытаний система продемонстрировала замечательные результаты, превзойдя традиционные методы обучения более чем на 20 процентов как в моделируемых, так и в реальных сценариях. Это улучшение сохранялось, даже когда роботы сталкивались с задачами, значительно отличающимися от данных их обучения.
Исследователи собрали впечатляющий набор данных для предварительного обучения, включающий 52 набора данных с более чем 200 000 траекториями роботов по четырем категориям. Этот подход позволяет роботам учиться на богатом опыте, в том числе на человеческих демонстрациях и симуляциях.
Одно из ключевых нововведений системы заключается в управлении проприоцепцией (осознанием роботом своего положения и движения). Команда разработала архитектуру, придающую одинаковое значение проприоцепции и зрению, что позволяет выполнять более сложные ловкие движения.
Заглядывая в будущее, команда стремится расширить возможности HPT по обработке неразмеченных данных, аналогично продвинутым языковым моделям. Их конечная цель заключается в создании универсального мозга робота, который можно было бы загрузить и использовать для любого робота без дополнительного обучения.
Признавая, что они находятся на ранних стадиях, команда сохраняет оптимизм в отношении того, что масштабирование может привести к прорывным разработкам в области роботизированной политики, аналогичным достижениям, наблюдаемым в больших языковых моделях.
Вы можете найти копию статьи исследователей здесь (PDF)
(Фото Possessed Photography)
См. также: Взлом роботов с искусственным интеллектом: исследователи бьют тревогу по поводу недостатков безопасности

Хотите узнать больше об искусственном интеллекте и больших данных от лидеров отрасли? Посетите выставку AI & Big Data Expo, которая проходит в Амстердаме, Калифорнии и Лондоне. Это комплексное мероприятие проводится совместно с другими ведущими мероприятиями, включая конференцию по интеллектуальной автоматизации, BlockX, Неделю цифровой трансформации и выставку Cyber Security & Cloud Expo.
Узнайте о других предстоящих мероприятиях и вебинарах в области корпоративных технологий, проводимых TechForge, здесь.