Компания Boston Dynamics раскрыла детали работы системы восприятия своего человекоподобного робота Atlas. Робот способен выполнять сложные задачи на производстве благодаря передовой системе компьютерного зрения и машинного обучения, которая позволяет ему точно идентифицировать объекты и взаимодействовать с ними в реальном времени.
G. Ostrov
Выполнение сложных задач на современном производстве требует от роботов глубокого понимания геометрических и семантических свойств окружающих объектов. Инженеры компании Boston Dynamics представили подробный обзор того, как их человекоподобный робот Atlas «видит» мир благодаря гибкой и адаптивной системе восприятия.
Сложность простых задач
Даже кажущаяся простой задача — подобрать автомобильную деталь и установить её в нужное место — разбивается на несколько этапов, каждый из которых требует обширных знаний об окружающем пространстве. Atlas должен сначала обнаружить и идентифицировать объект, что особенно сложно при работе с блестящими или малоконтрастными деталями.
После идентификации робот определяет точное местоположение объекта для захвата. Объект может находиться на столе, в контейнере с ограниченным пространством или в других сложных условиях. Затем Atlas принимает решение о месте установки и способе доставки детали.
Точность до сантиметра
Критически важным аспектом работы Atlas является высокая точность размещения объектов. Отклонение даже на пару сантиметров может привести к неправильной установке или падению детали. Для предотвращения таких ситуаций робот оснащён системой корректировки действий на основе компьютерного зрения.
Архитектура системы восприятия
Система восприятия Atlas включает в себя:
- Качественно откалиброванные сенсоры
- Современные ИИ-алгоритмы с машинным обучением
- Систему оценки состояния окружающей среды
- Модуль обнаружения объектов
Система обнаружения предоставляет данные о предметах в виде идентификаторов, ограничительных рамок и точек интереса. При работе на автомобильном производстве Atlas обнаруживает стеллажи различных форм и размеров, определяя не только их тип, но и точное местоположение для избежания столкновений.
Ключевые точки и локализация
Робот использует двумерные пиксельные точки двух типов:
- Внешние точки (зелёные) — объекты, которые следует огибать
- Внутренние точки (красные) — более разнообразные точки, отражающие распределение полок, расположение ящиков и позволяющие точно локализовать объекты
Для классификации объектов и прогнозирования расположения точек интереса Atlas использует облегчённую сетевую архитектуру, обеспечивающую баланс между производительностью и точностью восприятия.
Система SuperTracker
Навыки манипулирования Atlas основаны на системе отслеживания положения SuperTracker, которая объединяет различные потоки информации: кинематику робота, компьютерное зрение и другие данные. Кинематическая информация от энкодеров суставов позволяет определить расположение захватов в пространстве.
Когда объект находится в поле зрения, Atlas использует модель оценки положения, обученную на большом массиве синтетических данных. Модель способна работать с новыми объектами, используя их CAD-модели для точного позиционирования.
Будущее развития
Boston Dynamics планирует дальнейшее повышение точности действий и адаптивности Atlas. Команда работает над созданием единой базовой модели, где восприятие и действие станут интегрированными процессами, а не отдельными системами.
Официальный сайт Boston Dynamics: www.bostondynamics.com
В случае каких-либо проблем напишите нам, мы поможем быстро и качественно!