Новейший робопес умеет обучать сам себя

Собака-робот, сделанная командой ученых из Университета Калифорнии в Беркли, учится ходить, переворачиваться и преодолевать препятствия всего за один час обучения. Ученые надеются вскоре научить ее приносить хозяину предметы и подчиняться словесным командам.

Ученые из Университета Калифорнии в Беркли представили собаку-робота, которая может сама научиться ходить всего за час. В видео, опубликованном исследователями, четвероногий робот сначала размахивает ногами в воздухе и не может встать, но уже через 10 минут он может делать шаги, а всего через час он уже довольно легко ходит, встает, упав на спину, и поднимается на лапы, будучи сбитым палкой одним из исследователей. При этом, в отличие от процесса обучения многих роботов, с этим не проводилось предварительное обучение в компьютерной симуляции.

✖

Данияр Хафнер, исследователь искусственного интеллекта из Калифорнийского университета в Беркли, работал со своими коллегами над тренировкой робота с помощью обучения с подкреплением. «Обычно роботы учатся путем большого количества проб и ошибок внутри компьютерных симуляций, которые позволяют пройти все шаги обучения намного быстрее, чем в реальном времени, - объясняет Хафнер. - После решения такой задачи, как вставание и ходьба в симуляции, изученное поведение затем запускается на физическом уровне. Но симуляция не может отразить сложность реального мира, поэтому поведение, которое хорошо работает в симуляции, может не решить задачу в реальном мире».

Традиционный тип машинного обучения предусматривает положительное подкрепление за выполнение определенных действий в реальной среде. Хафнер и его сотрудники — Филипп Ву и Алехандро Эсконтрела — использовали алгоритм под названием Dreamer, который работает на основе прошлого опыта для построения модели реального мира, а также позволяет роботу проводить расчеты методом проб и ошибок.

«Алгоритм Dreamer продемонстрировал большие перспективы для обучения на небольшом количестве взаимодействий путем планирования в рамках изученной модели мира, — заявляют исследователи в своей статье. - Изучение модели мира для прогнозирования результатов потенциальных действий позволяет планировать в воображении, уменьшая количество проб и ошибок, необходимых в реальной среде».

После того, как робот научился ходить, он также может научиться приспосабливаться к другим, менее предсказуемым действиям, - как, например, в случае, когда исследователи ткнули его палкой. Даже при обучении с подкреплением, которое дает отличные результаты для того, чтобы превзойти людей в настольных или видеоиграх, обучать роботов правильно действовать в реальном мире чрезвычайно сложно и требует точного взаимодействия ученых и инженеров в определении того, какие именно действия должны вознаграждаться. «Применение обучения с подкреплением к физическим роботам — большая проблема, потому что мы не можем ускорить время в реальном мире, а симуляторы роботов часто недостаточно точно отражают реальный мир», — объясняют Хафнер и его коллеги.

Исследователи высоко оценили полученные результаты. «Наш проект продемонстрировал, что физическое обучение может значительно ускорить обучение роботов действиям в реальности, - пишут они. - Это приближает нас к решению сложных задач автоматизации, таких как производство и сборка и даже самоуправляемые автомобили».
Однако многие ученые считают использованный алгоритм слишком сложным. «Робототехник должен будет составлять отдельную программу каждой задачи, которую предстоит решать роботу, — объясняет Леррел Пинто, доцент компьютерных наук в Нью-Йоркском университете, специализирующийся на робототехнике и машинном обучении. - Но для этого потребуется огромный объем кода, и все равно целый ряд ситуаций, которые просто невозможно предсказать, останутся в стороне».

Исследовательская группа также отмечает ряд сложностей, связанных с этим типом технологий.
«Хотя Dreamer показывает многообещающие результаты, обучение на физическом уровне в течение многих часов приводит к износу роботов, что может потребовать вмешательства человека или ремонта, — признают они. - .Кроме того, требуется дополнительная работа, чтобы изучить ограничения Dreamer и наши базовые показатели путем более длительного обучения. Так что в итоге можно сказать, что мы рассматриваем решение более сложных задач обучения путем объединения преимуществ быстрого обучения в реальном мире с преимуществами симуляторов, как эффективное направление будущих исследований».
Хафнер надеется научить робота выполнять голосовые команды и, возможно, подключить камеры к собаке, чтобы дать ей зрение, — это позволит ей выполнять типичные собачьи действия, такие как игра в апорт.
Обучение роботов - перспективное направление сегодняшнего дня. В другом свежем исследовании ученые из Немецкого института интеллектуальных систем имени Макса Планка показали, что их робот-собака по кличке Морти может легко научиться ходить, используя сложный алгоритм, включающий датчики в лапах. «Как инженеры и робототехники, мы искали ответ, создавая робота, который обладает рефлексами, как у животных, и учится на ошибках, — говорит в своем заявлении Феликс Рупперт, бывший докторант исследовательской группы Dynamic Locomotion в институте имени Планка. - Если животное спотыкается, это ошибка? Нет, если это произойдет один раз. Но если он часто спотыкается, это дает нам представление о том, насколько хорошо робот ходит».
Собака-робот немецких исследователей работает, используя сложный алгоритм, который определяет, как она учится. Информация от датчиков стопы сопоставляется с данными спинного мозга модели, которая работает как программа внутри компьютера робота. Роботизированная собака учится ходить, постоянно сравнивая установленную и ожидаемую информацию от датчиков, запуская рефлекторные петли и адаптируя способ регулирования своих движений.

Источник:

#Калифорния #машинное обучение #наука #научные достижения #робопес #робот #робототехника #современные технологии

Fishki в Телеграм

Посты на ту же тему

Учёные создали робота, который мог бы стать чемпионом по прыжкам в высоту

В Китае разработали робота-крысу

Новое достижение отечественной робототехники

3 комментария

Правила

!!! Оскорбления в комментариях автора поста или собеседника. Комментарий скрывается из ленты, автору выписывается бан на неделю. Допускаются более свободные споры в ленте с политикой, но в доступных, не нарушающих УК РФ, пределах.

! Мат на картинке/в комментарии. Ваш комментарий будет скрыт. При злоупотреблении возможен бан.

! Флуд - дублирующиеся комментарии от одного и того же пользователя в разных постах, систематические ложные вызовы модераторов с помощью функции @moderator, необоснованные обращения в техническую поддержку сайта, комментарии не несущие смысловой нагрузки и состоящие из хаотичного набора букв. Санкции - предупреждение с дальнейшим баном при рецидиве.

! Публикация рекламных постов. Несогласованное размещение рекламного материала, влечет незамедлительную приостановку действий учетной записи пользователя.

! Публикация материала, запрещенного на территории РФ и преследуемого УК РФ. Незамедлительная приостановка действия учетной записи пользователя.

! Мультиаккаунты. Использование нескольких активных аккаунтов, принадлежащих одному пользователю (исключение - дополнительный аккаунт для обращения в тех. поддержку при блокировке основного аккаунта) запрещено. За нарушение предусмотрено отключение основного аккаунта с возможной дальнейшей блокировкой любого аккаунта от данного пользователя.

Правила

! Мат на картинке/в комментарии. Ваш комментарий будет скрыт. При злоупотреблении возможен бан.

Лучший комментарий

Комментарий удален

Удалить комментарий?

Удалить Отмена

Allmaster

3 года назад

Программа - суть вариантов готовых алгоритмов. Пусть даже хренова туча вариантов. Но они предопределены.
Разум это не заменит.

Удалить комментарий?

Удалить Отмена

SerGProS

26k

3 года назад

Угу..А потом умные робособаки, обвешанные пулеметами и гранатометами и средствами локации и наблюдения, всякой украинской фашистне-азовщине будет помогать..Чтобы ни делалось, почти все во имя уничтожения

-2

Удалить комментарий?

Удалить Отмена