联系我们

机器人技术

Google的AI教机器人如何看狗运动

mm

更新

 on

即使是当今一些最先进的机器人,其动作仍然有些笨拙,生涩。为了使机器人能够以更逼真的,更流畅的方式运动,Google的研究人员开发了一种能够 从真实动物的动作中学习。 Google研究小组发布了 preprint paper 上周晚些时候详细介绍了他们的方法。在本文和随附文件中 博客文章,研究小组描述了系统背后的原理。该论文的作者认为,赋予机器人更多自然的运动可以帮助他们完成需要精确运动的现实世界任务,例如在建筑物的不同楼层之间运送物品。

据VentureBeat报道,研究小组利用了 强化学习 训练他们的机器人。研究人员首先收集移动的真实动物的剪辑,然后使用强化学习(RL)技术推动机器人模仿视频剪辑中的动物运动。在这种情况下,研究人员在物理模拟器上设计了在狗的夹子上训练机器人的方法,并指示四足的Unitree Laikago机器人模仿狗的动作。训练机器人后,它能够以每小时2.6英里的速度完成复杂的动作,如跳跃,转弯和快速行走。

训练数据包括大约2亿只运动中的狗的样本,并通过物理模拟对其进行了跟踪。然后,通过代理商学习的奖励功能和政策来运行不同的动议。在模拟中创建策略之后,使用一种称为“潜在空间自适应”的技术将其转移到现实世界中。由于用于训练机器人的物理模拟器只能逼近真实世界的某些方面,因此研究人员将各种扰动随机应用于模拟,旨在模拟不同条件下的操作。

根据研究团队的说法,他们能够利用从50个不同试验中收集的八分钟数据,将仿真策略调整为适用于现实世界的机器人。研究人员设法证明,现实世界中的机器人能够模仿各种不同的特定运动,例如小跑,转身,跳跃和起搏。他们甚至可以模仿由动画艺术家创作的动画,例如跳和转的组合。

研究人员在论文中总结了这些发现:

“我们证明,通过利用参考运动数据,一种基于学习的方法能够自动合成控制器,以实现腿式机器人行为的多种功能。通过将有效的领域自适应样本技术纳入训练过程,我们的系统能够学习模拟中的自适应策略,然后可以快速将其应用于实际部署。”

强化学习过程中使用的控制策略有其局限性。由于硬件和算法的限制,机器人无法完成某些操作。例如,他们无法奔跑或大跳。与手动设计的机芯相比,学到的策略也没有那么稳定。研究团队希望通过使控制器更加健壮并能够从不同类型的数据中学习来进一步开展工作。理想情况下,该框架的未来版本将能够从视频数据中学习。