多年来,瑞士 ANYbotics 公司的团队一直在试图解决这个问题,他们的最新研究成果——《Learning quadrupedal locomotion over challenging terrain》登上了新一期《Science Robotics》的封面。
在这篇论文中,他们提出了一种稳健的控制器,可以部署到 ANYbotics 旗下多种机器人中。有了新型控制器的加持,这些机器人可以轻松翻越溪流、草地、雪地、碎石坡等富有挑战的场景。
在不平坦的地形上,常规腿式运动方法方法使得控制架构越来越复杂。许多情况都要依赖复杂的状态机来协调运动原语和反射控制器的执行。为了触发状态之间的转换或反射的执行,许多系统都明确地预估状态,例如地面接触和滑行移动。这种预估通常是基于经验设置的,并且在存在诸如泥土、雪地或植被等未建模因素的情况下可能会变得不稳定。还有一些在脚部使用接触式传感器的系统,在野外条件下也会变得不可靠。
总体而言,随着考虑更多场景,用于在崎岖等特殊地形上进行腿式运动的常规系统的复杂性不断升级。在开发和维护方面变得非常困难,并且也容易出现控制器设计无法实现的情况(角落情况)。
近来无模型强化学习(RL)已经成为腿式机器人运动控制器开发中的一种替代方法。强化学习方向的观点是调整控制器以优化给定的奖励函数。优化是通过执行控制器本身获取的数据来执行的,这会随着经验的增加而改进。强化学习已经用于简化运动控制器的设计,自动化设计过程的各个部分以及学习之前的方法无法设计的行为。
但是,将强化学习用于腿式运动在很大程度上仅限于实验中的环境和条件。此前的研究实现了运动和恢复行为的端到端学习,但仅限于在实验室的平坦地面上进行。其他研究也开发了用于腿式运动的强化学习技术,但同样是在实验的环境中,主要集中在平坦或带有中等纹理的表面上。
ANYbotics 的研究者提出了一种稳健的控制器,用于在充满挑战的地形上进行盲四足运动。该控制器仅使用联合编码器和惯性测量单元的本体感受(proprioceptive)度量,这是腿式机器人上最耐用最可靠的传感器。
(文章来源于机器人在线网)