EPFL研究人员用机器学习训练的一个四脚机器人学会了通过在行走、小跑和叉前之间自发切换来避免摔倒,这对机器人学家和对动物运动感兴趣的生物学家来说都是一个里程碑
在一种名为深度强化学习(DRL)的机器学习形式的帮助下,EPFL机器人显著学会了从小跑过渡到叉前;跳羚和瞪羚等动物使用的跳跃、拱背步态—这项由EPFL工程学院生物机器人实验室领导的研究,为动物为什么以及如何发生这种步态转变提供了新的见解
“之前的研究已经将能量效率和避免肌肉骨骼损伤作为步态转换的两个主要解释。最近,生物学家认为平坦地形上的稳定性可能更重要。
”但动物和机器人实验表明,这些假设并不总是有效的,尤其是在不平坦的地面上,”博士生Milad Shafiee说,他是《自然通讯》上发表的一篇论文的第一作者。
Shafiee和合著者Guillaume Bellegarda以及生物机器人实验室负责人Auke Ijspeert因此对步态转变发生的新假设感兴趣:生存能力或避免跌倒。为了验证这一假设,他们使用DRL训练四足机器人穿越各种地形。
“我们发现,在平坦的地形和具有挑战性的离散地形上,生存能力会导致步态转换的出现,但能源效率不一定会提高,”Shafiee解释道,“看来能源效率,以前被认为是这种转变的驱动因素,可能更重要。当一只动物在具有挑战性的地形上航行时,它的首要任务可能不是摔倒,其次是能源效率。“
为了对机器人的运动控制进行建模,研究人员考虑了驱动动物运动的三个相互作用的元素:大脑、脊髓和来自身体的感觉反馈。他们使用DRL训练神经网络,模拟机器人穿越实验地形时脊髓将大脑信号传输到身体的过程。
然后,研究小组将不同的权重分配给三个可能的学习目标:能效、减力和生存能力。一系列计算机模拟表明,在这三个目标中,生存能力是唯一促使机器人在没有科学家指示的情况下自动改变步态的目标。强调这些观察结果代表了第一个基于学习的运动框架,在该框架中,步态过渡在学习过程中自发出现,也是四足机器人最动态地跨越如此大的连续间隙。
一种仿生学习架构
”Shafiee说:“我们的仿生学习架构展示了最先进的四足机器人在充满挑战的地形上的灵活性。”
研究人员旨在通过将不同类型的机器人放置在更广泛的挑战性环境中的额外实验来扩展他们的工作。除了进一步阐明动物的运动,他们希望最终,他们的工作将使机器人能够更广泛地用于生物研究,减少对动物模型的依赖和相关的伦理问题。
The team emphasizes that these observations represent the first learning-based locomotion framework in which gait transitions emerge spontaneously during the learning process, as well as the most dynamic crossing of such large consecutive gaps for a quadrupedal robot.
"Our bio-inspired learning architecture demonstrated state-of-the-art quadruped robot agility on the challenging terrain," Shafiee says.
The researchers aim to expand on their work with additional experiments that place different types of robots in a wider variety of challenging environments. In addition to further elucidating animal locomotion, they hope that ultimately, their work will enable the more widespread use of robots for biological research, reducing reliance on animal models and the associated ethics concerns.
想要了解更多关于脑机接口技术的内容,请关注脑机网,我们将定期发布最新的研究成果和应用案例,让您第一时间了解脑机接口技术的最新进展。