机器人走路未必笨拙,DeepMind新方法训练的人工智能走得就很飘逸
本篇文章1489字,读完约4分钟
雷锋。com ai Technology评论道:不管猴子在树林中乱窜,还是足球运动员避开对手攻击目标,它们的敏捷速度都是惊人的。掌握这种复杂的运动控制是物理智能研究的方向,也是人工智能研究的重要组成部分。
真正的智能马达需要学习如何在一系列复杂的环境中调整和控制身体,使其更灵活地完成任务。目前,包括计算机动画和生物力学在内的许多领域都开始研究如何控制模拟人。智能马达的另一个发展趋势是使用人工制作的目标或运动捕捉的数据来产生特定的行为。然而,这可能需要相当大的技术努力,也可能使智能马达在面对新任务时难以重新调整它们的行为。
在接下来的三篇新论文中,我们解释了deepmind为人工智能找到了一种学习灵活行为的方法,这种方法不仅可以重用,还可以解决任务。
1.丰富环境中的运动行为如果你玩雅达利或围棋,目标很容易描述,那就是赢。但是你如何描述空转身表演的过程呢?或者只是简单描述一下“跳”的动作?当deepmind向人工系统传授运动技能时,它经常会遇到这个问题,即很难准确描述一个复杂的行为。Deepmind目前的工作是研究如何让身体从零开始与环境互动,以完成复杂的行为,如在简单和高层次的目标下前进而不下降。更具体地说,他们训练各种模拟器在不同的地形上跳跃、转身或蹲伏。结果显示,在完成这些复杂的技能之前,模拟器没有收到具体的指令。Deepmind需要找到在系统中训练不同模拟器的方法。下面的gif展示了可以产生高质量运动的技术。
模拟“平板”步行者反复试图爬过墙壁
模拟“蚂蚁”步行者正在学习如何准确地在木板间跳跃。2.通过反对模仿来学习人类行为。上面提到的模拟人有很强的解决意外行为的能力,但是因为这些行为必须从零开始,所以模拟人的行为看起来不同于人类的行为。在deepmind的第二篇论文中,阐述了如何通过运动捕捉数据来建立一个模仿人类行为的策略网络,这需要事先学习一些技能,如行走、启动、跑步和转弯。目前,模拟人已经产生了类似人的行为,这些行为可以被重新调整以完成其他任务,例如爬楼梯、在墙壁周围导航等。
下面的gif可以查看模拟人的行为。
人形步行者产生类似人类的行走行为
这个人形机器人摔倒后立即站了起来。3.模拟器模拟各种人类行为。第三,提出了一种神经网络结构来构建高级生成模型,该模型可以学习不同行为之间的关系,并模拟其所表现出的具体行为。经过训练,deepmind的系统可以对观察到的动作进行编码,并创建新的小动作。虽然模拟器看不到动作之间的转换,但它仍然可以在不同类型的动作之间切换,例如行走方式之间的转换。
gif的左边和中间展示了两种行为;gif的右边显示了模拟的人已经在他从未见过的不同行为之间进行了转换。gif中的左侧平面助行器展示了一种特殊的行走方式;在gif的右侧,它显示我们的模拟器使用单一的策略网络来模拟这种行走方式,因此模拟器可以灵活地移动,而自适应控制是人工智能研究的关键要素。Deepmind的工作旨在开发一种系统,通过学习和调整技能来解决运动控制任务,同时减少人工工程。deepmind未来的研究工作主要是扩展这些方法,以便在更复杂的情况下完成更多的任务。雷锋。(公开号码:雷锋。com) ai科技评论将继续关注。
纸张地址:
丰富环境中运动行为的出现,arxiv/abs/1707.02286
通过对抗性模仿从动作捕捉中学习人类行为,arxiv/abs/1707.02201
各种行为的强力模仿,arxiv/abs/1707.02747
通过深度思维,雷锋。技术评论汇编
雷锋文章版权所有。严禁擅自转载。详情请参考转载说明。
标题:机器人走路未必笨拙,DeepMind新方法训练的人工智能走得就很飘逸
地址:http://www.6st8.com/zbxw/4938.html
免责声明:联合早报中文网从世界各个维度报道世界经济新闻,时政新闻,突发新闻等,本篇的部分内容来自于网络,不为其真实性负责,只为传播网络信息为目的,非商业用途,如有异议请及时联系btr2018@163.com,联合早报中文网的小编将予以删除。