AI无人机竞速击败人类冠军,Nature:将AlphaGo成果带到物理世界
梦晨 发自 凹非寺量子位 | 公众号 QbitAI
AI再一次击败人类世界冠军,登上Nature封面。
与上一次AlphaGo下围棋不同,这次不是脑力运动,而是在真实物理环境中的竞技体育项目——“空中F1”无人机竞速。
与AlphaGo也有相同之处,核心技术都是深度强化学习。
成果来自苏黎世大学,作者之一Davide Scaramuzza认为,这是国际象棋的深蓝、围棋的AlphaGo之后的又一大突破。
这标志着自主移动机器人首次在为人类设计并由人类设计的物理环境体育运动中击败人类冠军。
微软高级研究工程师Shital Shah认为这比AlphaGo更难,也更难获得认可,但仍是历史性的里程碑。
深度强化学习,又一次胜利
先介绍一下这个运动项目:FPV(第一人称视角)无人机竞速。
人类选手会通过机载摄像头传输的视频,从无人机的视角观察环境,穿越障碍。
赛道由七个方形大门组成,每一圈都必须按顺序通过。要赢得比赛,参赛者必须连续领先对手完成三圈。
两台无人机同时出发,正面对决,最高速度可达每小时100公里,同时承受数倍于重力的加速度。
这次与AI同台的是2019年无人机竞速联盟世界冠军Alex Vanover、MultiGP国际公开赛世界杯冠军Thomas Bitmatta和三届瑞士全国冠军Marvin Schaepper。
对AI来说,要达到专业人类选手的水平非常有挑战性,因为无人机需要在物理极限下飞行,同时仅通过机载传感器估计速度和位置。
为解决这些挑战,苏黎世大学设计了Swift,由两个关键模块组成:
感知系统,将高维视觉信息和惯性信息转换为低维表示。控制策略,感知系统产生的低维表示并产生控制命令。
其中,感知系统主要是一个VIO(Visual-Inertial Odometry)模块,同时利用视觉和惯性传感器对自身定位和对环境建模。
VIO估计与神经网络相结合,用于检测障碍门的四个角点。
控制策略是一个前馈神经网络,使用无模型的On-policy深度强化学习进行模拟训练,奖励目标结合了向下一个门的中心前进,和保持下一个门在摄像机视野内。
为了弥合模拟和物理世界之间感知和动力学上的差距,使用了从物理系统中收集的数据,驱动一个MLP残差模型。
在比赛开始前,人类选手在指定赛道上有一周的练习时间,赛道包含“Split-S”等高难度机动动作。
具体规则还有:由声学信号(发令枪)开启比赛,如果发生碰撞也可以继续比赛,如果两架无人机都坠落则飞得远的获胜。
最终在与三位人类选手的比赛中,Swift分别拿下了9局5胜,7局4胜,和9局6胜的成绩。
在Swift输掉的比赛中,有40%是因为与对手发生碰撞,40%是因为与门发生碰撞,20%是因为速度比人类慢。
Swift还在比赛中取得最快记录,人类选手的最佳时间领先半秒。
在累计300圈的数据中,Swift平均时间更短,方差更低,代表AI每圈都稳定追求更快圈速。
而人类则会在自己领先时保持一个较慢的速度,降低碰撞的风险,表现出更大的方差。
这也体现出当前的Swift系统无法得知对手的情况,在领先时不够稳,落后时又不够浪。
AI与人类选手,哪里不同?
在论文中,团队还讨论了AI与人类选手的更多对比。
首先,Swift利用了机载惯性传感器,这类似于人类的前庭系统。
但反而是人类在这个项目上无法使用前庭系统,因为他们不随无人机一起移动,感受不到加速度。
另外,Swift的传感器延迟更低为40毫秒,专业人类选手平均能做到220毫秒。
但Swift的摄像头刷新率有限,只有30Hz,人类使用的摄像头则120Hz。
最后,人类有更高的韧性。
比如即使在全速坠机了只要设备没坏就能继续比赛,但Swift没有接受碰撞后恢复的训练。
如果改变比赛现场的光照环境,Swift的感知系统就会失效。
作者认为,这项研究可能会激发在其他物理系统(例如自动驾驶汽车、飞机和机器人)中跨广泛应用部署基于混合学习的解决方案。
论文地址:https://www.nature.com/articles/s41586-023-06419-4参考链接:[1]https://x.com/davsca1/status/1696938013421429111
更多知识
-
如何治疗和预防甲流(服务窗·科学防疫)
原标题:如何治疗和预防甲流(服务窗·科学防疫)每年春季是甲流的高发季节,最近一些地方出现了散发病例。什么是甲流?有什么特点?如何治...烟燃烟灭つ 268 阅读
-
iPhone15的type-C接口玩手段,欧盟将重罚,苹果会妥协么?
据称苹果今年的iPhone15将会首次用上type-C接口,不过苹果为了赚取厚利可能会给type-C接口,而欧盟显然也早就为此做好准备,如果苹果执意如...﹏丶小迣界 284 阅读
-
微视频|同心逐梦 共向未来
原标题:微视频|同心逐梦 共向未来春风浩荡中,2023年全国两会通过法定程序把党的二十大作出的决策部署转化为全国人民的实际行动,胜利闭...■■俗人雅钦 187 阅读
-
东方甄选回应直播间疑似售假:会积极解决问题,请不要攻击主播
Tech星球3月16日消息,日前东方甄选被曝将养殖虾当野生虾卖引发热议。昨日晚间,东方甄选官方账号发文回应称,“东方甄选作为一家公司,会...原地等候已经远去的幸福 216 阅读
-
OpenAI 离成熟商业公司更近一步
发布 GPT-4 的同时,OpenAI 离成熟公司越近,离名字里的 “Open” 越远。GPT-4 无疑是一个更好的产品。写散文、诗歌、代码,这些 GP...床上小旋风 281 阅读
-
维珍轨道公司暂停运营一周:员工休无薪假,股价暴跌50%
3月16日消息,据外媒援引知情人士消息称,当地时间周三火箭发射公司维珍轨道决定暂停运营一周时间,并安排大部分员工休无薪假,期间寻求能...冷夕颜 237 阅读
-
推动世界共同发展繁荣 创造更加美好未来
原标题:推动世界共同发展繁荣 创造更加美好未来新华社北京3月13日电题:推动世界共同发展繁荣 创造更加美好未来新华社记者十四届全国人...而后的我们 220 阅读
-
瞭望·治国理政纪事丨马上就办 真抓实干
原标题:瞭望·治国理政纪事丨马上就办 真抓实干 ◆ 1991年2...愚人自愈 203 阅读
撰写回复