联系我们

自动驾驶汽车

12博下载app控制的喷气式战斗机在模拟战斗中击败了人类飞行员

mm

已发表

 on

最近举行了一场事件,使一架12博下载app控制的战斗机在虚拟的格斗中与一名人类飞行员进行对抗,最终结果是12博下载app击败了人类对手,这又增加了12博下载app在甚至非常复杂的任务中也超越人类的另一个例子。

据DefenceOne报道,最近的一次虚拟混战是美军精心策划的一部分,目的是证明自主特工在混战中击败飞机的能力。 AlphaDogFight挑战。国防高级研究计划局(DARPA)选择了由各个国防承包商开发的8个12博下载app团队,并将这些12博下载app团队在虚拟混战中相互对抗。这场比赛的获胜者是Heron Systems开发的12博下载app,此后12博下载app撞上了戴着VR头盔并坐在飞行模拟器中的人类飞行员。据报道,人工智能赢得了它打的所有五轮比赛。

Heron Systems开发的12博下载app是 深度强化学习 system. 深度强化学习 是允许12博下载app代理一次次地在环境中进行实验的过程,并从反复试验中学习。洛克希德·马丁公司的12博下载app在比赛中获得亚军,它还利用了 强化学习 系统。洛克希德·马丁公司的工程师和主管解释说,开发在空战中表现出色的算法与简单设计可以飞行并保持特定方向和高度的算法有很大的不同。 12博下载app算法不仅要理解对某些动作的惩罚,而且还应理解并非所有惩罚都具有同等的权重。与其他操作相比,某些操作具有非常严重的后果,例如崩溃。必须通过为每个可能的操作分配权重,然后根据业务代表的经验来调整这些权重来完成此操作。

Heron Systems表示,他们通过超过40亿次仿真来训练模型,因此该模型获得了大约12年的经验。但是,不允许12博下载app向自己的战斗试验学习经验。尚不清楚如果允许模型从竞赛回合中学习,竞赛的结果将如何改变。如果比赛进行了更长的时间,那么结果可能也会有所不同。几轮之后,人类飞行员就能够适应12博下载app的战术,并在比赛结束前能够持续更长的时间对抗12博下载app。飞行员适应的时间还为时已晚。

实际上,这是12博下载app在模拟混战中第二次击败人类。在2016年, 人工智能系统 打败了战斗机教练。最近的DARPA模拟比2016年的试验更强大,原因是许多12博下载app相互竞争以找到最佳的12博下载app,然后才对付人类飞行员。

援引DARPA战略技术办公室主任蒂莫西·格雷森(Timothy Grayson)的话说,该试验旨在更好地了解机器与人的互动方式,并建立更好的人机团队。正如格雷森的说法:

“我认为我们今天所看到的是我称之为人机共生的事物的开始……让我们考虑一下坐在驾驶舱内的人,他们被这些12博下载app算法之一当做真正成为一种武器系统,人类将注意力集中在人类最擅长的方面(例如高级战略思维),而人工智能则在做着人工智能最擅长的事情。”