联系我们

人工智能

Facebook的12博下载app参与了Hanabi游戏

已发表

 on

Facebook 12博下载app研究(F12博下载appR) 开发了新的12博下载app 与Hanabi对抗时产生了令人印象深刻的结果。新的发展是Facebook 12博下载app迈出的重要一步。 

哈纳比 是一款类似于纸牌的纸牌游戏。尽管大多数用于此技术的游戏(尤其是国际象棋或围棋)直接将12博下载app置于人类面前,但Hanabi要求玩家相互合作以实现共同目标。 

Facebook雇用机器人在游戏中协同工作,直到它们超越了以前使用的12博下载app系统。最新的最佳12博下载app系统在游戏中获得25分的23.92分,而新的12博下载app系统在25分中达到24.61分。 

早在2月,Google,DeepMind,卡内基梅隆大学和牛津大学的研究人员提出了Hanabi基准测试。他们还包括创建能够玩游戏的其他12博下载app,并将其称为“ 12博下载app研究的新领域”。 

研究人员对新开发感到兴奋,因为用于帮助机器人的相同12博下载app可能会在其他领域使用。一种可能的用途是改善虚拟助手与人互动的方式。 

Facebook 12博下载app研究人员Noam Brown谈到了新的12博下载app系统。 

“与此相关的令人兴奋的事情之一是,我们所观察到的改进与观察到的改进确实正交。 深度强化学习:您可以将其添加到任何策略之上,它将使它变得更加强大。 他接受了VentureBeat的采访。 “我们看到的结果远远超出了我们或其他研究人员的预期。实际上,我们从搜索中获得的收益要比通过所有深度搜索所获得的收益要强 强化学习 过去使用的算法。”

通过Facebook的12博下载app进行的新开发是在研究人员不断开发能够与某些最复杂的游戏抗衡的软件的时候进行的。 2016年,Google的DeepMind的12博下载app系统击败了中国棋盘游戏Go中最好的人类玩家。 

哈纳比 围绕团队合作和策略构建,这被认为是测试12博下载app的最佳游戏,这是12博下载app实现的重要里程碑。在这种环境下使用时,人工智能可以改善并变得更加复杂。

Adam Lerer是Facebook研究人员,也是该论文的撰稿人。 

“我们转向这些合作游戏的原因之一是,我认为我们至少在竞争性游戏方面没有剩下任何游戏,” he said. 

哈纳比(Hanabi)由两到五名球员组成的团队,每人随机获得一张纸牌。卡片的颜色不同且包含不同的数字,团队将它们按颜色和正确的数字顺序放在桌子上。 

玩家看不到自己的牌,但队友可以看到。允许玩家给别人提示。例如,一个队友可以给出有关颜色的提示,从而导致另一个人玩或弃牌。 

游戏中较复杂的方面之一是,玩家必须弄清楚线索及其含义。对于机器人来说,游戏的这一部分很难弄清他们所拥有的信息。 

由于Facebook使用的技术和强化学习,这些机器人得以制定策略。 Facebook认为,该技术可用于其他应用程序,例如机器人技术,自动驾驶汽车和其他系统。 

“这是人类非常自然的事情,这种想法是能够使自己陷入另一个人的脚下,并理解他们为什么要采取他们正在采取的行动,他们在想什么,即使他们不这样做。不知道某些事情。但这是12博下载app历来真正挣扎的事情,”他说。 “关于灵长类动物是否具有心理理论以及人类婴儿在多大年龄发展心理理论,一直存在着长期的争论,我认为最终在人工智能中看到这种行为真的很令人着迷。我认为,如果我们希望在现实世界中部署12博下载app与人类互动,那将非常重要,因为人类期望这种行为。”

 

亚历克斯·麦克法兰(Alex McFarland)是一位历史学家和新闻工作者,报道了人工智能的最新发展。