联系我们

强化学习

研究人员期待动物赋予强化学习系统常识

mm

已发表

 on

来自伦敦帝国理工学院,剑桥大学和Google DeepMind等机构的AI研究人员正在寻找动物,以寻求有关如何提高其性能的灵感。 强化学习 系统。在联合 发表在CellPress评论上的论文研究人员认为,动物认知为强化学习者提供了有用的基准和评估方法,并且还可以为任务和环境的工程设计提供参考。该研究名为“人工智能和动物常识”。

人工智能研究人员和工程师长期以来一直在寻找算法的灵感来自生物神经网络,使用行为科学和神经科学的原理来告知算法的结构。然而,人工智能研究人员从神经科学/行为科学领域获得的大多数线索都是基于人类的,重点是对幼儿的认识。人工智能研究人员尚未从动物模型中获得很多启发,但动物认知是尚未开发的资源,有可能在强化学习领域取得重要突破。

深度强化学习 系统会通过反复试验的过程进行培训,每当强化学习者接近完成预期目标时,便会获得奖励。这非常类似于教动物通过使用食物作为奖励来执行所需的任务。生物学家和动物认知专家进行了许多实验 评估认知能力 包括狗,熊,松鼠,猪,乌鸦,海豚,猫,小鼠,大象和章鱼在内的各种动物。许多动物展现出令人印象深刻的智力表现,有些动物例如大象和海豚 甚至可能有心智理论。

纵观有关动物认知的研究成果,可能会激发AI研究人员从不同角度考虑问题。随着深度强化学习变得越来越强大和复杂,专门研究该领域的AI研究人员正在寻找测试强化学习代理认知能力的新方法。在研究文件中,研究小组参考了对灵长类和鸟类进行的实验类型,并提到它们旨在设计能够完成类似任务类型的系统,从而使AI拥有“常识”。根据该论文的作者,他们“提倡一种方法,其中RL代理(可能还具有尚未开发的体系结构)通过与丰富的虚拟环境进行扩展交互来获取所需的东西。”

据VentureBeat报道,人工智能研究人员认为,常识并不是人类独有的特征,它取决于对物理世界基本属性的理解,例如物体如何占据一个点和空间,对该物体的约束有哪些约束。运动,以及对因果的欣赏。动物在实验室研究中表现出这些特征。例如,乌鸦了解到物体是永久性的东西,因为即使种子被隐藏起来,它们也能够被另一个物体所遮盖,它们才能够取回种子。

为了赋予增强型学习系统这些特性,研究人员认为他们将需要创建任务,这些任务与正确的体系结构配对时,将创建能够将学习到的原理转移到其他任务的代理。研究人员认为,对这种模型的训练应该涉及一些技术,这些技术要求行动者在仅接触过少数几个例子之后才了解概念,这称为“少拍训练”。这与通常用于RL代理程序的试错训练的传统数百或数千次试验相反。

研究团队继续解释说,尽管一些现代RL代理可以学习解决多个任务,但其中一些要求基本学习知识的转移,但不清楚RL代理可以以“常识”来学习抽象概念。如果有一个潜在的代理能够学习这种概念,则他们将需要能够确定RL代理是否理解容器概念的测试。

尤其是DeepMind很高兴能参与开发和测试强化学习代理的新方法。最近,在10月初举行的斯坦福HAI会议上,DeepMind神经科学研究负责人Matthew Botvinick敦促 机器学习 研究人员和工程师在其他科学领域进行更多合作。 Botvinick在一次名为“演讲”的演讲中强调了与心理学家和神经科学进行跨学科工作对于AI领域的重要性。 “三角智能:融合神经科学,心理学和人工智能”。

专门从事以下工作的Blogger和程序员 Machine Learning Deep Learning 话题。 Daniel希望帮助他人将AI的力量用于社会公益。