联系我们

自然语言处理

AI可以帮助研究人员确定可以复制哪些论文,旨在解决繁殖危机

mm

发表

 on

近年来,近年来越来越多地关注学者和研究人员将复制/再现性危机配备。许多研究只需在尝试对研究的复制时产生相同的显着成果,因此,科学界担心调查结果往往是强调的。问题影响了作为心理学和人工智能的多样化。涉及AI领域的时候,许多非同伴审查的论文都公布了其他研究人员无法重现的令人印象深刻的结果。为了解决问题并减少不可重复的研究的数量,研究人员设计了一个AI模型,旨在确定可以复制哪些论文。

据财富报告,一个新的由凯洛格管理层和西北大学复杂系统研究所的一支研究人员出版,展示了一个深度学习模型可以确定哪些研究可能是可重复的,哪些研究不是。如果AI系统可以可靠地区分可重复和不可重复的研究,它可以通过数千个研究论文来帮助大学,研究机构,公司和其他实体过滤,以确定哪些文件最有可能是有用可靠的。

由西北团队开发的AI系统不利用研究人员通常用于确定研究的有效性的经验/统计证据的类型。该模型实际上雇用了自然语言处理试图量化纸张的可靠性的技术。该系统以纸张作者使用的语言提取模式,发现某些字样表示比其他字样的更大的可靠性。

该研究团队在1960年代旧的心理学研究,发现人们经常通过他们使用的话来传达他们在他们想法中的信心水平。与这个想法一起跑步,研究人员认为纸质作者可能会在写论文时对他们的研究结果的信心不知不觉。研究人员进行了两轮训练,利用不同的数据集。最初,该模型从科学论文中的大约200万摘要培训,而第二次模型培训过全文培训,以从旨在确定哪些心理论文可以重现的项目–再现性项目:心理学。

在测试之后,研究人员将模型部署在数百篇其他论文的集合上,从诸如心理学和经济学等各个领域取出。研究人员发现,它们的模型对纸张的再现性具有比通常用于确定纸张是否可以复制的纸张结果的统计技术更可靠的预测。

研究人员和凯克管理学院Brian Uzzi向财富解释说,虽然他希望SI模型可能会用于帮助研究人员来确定要复制的结果,但研究团队不确定他们的模型和细节学到了。事实如此机器学习模型通常是黑匣子是AI研究中的常见问题,但这事实可以使其他科学家犹豫不决利用该模型。

UZZI解释说,研究团队希望该模型可能用于解决冠状病毒危机,帮助科学家更多快速了解病毒并确定哪些研究结果是有前途的。随着UZZI对财富表示:

“我们希望开始将此应用于Covid问题 - 立即发行问题,其中很多事情正在成为宽松,我们需要在最先前工作的基础上建立。目前尚不清楚先前的工作将复制,我们没有时间进行复制。“

UZZI和其他研究人员希望通过利用进一步的自然语言处理技术来改善模型,包括团队创建的技术,以分析有关公司收益的呼叫成绩单。研究团队已经建立了一个大约30,000名呼叫成绩单的数据库,他们将分析线索。如果团队可以建立成功的模型,他们可能能够说服分析师和投资者使用该工具,这可能会为模型及其技术铺平其他创新用途。