联系我们

脑机接口

用于将思想转化为文本的大脑植入物和AI模型

mm

已发表

 on

加利福尼亚大学旧金山分校的研究人员最近创建了一个AI系统,该系统可以通过分析一个人的大脑活动来产生文本,从本质上将他们的思想转化为文本。 AI从用户那里获取12博下载app信号并对其进行解码,它可以基于30到50个句子的集合,实时解密多达250个单词。

据独立报,使用从四名女性收集的12博下载app信号训练了AI模型。实验的参与者在他们的大脑中植入了电极,以监测癫痫发作的发生。指示参与者大声朗读句子,并将他们的12博下载app信号输入AI模型。该模型能够识别与特定单词相关的12博下载app活动,并且模式与实际单词对齐的时间约为97%,平均错误率约为3%。

这不是12博下载app信号与句子相关的第一次,12博下载app科学家已经从事类似项目超过十年了。然而,研究人员创建的AI模型显示出令人印象深刻的准确性,并或多或少地实时运行。该模型利用递归12博下载app网络将12博下载app活动编码为表示形式,然后将其翻译为单词。正如作者所说 在他们的论文中:

“从机器翻译的最新进展中汲取经验,我们训练了一个递归12博下载app网络,将12博下载app活动的每个句子长度序列编码为一个抽象表示,然后将这个表示逐字地解码为英语句子。”

根据ArsTechnica为了更好地理解12博下载app信号与单词之间的联系,研究人员通过禁用系统的不同部分进行了实验。系统性禁用明确表明系统的准确性是由于12博下载app表示。还发现禁用系统的音频输入会导致错误跳跃,但是总体性能仍被认为是可靠的。显然,这意味着该系统可能会成为无法讲话的人的设备。

当禁用电极输入的不同部分时,发现该系统最关注与语音处理和产生相关的某些关键大脑区域。例如,系统性能中相当一部分是基于大脑区域,大脑区域在讲话时会注意自己声音的声音。

尽管初步结果似乎很有希望,但研究团队不确定该模型将如何扩展到更大的词汇量。重要的是,可以将该原则推广到更大的词汇量,因为讲英语的普通人会说大约20,000个单词。当前的解码器方法通过解释句子的静态结构并使用该结构对与特定12博下载app活动模式匹配的单词进行有根据的猜测来进行操作。随着词汇量的增加,由于更多的12博下载app模式可能看起来相似,因此整体准确性可能会降低。

该论文的作者解释说,尽管他们希望解码器最终将学习如何辨别语言中的常规,可靠模式,但他们不确定要训练能够推广到日常英语的模型需要多少数据。解决此问题的一种可能方法是,使用其他算法和植入物,从其他脑机接口收集的数据来补充训练。

加利福尼亚大学研究人员所做的研究只是12博下载app接口和计算机研究与开发浪潮中的最新进展。皇家学会(Royal Society)去年发布了一份报告,该报告预测将人与计算机连接起来的12博下载app接口最终将使人们能够相互理解。该报告引用了由埃隆·马斯克(Elon Musk)创建的Neuralink初创公司和Facebook开发的技术,以此证明了以人为本的计算技术即将发展。皇家学会指出,人机界面将在未来二十年内成为治疗12博下载app退行性疾病(例如老年痴呆症)的有力选择。