联系我们

面试

斯蒂法诺·帕菲科和Epistemic AI的联合创始人David Heeger– Interview Series

mm

更新

 on

认知人工智能 采用最新技术 自然语言处理 (NLP), 机器学习深度学习 一种算法,用于绘制来自多个公共和私人来源(包括文本文档和数据库)的不断增长的生物医学知识之间的关系。通过知识映射的过程,用户’与该平台进行交互工作,以绘制和理解生物医学知识的子集,这些子集揭示了概念和关系,而传统搜索则忽略了这些概念和关系。

我们采访了Epistemic AI的两位联合创始人,讨论了这些最新进展。

斯蒂法诺·帕菲科 拥有超过10年的AI和NLP应用开发经验。他曾在彭博(Bloomberg)工作了7年,在开始Epistemic之前曾在Elemental Cognition工作。

大卫·海格 是...的银教授 数据科学 纽约大学神经科学专业,他的职业生涯是将计算机科学,人工智能和生物科学联系在一起。他是美国国家科学院院士。作为创始人,他们汇集了构建大型AI和NLP应用系统的专业知识,以理解大量知识,并结合该领域多年研究中的计算生物学和生物医学科学知识。

是什么吸引并吸引了您进入AI和自然语言处理(NLP)?

斯蒂法诺·帕菲科:当我在罗马上大学时,人工智能一点都不流行(实际上那是很边缘的),我问当时的顾问我应该在现有的专业中选择什么专业。他说:“如果您想赚钱,软件工程和数据库,但是如果您想变得怪异而又非常先进,那就选择人工智能”。我被“怪异”地卖掉了。然后,我开始从事知识表示和推理的研究,研究自治特工如何踢足球或营救人员。然后有两个认识使我爱上了自然语言处理:首先,自治代理可能必须彼此之间使用自然语言进行交流!其次,手工建立正式的知识库非常困难,而自然语言(文字形式)已经提供了最大的知识库。我知道今天这些似乎是显而易见的观察,但它们以前还没有成为主流。

推出Epistemic AI的灵感来自什么?

斯蒂法诺·帕菲科:我将提出一个大胆的主张。如今,没有人拥有足够的工具来理解和连接庞大且不断增长的文档和数据集合中的知识。我以前曾在金融界研究过这个问题。想想新闻,财务报表,价格数据,公司行为,文件等。我发现这个问题令人陶醉。当然,这是一个难题。和一个重要的!当我遇到我的联合创始人戴维·海格博士时,我们花了很多时间评估生物医学行业的创业机会。当我们意识到在此字段中生成的大量信息时,一切似乎都落在了正确的位置。生物医学研究人员正努力应对信息超载的问题,同时试图应对庞大且迅速扩展的生物医学知识基础,包括文献(例如论文,专利,临床试验)和数据库(例如基因,蛋白质,途径,药物,疾病,医学术语)。这是研究人员的主要难题,并且在没有合适的解决方案的情况下,他们被迫使用基本的搜索工具(PubMed和Google Scholar)并探索手动管理的数据库。这些工具适用于查找与关键字匹配的文档(例如,单个基因或已发表的期刊论文),但不适用于获取有关主题区域或子域的全面知识(例如,COVID-19),或用于解释高通量的结果生物学实验,例如基因测序,蛋白质表达或化合物筛选。我们以一个允许他们迭代的平台来开始Epistemic AI的想法来解决这个问题:

  1. 缩短收集信息和建立综合知识图谱的时间
  2. 表面上的跨学科信息可能很难找到(真正的发现通常来自研究学科之间的空白);
  3. 通过在知识图中找到路径和缺失的链接来确定因果假设。

用于绘制这些关系的公共和私人资源有哪些?

斯蒂法诺·帕菲科:目前,我们正在收集可以获取的所有公共可用资源,包括Pubmed和Clinicaltrials.gov。我们摄取基因,药物,疾病及其相互作用的数据库。我们还为特定客户提供了私人数据源,但我们尚未公开任何细节。

哪种机器学习技术用于知识映射?

斯蒂法诺·帕菲科:Epistemic AI的一种深信不疑的信念是,狂热对建筑产品没有帮助。建立集成了多种机器学习技术的体系结构是早期做出的决定,其范围从知识表示到变压器模型,再到图形嵌入,还包括更简单的模型,例如回归和随机森林。每个组件都很简单,但是没有简单。尽管我们相信已经为某些任务构建了最新的NLP组件,但在可能的情况下,我们不会回避简单的基线模型。

您能否列举一些使用Epistemic平台的公司,非营利组织或学术机构?

斯蒂法诺·帕菲科:虽然我很乐意,但我们尚未与用户达成协议。我可以说,我们在这三个领域(公司,非营利组织和学术机构)的知名机构中都签了名。此外,出于学术/非牟利目的,我们打算保留该平台的免费性。

认识论的如何帮助研究人员识别中枢神经系统(CNS)和其他疾病特定的生物标记?

大卫·海格博士:神经科学是一个非常高度跨学科的领域,包括分子和细胞生物学和基因组学,以及心理学,化学以及物理学,工程学和数学原理。范围如此之广,以至于没人能成为专家。学术机构和制药/生物技术公司的研究人员被迫专门研究。但是我们知道,重要的见识是跨学科的,结合了来自各专业的知识。我们正在构建的基于AI的软件平台使每个人都可以跨学科,了解他们各自的专业知识领域与其他主题之间的联系,并确定新的假设。这在神经科学中尤其重要,因为它首先是一个高度跨学科的领域。人脑的功能和功能障碍是科学曾经面临的最困难的问题。我们的使命是改变生物医学科学家的工作方式,甚至改变他们的思维方式。

认识论还使得能够发现中枢神经系统疾病的遗传机制。您能告诉我们这是如何工作的吗?

大卫·海格博士:大多数神经系统疾病,精神疾病和发育障碍在遗传差异方面没有简单的解释。少数综合征症状已知是由特定突变引起的。但这不是通常的情况。例如,与自闭症谱系障碍(ASD)相关的遗传差异有数百种。对于这些基因中的一些,对于它们在基本生物学方面的功能有一些了解。例如,一些与ASD相关的基因在大脑中使突触结合在一起(但是,请注意,相同的基因在体内其他器官系统中通常具有不同的功能)。但是,对于这些遗传差异如何解释ASD患者表现出的一系列复杂的行为差异,人们知之甚少。更糟糕的是,具有相同遗传差异的两个人可能会有完全不同的结果,一个人被诊断出患有ASD,而另一个人则没有。具有完全不同的遗传特征的两个人可能具有相同的结果,并且行为缺陷非常相似。要理解所有这些,需要将基因组学和分子生物学与细胞神经科学(遗传差异如何导致单个神经元的功能不同)建立联系,然后与系统神经科学(细胞功能的这些差异如何导致大量互连神经元的网络)建立联系。才能发挥不同的作用),然后是心理学(神经网络功能的这些差异如何导致认知,情感和行为的差异)。所有这些都需要从发展的角度来理解。遗传差异可能会导致神经功能特定方面的缺陷。但是大脑不只是坐在那里接受它。大脑具有高度适应性。如果缺少或损坏的机制,那么大脑的发育会有所不同,以尽可能地补偿。这种补偿可能是分子的,例如,上调另一种突触受体以取代断裂的突触受体的功能。否则赔偿可能是行为上的。最终结果不仅取决于最初的遗传差异,还取决于依靠其他分子,细胞,电路,系统和行为机制进行补偿的各种尝试。

没有人会了解所有这一切。我们都需要帮助。我们正在构建的基于AI的软件平台使每个人都可以收集和链接所有相关的生物医学知识,查看连接并确定新的假设。

生物制药和学术机构如何利用Epistemic应对COVID-19挑战?

斯蒂法诺·帕菲科:我们已经发布了包含COVID特定数据集的平台的公共版本,任何对COVID-19进行研究的人都可以免费访问。它可以在 //covid.epistemic.ai

认知疗法还用于哪些其他疾病或遗传问题?

斯蒂法诺·帕菲科:我们已经与自闭症研究人员进行了合作,并且最近正在对囊性纤维化进行新的研究。但是我们很高兴与可能需要其他研究帮助的其他研究人员或机构合作。

关于Epistemic,您还有什么要分享的吗?

斯蒂法诺·帕菲科:我们正在建立一群想要改变生物医学研究人员工作和思考方式的人们。我们衷心希望您的许多读者愿意加入我们!

谢谢你们俩花时间回答我们的问题。希望了解更多信息的读者请访问 认知人工智能。

安东尼·塔迪夫(Antoine Tardif)是 Futurist 他对AI和机器人技术的未来充满热情。他是 BlockVentures.com并已投资了50多个AI和区块链项目。他是的联合创始人 Securities.io 一个专注于数字证券的新闻网站,是unite.AI的创始合伙人。他也是 福布斯技术委员会。