联系我们

数据科学

AI Systems发现人造蛋白质的蓝图

mm

已发表

 on

芝加哥大学普利兹克分子工程学院(PME)的一组研究人员最近成功创建了一个AI系统,该系统可以通过分析大数据存储来创建全新的人工蛋白质。

蛋白质是构建生物组织必不可少的大分子,并且通常对细胞的生命至关重要。细胞将蛋白质用作化学催化剂,以进行各种化学反应并完成复杂的任务。如果科学家们能够弄清楚如何可靠地改造人造蛋白质,那么它将为碳捕获的新方法,能量收集的新方法以及新的疾病治疗方法打开大门。人造蛋白质具有极大改变我们生活世界的能力。 据EurekaAlert报道,芝加哥PME大学研究人员最近的一项突破使科学家们更加接近这些目标。 PME研究人员利用了 机器学习 算法来开发能够产生新型蛋白质的系统。

研究团队创建了机器学习模型,这些模型对从各种基因组数据库中提取的数据进行了训练。随着模型的学习,他们开始区分常见的基本模式和简单的设计规则,从而可以创建人造蛋白质。研究人员在实验室中采用这些模式并合成了各自的蛋白质后,发现人造蛋白质产生的化学反应与天然蛋白质驱动的化学反应大致一样有效。

根据PME UC的Joseph Regenstein教授Rama Ranganathan的说法,研究团队发现基因组数据包含有关蛋白质基本功能和结构的大量信息。通过利用机器学习来识别这些常见结构,研究人员“能够瓶装自然’自己创造蛋白质的规则。”

研究人员专注于这项研究的代谢酶,特别是称为分支酸突变酶的蛋白质家族。该蛋白质家族是多种植物,真菌和细菌中生命所必需的。

Ranganathan及其合作者意识到,基因组数据库中包含的洞察力正等待着科学家的发现,但是确定蛋白质结构和功能规则的传统方法仅取得了有限的成功。该团队着手设计能够揭示这些设计规则的机器学习模型。该模型的发现表明,可以通过保留氨基酸位置及其在氨基酸对进化中的相关性来创建新的人工序列。

研究人员团队创造了合成基因,这些基因编码产生这些蛋白质的氨基酸序列。他们用这些合成基因克隆了细菌,发现细菌在其细胞机器中使用了合成蛋白,其功能几乎与常规蛋白完全相同。

根据Ranganathan的说法,他们的AI所区分的简单规则可以用于创建具有令人难以置信的复杂性和多样性的人工蛋白质。 正如Ranganathan向EurekaAlert解释的那样:

“约束比我们想象的要小得多。本质上是简单 ’的设计规则,我们相信类似的方法可以帮助我们在生物的其他复杂系统(例如生态系统或大脑)中搜索设计模型。”

Ranganathan和合作者希望采用他们的模型并对其进行概括,从而创建一个科学家可以用来更好地了解蛋白质的构建方式和作用的平台。他们希望利用自己的AI系统,使其他科学家能够发现可以解决诸如气候变化等重要问题的蛋白质。 Ranganathan和安德鲁·弗格森(Andrew Ferguson)副教授创立了一家名为Evozyne的公司,旨在将该技术商业化并促进其在农业,能源和环境等领域的使用。

了解蛋白质之间的共性,以及结构与功能之间的关系也可以帮助创建蛋白质 新药和治疗形式。尽管长期以来人们一直认为蛋白质折叠对计算机来说是一个难以破解的难题,但来自Ranganathan曾经生产的模型的见解’团队可以帮助提高计算速度,促进基于这些蛋白质的新药的研发。可能会开发出阻止病毒内蛋白质产生的药物 甚至可以帮助治疗新型病毒,例如Covid-19冠状病毒。

Ranganathan和其他研究小组仍然需要了解他们的模型如何以及为什么起作用,以及如何产生可靠的蛋白质蓝图。研究小组的下一个目标是更好地了解模型在得出结论时要考虑哪些属性。