从代码到化学:掌握诺贝尔获奖反应的人工智能系统“Coscientist”

2023年12月29日 15:58 次阅读 稿源:cnBeta.COM 条评论

卡内基梅隆大学开发的人工智能"科学家"(Coscientist)已经自主掌握并执行了复杂的诺贝尔化学奖获奖反应,在提高科学发现和实验精度方面展现出巨大潜力。它控制实验室机器人的能力标志着人工智能辅助研究领域的一大飞跃。

AI-Scientist-Assistant-Concept.jpg

一个基于人工智能的系统成功地规划和执行了真实世界的化学实验,显示出帮助人类科学家更快地获得更多发现的潜力。

在比你读完这篇文章还短的时间内,一个人工智能驱动的系统就能自主地了解某些诺贝尔化学奖得主的化学反应,并设计出一个成功的实验室程序来进行这些反应。人工智能在短短几分钟内就完成了所有这些工作,而且一试即中。

卡内基梅隆大学化学家兼化学工程师加布-戈麦斯(Gabe Gomes)说:"这是第一次由非有机智能规划、设计和执行这种由人类发明的复杂反应。他领导的研究团队组装并测试了基于人工智能的系统。"

他们将自己的成果命名为"Coscientist"。Coscientist 所完成的最复杂的反应在有机化学中被称为钯催化交叉偶联反应,它的人类发明者因此获得了 2010 年诺贝尔化学奖,以表彰这些反应在医药开发过程和其他使用棘手的碳基分子的行业中发挥的巨大作用。

Coscientist在《自然》(Nature)杂志上发表的论文表明,人类有可能有效地利用人工智能来加快科学发现的速度和数量,并提高实验结果的可复制性和可靠性。这个四人研究小组包括博士生丹尼尔-博伊科(Daniil Boiko)和罗伯特-麦克奈特(Robert MacKnight),他们分别从西北大学美国国家科学基金会化学酶合成中心和圣母大学美国国家科学基金会计算机辅助合成中心获得了支持和培训。

Chemistry-Research-Conducted-by-AI.png

人工智能化学研究的艺术家概念图。这项工作由卡内基梅隆大学的加布-戈麦斯(Gabe Gomes)领导,并得到了美国国家科学基金会化学创新中心的支持。资料来源:美国国家科学基金会

"除了他们的系统所展示的化学合成任务之外,戈麦斯和他的团队还成功合成了一种超高效的实验室伙伴,"美国国家科学基金会化学部主任大卫-伯科威茨(David Berkowitz)说。"他们把所有部件组合在一起,最终的结果远远超出了各部分的总和--它可以用于真正有用的科学目的。"

Coscientist 的诞生

在 Coscientist 的软件和硅基部件中,最重要的是构成其人工"大脑"的大型语言模型。大型语言模型是一种人工智能,可以从海量数据(包括文档中的书面文本)中提取意义和模式。通过一系列任务,团队测试并比较了多个大型语言模型,包括 GPT-4 和 OpenAI 公司生产的其他版本的 GPT 大型语言模型。

Coscientist 还配备了几个不同的软件模块,团队首先对它们进行了单独测试,然后又对它们进行了联合测试。

"我们试图将科学领域所有可能的任务分割成小块,然后逐块构建大图,"设计 Coscientist 总体架构和实验任务的 Boiko 说。"最后,我们把所有东西都整合到了一起。"

这些软件模块让 Coscientist 能够做所有研究化学家都会做的事情:搜索有关化合物的公共信息,查找并阅读有关如何控制机器人实验设备的技术手册,编写计算机代码以进行实验,分析所得数据以确定哪些有效,哪些无效。

其中一项测试考察了 Coscientist 准确规划化学程序的能力,这些程序一旦执行,就会产生阿司匹林、对乙酰氨基酚和布洛芬等常用物质。对大型语言模型进行了单独测试和比较,包括两个版本的 GPT,其中一个软件模块允许它像人类化学家那样使用Google在互联网上搜索信息。然后,根据是否能得到所需的物质、步骤的详细程度以及其他因素,对得出的程序进行检查和评分。其中,支持搜索的 GPT-4 模块得分最高,它是唯一一个为合成布洛芬创建了可接受质量程序的模块。

Boiko 和 MacKnight 观察到 Coscientist 演示了"化学推理",Boiko 将其描述为使用化学相关信息和以前获得的知识来指导自己行动的能力。它使用了以简化分子输入行输入系统(SMILES)格式编码的公开化学信息--这是一种表示分子化学结构的机器可读符号--并根据 SMILES 数据中仔细研究的分子的特定部分对实验计划进行了修改。这是化学推理的最佳版本。

进一步的测试包括软件模块,允许 Coscientist 搜索和使用描述控制机器人实验室设备的应用程序接口的技术文档。这些测试对于确定 Coscientist 能否将其合成化合物的理论计划转化为计算机代码,从而在物理世界中指导实验室机器人非常重要。

在实验中引入机器人技术

实验室通常使用高科技机器人化学设备,对微小的液体样品进行吸入、喷出、加热、摇动等操作,并精确地反复进行。这些机器人通常由人类化学家编写计算机代码进行控制,这些化学家可能在同一个实验室,也可能在国家的另一端。

这是第一次用人工智能编写的计算机代码来控制这种机器人。

研究小组给 Coscientist 下达了一些简单的任务,要求它让机器人液体处理机将彩色液体分配到一个包含 96 个小孔的平板上。他们告诉它"每隔一条线涂上你选择的一种颜色"、"画一条蓝色对角线",以及其他让人想起幼儿园的作业。

从"液体处理机 101"毕业后,团队让 Coscientist 接触了更多类型的机器人设备。他们与翡翠云实验室(Emerald Cloud Lab)合作,该实验室是一个商业设施,里面摆满了各种自动化仪器,包括分光光度计,可以测量化学样本吸收光的波长。然后,向 Coscientist 展示了一个装有三种不同颜色(红、黄、蓝)液体的盘子,要求他判断盘子里有哪些颜色以及这些颜色在盘子里的位置。

由于 Coscientist 没有眼睛,因此它编写了代码,以机器人的方式将神秘的色板递给分光光度计,并分析每个孔吸收的光波长,从而确定色板上有哪些颜色及其位置。为了完成这项任务,研究人员不得不给 Coscientist 一点正确的提示,让它思考不同颜色是如何吸收光线的。剩下的就交给人工智能了。

Coscientist 的期末考试是将组装好的模块和训练整合在一起,完成团队的指令,"执行铃木和薗头耦合反应"。这两个反应发现于 20 世纪 70 年代,利用金属钯催化有机分子中碳原子之间的键。事实证明,这种反应在生产治疗炎症、哮喘和其他疾病的新型药物方面非常有用。它们还被用于许多智能手机和显示器中有机发光二极管的有机半导体中。2010 年,苏古兹、理查德-海克和根岸英一共同获得诺贝尔奖,正式肯定了这些突破性反应及其广泛影响。

当然,Coscientist 公司之前从未尝试过这些反应。因此,笔者在撰写前文时,特意去维基百科上查了一下。

麦克奈特说:"对我来说,'尤里卡'时刻就是看到它提出了所有正确的问题。"麦克奈特设计了允许 Coscientist 搜索技术文档的软件模块。

Coscientist 主要在维基百科以及其他许多网站上寻找答案,其中包括美国化学学会、英国皇家化学学会的网站,以及其他包含描述铃木和薗头耦合反应的学术论文的网站。

在不到四分钟的时间里,Coscientist 就利用团队提供的化学物质设计出了产生所需反应的精确程序。当它试图用机器人在物理世界中执行程序时,它编写的控制液体样品加热和摇动装置的代码出现了错误。在没有人类提示的情况下,Coscientist 发现了问题所在,并查阅了设备的技术手册,修改了代码,然后再次尝试。

结果就出现在几个微小的透明液体样本中。博伊科对样本进行了分析,发现了铃木反应和薗头耦合反应的光谱特征。

当博伊科和麦克奈特告诉戈麦斯 Coscientist 的研究成果时,戈麦斯感到难以置信。"我以为他们在耍我,"他回忆道。"但他们没有。他们绝对没有。就在那时,我突然意识到,我们这里有一种非常新颖、非常强大的东西。"

有了这种潜在的力量,就需要明智地使用它,并防止滥用。戈麦斯说,了解人工智能的能力和局限是制定知情规则和政策的第一步,这些规则和政策可以有效防止人工智能的有害使用,无论是有意还是无意。他说:"我们需要对如何部署这些技术负责并深思熟虑。"

戈麦斯是为美国政府确保安全使用人工智能的努力提供专家建议和指导的几位研究人员之一,例如拜登政府于2023年10月发布的关于人工智能发展的行政命令。

加速发现,实现科学民主化

自然世界的规模和复杂程度几乎是无限的,其中蕴藏着难以计数的发现,等待着我们去发现。试想一下,新的超导材料可以大幅提高能源效率,新的化合物可以治愈原本无法治愈的疾病,延长人类寿命。然而,获得实现这些突破所需的教育和培训是一个漫长而艰辛的旅程。成为一名科学家很难。

戈麦斯和他的团队将 Coscientist 这样的人工智能辅助系统视为一种解决方案,它可以弥合尚未开发的浩瀚自然与训练有素的科学家供不应求这一事实之间的差距,而且可能永远如此。

人类科学家也有人类的需求,比如睡觉和偶尔走出实验室。而由人类指导的人工智能可以全天候地"思考",有条不紊地翻阅每一块箴言石,检查并重新检查实验结果的可复制性。"我们可以让一些东西自主运行,试图发现新现象、新反应、新想法,"戈麦斯说。

"你还可以大大降低任何领域的入门门槛,"他说。例如,如果一个没有受过铃木反应训练的生物学家想探索铃木反应的新用途,他们可以请 Coscientist 帮助他们规划实验,这可以实现资源和理解的大规模民主化。

戈麦斯说,科学中存在一个尝试、失败、学习和改进的迭代过程,而人工智能可以大大加快这一过程。"这本身就是一个巨大的变化"。

编译来源:ScitechDaily

我们在FebBox(https://www.febbox.com/cnbeta) 开通了新的频道,更好阅读体验,更及时更新提醒,欢迎前来阅览和打赏。使用教程

对文章打分

从代码到化学:掌握诺贝尔获奖反应的人工智能系统“Coscientist”

1 (50%)
已有 条意见

    最新资讯

    加载中...

    编辑精选

    加载中...

    热门评论

      Top 10

      招聘

      created by ceallan