AI将“触手”伸向合成化学 脑力劳动还是人类专长吗?
发布在2018年3月28日的《自然》新闻与观点上
原文作者:Derek Lowe
为合成化学设计有效合成路线的软件一直依赖于研究者的规则输入。现在有报道称人工智能程序系统可以自己学习相关规则。
合成有机化学是一门关于从简单的分子着手构建所需化学结构的科学。研究者的学识和经验一直是构建成功的合成路线的关键。但在《自然》发表的一篇论文中(论文免费阅读链接:https://rdcu.be/OQBL),Segler 等人报道称:一款人工智能程序可以设计化合物合成路线,而且效果至少在理论上与由人类设计的不相上下。
在设计合成路线时,有机化学家常常需要使用逆向思维。上世纪60年代,E。 J。 Corey提出逆向合成的概念,并因此荣获1990年的诺贝尔化学奖。逆向合成为化学家们提供了特定的思维方式(图1)。在观察目标分子时,他们会问:“这个化合物能从什么原料制得?要形成哪些键?哪些原子或化学基团可以增加或转化?”然后,重复该过程,直到得到前体分子。这样做的目的是反推得到易获取的起始化合物,同时平衡好构成良好合成路线的各种因素,包括反应的步数、预计的产率以及所涉及的化学物质的易用性。有机化学家们经常要处理这些问题,例如在药物发现项目中制备大量化合物用于测试。图1|逆合成分析。化学家使用被称为逆向合成的策略来设计有机分子合成的路线。a,首先设计一个理论路线,将目标分子依次转换成易制备或可购买的中间体。在这个例子中,目标分子中的红色键和原子可以从中间体分子中的红色双键得到。接下来,中间体的红色双键和蓝色键可以通过两个可直接购买的原料一步得到(Et是乙基的缩写)。b,然后选择反应将原料转化为目标分子:在上面的例子中,使用狄尔斯-阿尔德反应得到中间体,随后通过金属催化氧化获得目标分子。Segler等人报道的人工智能程序可以通过自行推断设计规则,来为分子设计合理的合成路线。
自19世纪中叶合成有机化学诞生以来,已有大量的合成有机反应被报道,且其数量每时每刻都还在增长。20世纪80年代之前,许多化学家通过收集记载了文献中有用反应的、交叉引用的手写索引卡片,来指导设计合成路线。随着计算机技术的普及,这些索引卡片自然地移动到数字数据库中。
近年来,当化学家想了解将官能团X转变为官能团Y的各种方法时,他们会先使用计算机程序来绘制感兴趣的分子结构,然后在线搜索相关反应。这几乎总是会产生一个长长的清单,研究人员需要根据其知识和经验来选择最合适的反应。一直以来,把这些反应串成一种有用的合成方法被认为只有人类才能做到。但一定要这样做才行吗?是否有一个程序能够基于一个足够大并精心制作的化学反应数据库,不仅可以找到反应还能将它们编排成合理的合成路径呢?从上世纪60年代Corey提出逆向合成以来,人们就一直在试图找到这样的程序,但几无进展(直到最近)。
两个根本问题使该梦想受挫。首先,计算机硬件无法处理这一量级的挑战。第二,化学文献很难用软件程序所能理解的术语来定义:对于给定的反应,它们大部分时间都适用于某种化合物类型,但仅在某些特定条件下才真正适用。例如,官能团X将变成官能团Y,除非官能团Z存在于反应物分子的其他地方。当官能团Z存在时,如果官能团Q与其在同一个分子的附近,则反应可能仍然有效,但仅当pH低于某个值或温度足够高或无水时,这些才会成立。
克服第二个问题的方法多种多样。一是为程序提供一份人为制定的可实现预期化学转化反应的详尽列表,把所有的限制和条件都考虑在内。然后,程序利用一种类似于评估国际象棋招式组合的方式,将这些反应组合起来得到合成路线。这种方法已取得一定成效,市场上已有几个相互竞争的商业软件产品。[page]分页标题[/page]
Segler等人研究了另一种方法:可不可以设计一个可以自行学习研究人员所知知识的程序,从而代替研究人员把专业知识加载到机器上的过程呢?这个概念已经产出了惊人的结果,已有程序可以自行学习玩游戏,如围棋,而不是使用人的策略来训练它们。作者设计了一个计算程序,它可以自动从一个大型商业数据库中提取化学转化反应,并谨慎地使用那些报道过多次的反应。他们的系统认为这些挑出来的反应是有机合成中“可行的步骤”。
当系统被要求设计一个目标分子的合成路线时,它会像人一样从目标分子开始逆向工作,根据所学的设计规则挑选出最有希望的前体分子,然后评估合成这些分子的可行性。作者将三个人工神经网络与随机蒙特卡洛树搜索(计算机在某些决策过程中使用的一种搜索算法)相结合,以缩小最有希望的合成路线范围,且不会在某一特定路径上被很快卡住。
更重要的是,给出的路线不仅由程序的评分系统评估,还由训练有素的有机化学家对其可行性进行盲评。面对机器生成的目标分子的合成路线以及研究文献中报道的合成路线,这些化学家没有对同仁们研究得出的合成路线表现出任何的偏好。换句话说,他们认为这个程序所建议的化学反应和研究人员提出的一样合理。这并不一定意味着所有机器建议的路线都能在实验室中得到预期的结果;但是,正如有机化学家所抱憾的一样,许多人类设计的路线一样会失败。未来进一步的程序开发应该将这些实际结果包括在内,以确定机器提出的路线是否比人类设计的路线更好(或者至少不差)。今年,有一项评估较传统的、人工管理的逆向合成程序的研究值得注意,该研究就包含了一个类似的实验室测试部分。
就Segler及其同事所做的程序而言,其设计的合成路线与研究人员做的相比“不差”就是一次重大胜利,因为其用时更少,覆盖的文献更多。
如果这类程序达到预期——几乎没有理由认为它们做不到,那么合成化学家的一项主要工作就将消失。技术创新在过去也产生了类似的效果,但通常是取代那些没有人会怀念的繁重的体力活。令人不安的是,日益发展的人工智能正在将“触手”伸向脑力劳动。虽说总会有那些软件无法处理的、复杂而又不同寻常、前所未见的结构,但是在解决较为常规的合成问题时,研究员将被人工智能取代。
说智力活动可以被划为能被自动化代替的繁重体力活,可能冒犯了许多化学家,并让其感觉受到威胁。但是人工智能的应用实际上会释放出更多的时间来让化学家思考更高深的问题,譬如应该合成哪些分子以及为什么,而不是把重点放在如何制备出分子的细节上。并非所有的研究人员都欢迎这种转变。但不管怎样,它似乎不可回避。

- AMD助力微软Windows 11 为用户带来强大、可靠的计算能力2021-10-09 16:20
- 游戏玩家为之疯狂!Chinajoy2021 AMD展台那些火爆的瞬间2021-08-02 15:39
- 全场最佳 AMD Chinajoy2021展台圆满收官2021-08-02 15:38
- AMD 锐龙5000G系列处理器正式亮相Chinajoy20212021-08-02 11:50
- 极速制胜 制霸游戏 AMD携多款游戏神器扬威Chinajoy2021-08-02 11:44
- 央视《新闻联播》头条聚焦铁建重工,聚力攻克“卡脖子”技术难题2021-03-22 11:08
- 刚刚!我又上央视新闻联播头条了!2021-03-22 11:04
- 中国电科(3月1日-3月7日)要闻回顾 | 资讯轻阅读2021-03-22 10:47
- 我国将建第一个国家公园:为何是三江源2021-03-22 10:43
- 美国硅谷上演“大逃亡”:郊区成科技精英避难所2021-03-22 10:41

- 08:51聚东山智慧 谋发展新篇 2025东山大会在浙江绍兴举办
- 19:22要求所有售后服务商停止小米和格力业务?美的辟谣
- 14:49金海汇成投资有限公司财富增长的双轮驱动
- 16:19四川水井坊邛崃全产业链基地:传承非遗技艺,坚持开放发展
- 16:44金海汇成投资有限公司财富增长的方法论基石
- 18:01易萃享:27 年康力匠心,铸就数智健康新标杆
- 17:54易萃享:以数智之力,让健康管理触手可及
- 17:27易萃享:不止是营养机,更是家庭健康管理中心
- 17:19易萃享:AI 赋能,解锁 “一人一案” 的营养新范式
- 17:09易萃享:1000 日夜打磨,让精准营养走进寻常家
- 19:41政产协企四方联动 | 浙江省住建厅、九牧、链筑、房企共研:好房子需配备智
- 19:40武汉智博会 | 卫浴独家!九牧携产业链伙伴智造中国“好房子”
- 19:39九牧领跑科技卫浴新赛道,“好房子” 实践响应十五五规划
- 20:40东方药林百年纳:科技赋能 开启活力健康新航程
- 20:35东方药林百年纳:四大专利加持 解锁现代健康新方案
- 20:29东方药林魔术丝:传承本草智慧 点亮现代秀发之美
- 20:18魔术丝白黑客防脱育发液:天然植萃赋能 解锁秀发焕变密码
- 20:06竹奥秘毛巾:东方药林创新竹锟科技的匠心之作
- 19:23东方药林竹奥秘:解锁竹萃能量 重塑健康生活理念
- 12:21南京市人才一期发展基金合伙企业子基金遴选结果公布
- 18:43水井坊发布2025年前三季度业绩报告
- 17:58去信任的商业文明:当算法取代权威,当信任回归众人
- 20:29助推高质量产业发展·创投实录|华青领创:敢于“掀桌”,方见新“视界”
- 12:32“第一届传媒可持续发展·ESG作品榜”正式发布 2025企业可持续发展大
- 18:28【一个世界 无限场景】泽瑞萬象元宇宙计划正式启动 & 全球首秀
- 07:45纳米晶体甲地孕酮,让肿瘤患者体重“向上”,生存“向上”
- 21:40创投集团直投企业瑞为新材获得第七批专精特新“小巨人”企业认定
- 12:19九牧智能卫浴助建中国“好房子”,杭州好房子私享会今日召开!
- 14:04金海汇成投资有限公司如何打造高效资产证券化产品
- 17:01ChainVault亮相伦敦区块链大会:引爆欧洲RWA新风口



