AI将“触手”伸向合成化学 脑力劳动还是人类专长吗?
发布在2018年3月28日的《自然》新闻与观点上
原文作者:Derek Lowe
为合成化学设计有效合成路线的软件一直依赖于研究者的规则输入。现在有报道称人工智能程序系统可以自己学习相关规则。
合成有机化学是一门关于从简单的分子着手构建所需化学结构的科学。研究者的学识和经验一直是构建成功的合成路线的关键。但在《自然》发表的一篇论文中(论文免费阅读链接:https://rdcu.be/OQBL),Segler 等人报道称:一款人工智能程序可以设计化合物合成路线,而且效果至少在理论上与由人类设计的不相上下。
在设计合成路线时,有机化学家常常需要使用逆向思维。上世纪60年代,E。 J。 Corey提出逆向合成的概念,并因此荣获1990年的诺贝尔化学奖。逆向合成为化学家们提供了特定的思维方式(图1)。在观察目标分子时,他们会问:“这个化合物能从什么原料制得?要形成哪些键?哪些原子或化学基团可以增加或转化?”然后,重复该过程,直到得到前体分子。这样做的目的是反推得到易获取的起始化合物,同时平衡好构成良好合成路线的各种因素,包括反应的步数、预计的产率以及所涉及的化学物质的易用性。有机化学家们经常要处理这些问题,例如在药物发现项目中制备大量化合物用于测试。图1|逆合成分析。化学家使用被称为逆向合成的策略来设计有机分子合成的路线。a,首先设计一个理论路线,将目标分子依次转换成易制备或可购买的中间体。在这个例子中,目标分子中的红色键和原子可以从中间体分子中的红色双键得到。接下来,中间体的红色双键和蓝色键可以通过两个可直接购买的原料一步得到(Et是乙基的缩写)。b,然后选择反应将原料转化为目标分子:在上面的例子中,使用狄尔斯-阿尔德反应得到中间体,随后通过金属催化氧化获得目标分子。Segler等人报道的人工智能程序可以通过自行推断设计规则,来为分子设计合理的合成路线。
自19世纪中叶合成有机化学诞生以来,已有大量的合成有机反应被报道,且其数量每时每刻都还在增长。20世纪80年代之前,许多化学家通过收集记载了文献中有用反应的、交叉引用的手写索引卡片,来指导设计合成路线。随着计算机技术的普及,这些索引卡片自然地移动到数字数据库中。
近年来,当化学家想了解将官能团X转变为官能团Y的各种方法时,他们会先使用计算机程序来绘制感兴趣的分子结构,然后在线搜索相关反应。这几乎总是会产生一个长长的清单,研究人员需要根据其知识和经验来选择最合适的反应。一直以来,把这些反应串成一种有用的合成方法被认为只有人类才能做到。但一定要这样做才行吗?是否有一个程序能够基于一个足够大并精心制作的化学反应数据库,不仅可以找到反应还能将它们编排成合理的合成路径呢?从上世纪60年代Corey提出逆向合成以来,人们就一直在试图找到这样的程序,但几无进展(直到最近)。
两个根本问题使该梦想受挫。首先,计算机硬件无法处理这一量级的挑战。第二,化学文献很难用软件程序所能理解的术语来定义:对于给定的反应,它们大部分时间都适用于某种化合物类型,但仅在某些特定条件下才真正适用。例如,官能团X将变成官能团Y,除非官能团Z存在于反应物分子的其他地方。当官能团Z存在时,如果官能团Q与其在同一个分子的附近,则反应可能仍然有效,但仅当pH低于某个值或温度足够高或无水时,这些才会成立。
克服第二个问题的方法多种多样。一是为程序提供一份人为制定的可实现预期化学转化反应的详尽列表,把所有的限制和条件都考虑在内。然后,程序利用一种类似于评估国际象棋招式组合的方式,将这些反应组合起来得到合成路线。这种方法已取得一定成效,市场上已有几个相互竞争的商业软件产品。[page]分页标题[/page]
Segler等人研究了另一种方法:可不可以设计一个可以自行学习研究人员所知知识的程序,从而代替研究人员把专业知识加载到机器上的过程呢?这个概念已经产出了惊人的结果,已有程序可以自行学习玩游戏,如围棋,而不是使用人的策略来训练它们。作者设计了一个计算程序,它可以自动从一个大型商业数据库中提取化学转化反应,并谨慎地使用那些报道过多次的反应。他们的系统认为这些挑出来的反应是有机合成中“可行的步骤”。
当系统被要求设计一个目标分子的合成路线时,它会像人一样从目标分子开始逆向工作,根据所学的设计规则挑选出最有希望的前体分子,然后评估合成这些分子的可行性。作者将三个人工神经网络与随机蒙特卡洛树搜索(计算机在某些决策过程中使用的一种搜索算法)相结合,以缩小最有希望的合成路线范围,且不会在某一特定路径上被很快卡住。
更重要的是,给出的路线不仅由程序的评分系统评估,还由训练有素的有机化学家对其可行性进行盲评。面对机器生成的目标分子的合成路线以及研究文献中报道的合成路线,这些化学家没有对同仁们研究得出的合成路线表现出任何的偏好。换句话说,他们认为这个程序所建议的化学反应和研究人员提出的一样合理。这并不一定意味着所有机器建议的路线都能在实验室中得到预期的结果;但是,正如有机化学家所抱憾的一样,许多人类设计的路线一样会失败。未来进一步的程序开发应该将这些实际结果包括在内,以确定机器提出的路线是否比人类设计的路线更好(或者至少不差)。今年,有一项评估较传统的、人工管理的逆向合成程序的研究值得注意,该研究就包含了一个类似的实验室测试部分。
就Segler及其同事所做的程序而言,其设计的合成路线与研究人员做的相比“不差”就是一次重大胜利,因为其用时更少,覆盖的文献更多。
如果这类程序达到预期——几乎没有理由认为它们做不到,那么合成化学家的一项主要工作就将消失。技术创新在过去也产生了类似的效果,但通常是取代那些没有人会怀念的繁重的体力活。令人不安的是,日益发展的人工智能正在将“触手”伸向脑力劳动。虽说总会有那些软件无法处理的、复杂而又不同寻常、前所未见的结构,但是在解决较为常规的合成问题时,研究员将被人工智能取代。
说智力活动可以被划为能被自动化代替的繁重体力活,可能冒犯了许多化学家,并让其感觉受到威胁。但是人工智能的应用实际上会释放出更多的时间来让化学家思考更高深的问题,譬如应该合成哪些分子以及为什么,而不是把重点放在如何制备出分子的细节上。并非所有的研究人员都欢迎这种转变。但不管怎样,它似乎不可回避。

- AMD助力微软Windows 11 为用户带来强大、可靠的计算能力2021-10-09 16:20
- 游戏玩家为之疯狂!Chinajoy2021 AMD展台那些火爆的瞬间2021-08-02 15:39
- 全场最佳 AMD Chinajoy2021展台圆满收官2021-08-02 15:38
- AMD 锐龙5000G系列处理器正式亮相Chinajoy20212021-08-02 11:50
- 极速制胜 制霸游戏 AMD携多款游戏神器扬威Chinajoy2021-08-02 11:44
- 央视《新闻联播》头条聚焦铁建重工,聚力攻克“卡脖子”技术难题2021-03-22 11:08
- 刚刚!我又上央视新闻联播头条了!2021-03-22 11:04
- 中国电科(3月1日-3月7日)要闻回顾 | 资讯轻阅读2021-03-22 10:47
- 我国将建第一个国家公园:为何是三江源2021-03-22 10:43
- 美国硅谷上演“大逃亡”:郊区成科技精英避难所2021-03-22 10:41

- 17:41南京先进制造产业专项母基金公布子基金遴选结果
- 17:20五力赋能 破浪笃行——东方药林第十一届初级晋级训练营圆满落幕
- 11:24未来更「耀」在一起 —— 2026康力燃梦启新年度盛典璀璨收官!
- 09:48南京市创投集团直投企业贝耐特完成数千万元融资
- 11:32金海汇成投资有限公司如何以创新路径重构产业生态
- 11:31东方药林第4期研修班圆满落幕 以学习型组织建设驱动企业高质量发展
- 17:2240万债权击穿10亿资产酒企?徽酒集团双轮酒业二次破产背后的博弈
- 19:40南京市创投集团合作子基金投资企业壁仞科技成功登陆港交所
- 15:12降价超75%!纳米晶体甲地孕酮医保落地,为肿瘤CACS患者送来诊疗福音
- 14:51纳米晶型甲地孕酮(美适亚)纳入2026医保,为CACS患者打破“厌食-死
- 10:57「山谷奇技,声乐造艺」 全新宝珀北京王府中環旗舰店盛大启航
- 10:57宝珀“大音乐家-四音四锤双旋律大小自鸣”超复杂功能腕表
- 18:57南京先进制造产业专项母基金子基金遴选结果揭晓
- 17:38东方药林:携手第四小组成员单位共推行业党建提质增效
- 12:32兑现“好房子”承诺:解读九牧的“场景答案”
- 20:05全美世界紧急捐赠100万港币 支援香港火灾善后重建
- 19:55皙之密护肤套装测评:秋冬干燥肌的水润守护
- 18:36市占率第一!九牧领跑中国“好房子”卫浴赛道
- 10:41智界潮改车共创大赛:从“用户共创”到“生态共生”的品牌文化构筑新范式
- 13:36南京市紫金生物医药产业投资基金合伙企业子基金遴选结果揭晓
- 14:40前沿技术赋能全域数据安全 安全防控可信数据空间 V1.0 版正式发布
- 14:38第一届濮院电竞节,今日启幕!
- 15:04助推产业链高质量发展·创投实录|清普生物:长效新药破“痛局”
- 11:38响应高质量发展,九牧为“好房子”拓路:从部委示范到全域智慧生态
- 10:28万亿市场税收变局 紫竹药业避孕药份额面临调整压力
- 17:18金海汇成投资有限公司创新路径与全球视野
- 14:22广州易萃享:立足羊城匠心,打造精准营养新标杆
- 14:05易萃享健康:数智驱动,让健康管理触手可及
- 10:11创投集团直投企业他山科技完成新一轮融资
- 09:36易萃享健康:全周期管理,筑起家庭健康屏障



