构建理解化学原理的AI模型
创始人
2026-05-21 03:45:55
0

在所有可能存在的化合物中,据估计有10??到10??种化合物具有作为小分子药物的潜力。

然而,对每一种化合物逐一进行实验评估,对于化学家来说耗时过长,根本无法实现。因此,近年来,研究人员开始借助人工智能来辅助筛选潜在的候选药物化合物。

麻省理工学院(MIT)副教授康纳·科利(Connor Coley,博士,2019届)便是其中一位。他是1957届职业发展副教授,同时在化学工程系、电气工程与计算机科学系以及MIT施瓦茨曼计算学院担任联合职位。他的研究横跨化学工程与计算机科学两个领域,致力于开发和应用计算模型,分析海量潜在化合物、设计新型分子,并预测生成这些化合物的反应路径。

"这是一种极为通用的方法,可以应用于有机分子的各类场景,但我们主要关注的还是小分子药物的发现。"他说道。

AI与科学的交汇

科利对科学的热情似乎来自家庭的熏陶。他提到,自己家中的科学家比非科学家还多——父亲是一位放射科医生,母亲拥有分子生物物理与生物化学学位,后来进入MIT斯隆管理学院深造,祖母则是一位数学教授。

在俄亥俄州都柏林读高中期间,科利积极参加科学奥林匹克竞赛,并在16岁时便提前毕业。随后他进入加州理工学院,选择化学工程专业,因为这个专业恰好能将他对科学与数学的兴趣融为一体。

本科期间,他同样热衷于计算机科学,曾在一个结构生物学实验室使用Fortran编程语言,参与蛋白质晶体结构的解析工作。从加州理工毕业后,他决定继续深耕化学工程,于2014年来到MIT攻读博士学位。

在导师克拉夫斯·延森(Klavs Jensen)和威廉·格林(William Green)教授的指导下,科利致力于优化自动化化学反应。他的研究聚焦于将机器学习与化学信息学——即将计算方法应用于化学数据分析的学科——相结合,以规划合成新型药物分子的反应路径。与此同时,他还参与设计了能够自动执行这些反应的硬件装置。

其中部分工作是在美国国防高级研究计划局(DARPA)资助的"Make-It"项目框架下开展的,该项目专注于利用机器学习和数据科学,提升从简单构建模块合成药物及其他有用化合物的能力。

"那段经历真正让我开始思考化学信息学、机器学习,以及如何利用模型来理解不同化学物质的合成方式和可能发生的反应。"科利说。

还在读博士期间,科利便开始申请教职,并在25岁时接受了MIT的职位邀请。关于是否留在自己攻读博士的学校任职,他收到了各种不同的建议,但最终认为MIT的这个机会实在难以割舍。

"MIT在资源配置和跨部门协作的流畅度上都极为独特。MIT在支持AI与科学的交叉融合方面做得非常出色,这里是一个充满活力的生态系统,值得留下来。"他说,"学生的水准、他们的热情,以及这里无与伦比的合作氛围,都远远超过了留在同一所学校可能带来的任何顾虑。"

化学直觉

科利推迟了一年入职,前往博德研究所(Broad Institute)进行博士后研究,积累了更多化学生物学和药物发现方面的经验。在那里,他致力于从DNA编码文库的数十亿候选分子中筛选出可能与疾病相关突变蛋白产生结合作用的小分子化合物。

2020年回到MIT后,他组建了自己的实验室团队,目标不仅是利用AI合成现有的具有治疗潜力的化合物,更是要设计具备理想性质的新型分子,并探索合成它们的新途径。过去几年间,他的实验室开发了多种计算方法来推进上述目标。

"我们会思考如何将化学领域的挑战与合适的计算解决方案相匹配,而这种匹配往往又会推动新方法的诞生。"科利说。

他的实验室开发了一款名为ShEPhERD的模型,该模型通过分析候选药物分子的三维空间形状,评估其与靶蛋白的相互作用方式,从而筛选潜在的新型药物分子。目前,这一模型已被多家制药公司用于辅助新药发现。

"我们希望赋予生成模型更多药物化学的直觉,让模型能够感知正确的评判标准和考量因素。"科利说。

在另一个项目中,科利实验室开发了一款名为FlowER的生成式AI模型,可用于预测不同化学原料组合后的反应产物。

在设计该模型时,研究人员将质量守恒定律等基本物理原理内嵌其中,同时要求模型对从反应物到产物的反应路径中各中间步骤的可行性进行评估。研究发现,这些约束条件显著提升了模型预测的准确性。

"思考中间步骤、反应机理以及反应的演变过程,对化学家来说是非常自然的事情——化学本就是这样教的,但这并不是模型会自发思考的内容。"科利说,"我们花了大量时间研究如何让机器学习模型真正扎根于对反应机理的理解,就像一位资深化学家那样去思考问题。"

他实验室的学生还在化学反应优化的诸多相关领域开展研究,包括计算机辅助结构解析、实验室自动化以及最优实验设计等。

"通过这些多元化的研究方向,我们希望不断推进AI在化学领域的前沿探索。"科利说。

Q&A

Q1:ShEPhERD模型是如何帮助药物发现的?

A:ShEPhERD是由科利实验室开发的一款计算模型,它通过分析候选药物分子的三维空间形状,评估其与靶蛋白之间的相互作用方式,从而筛选出更具潜力的新型药物分子。该模型的核心优势在于为生成模型引入了药物化学直觉,使其能够基于正确的评判标准进行筛选。目前,ShEPhERD已被多家制药公司应用于新药发现流程中。

Q2:FlowER模型在预测化学反应时有什么特别之处?

A:FlowER是科利实验室开发的一款生成式AI模型,用于预测不同化学原料组合后的反应产物。与其他模型不同的是,FlowER在设计时内嵌了质量守恒定律等基本物理原理,并要求模型对反应路径中各中间步骤的可行性进行评估。这种对反应机理的深度理解,模拟了化学家的思维方式,从而显著提升了模型预测的准确性。

Q3:AI技术在小分子药物发现中具体解决了什么难题?

A:在所有潜在化合物中,估计有10??到10??种可能具有小分子药物价值,传统实验方法根本无法逐一评估。AI技术的引入,使研究人员能够通过计算模型快速分析海量候选化合物、设计具备理想性质的新型分子,并预测合成这些分子的反应路径,大幅提升了药物发现的效率与可能性。

相关内容

最新资讯

培养具有家国情怀、工程伦理与创... 近日,“共话十五五新征程,共探高质量发展新路径”第七届研究生浦江论坛闭幕式在东华大学举行。本届论坛聚...
快乐学习行动|含山县教育局举行... 为贯彻“健康第一”理念,推进体教融合,丰富学生课余文化生活,近日,含山县教育局举行2026年全县中小...
南开大学图书馆召开教学成果论证... 为进一步凝练本科教学成果、提升申报质量,5月12日,南开大学图书馆、信息与传播学院联合召开本科教学成...
国际数据公司:全球AI超级周期... 中新社北京5月20日电 (记者 王梦瑶)全球知名科技市场研究与数据分析机构国际数据公司(IDC)20...
2026 AI Partner... 北京2026年5月21日-- 5月19日至20日,以"带着AI去前线"为主题的2026 AI Par...
CIO与CHRO携手合作,共同... Gartner上周发布的一项研究显示,到2027年,缺乏完善AI人才战略的企业,将有半数面临顶尖AI...
天津大学海南国际学院亮相!欢迎... 5月16-18日 中外合作办学高质量发展论坛 在海南陵水黎安国际教育创新试验区 圆满举办 论坛由天津...
构建理解化学原理的AI模型 在所有可能存在的化合物中,据估计有10??到10??种化合物具有作为小分子药物的潜力。 然而,对每一...
东材科技涨7.67%,开源证券... 今日东材科技(601208)涨7.67%,收盘报51.49元。 2026年4月24日,开源证券研究员...