撰文丨王聪
编辑 | 王多鱼
排版 | 水成文
高效的分子设计方法对加速早期药物研发至关重要,有望节省数年的开发时间与数十亿美元的研发成本。
当前的分子设计方法主要依赖基于序列或图结构的表现形式,虽然能精准描述化学键、原子等局部特征,但缺乏对分子整体拓扑结构的全面表征。
2025 年 2 月 18 日,湖南大学信息科学与工程学院曾湘祥教授团队在 Nature 子刊Nature Machine Intelligence上发表了题为:Image-based generation for molecule design with SketchMol 的研究论文。
该研究开发了一种基于图像的分子设计生成系统——SketchMol,并通过实验验证了 SketchMol 能高效完成多类分子设计任务,其图像驱动的设计范式为药物发现提供了创新性技术路径。
该研究提出的 SketchMol,融合了视觉理解与分子设计的图像生成框架,其技术突破包括:
1、跨模态生成架构
采用扩散模型(diffusion model)生成分子图像;
创新性应用基于分子专家知识的强化学习(reinforcement learning)来优化技术优化可行性分子的生成。
2、绘画式分子构建
同步描绘分子局部结构与全局空间布局;
支持通过"分子画布"实现原子/官能团的可视化编辑。
3、任务统一框架
从头设计任务转化为分子草图绘制;
将分子编辑任务转变为局部图像补全。
EP4 是前列腺素 E2 受体的一种亚型,常作为炎症和癌症的药物靶点。在药物化学实践中,药理学家通常从已知活性片段出发(如下图A左侧原始结构),通过逐步结构扩展策略进行分子优化。该研究应用 SketchMol 平台模拟了这一经典研发流程:
1、计算机辅助生长模拟,基于 EP4 受体活性片段(灰色骨架部分)启动设计,再通过迭代式图像编辑实现官能团延伸(浅蓝色标注为新增结构域)。
2、先导化合物复现验证,成功生成专利文献中记载的EP4活性先导化合物(结构B),经分子对接验证,优化后分子与受体结合模式与报道数据一致。
浅蓝色高亮区域显示 SketchMol 在片段生长过程中添加的关键药效基团,该可视化方案直观展示了基于图像驱动的结构优化路径。
通过大量实验验证,研究团队证明了 SketchMol 能高效完成多类分子设计任务,其图像驱动的设计范式为药物发现提供了创新性技术路径。
2024 年 11 月,曾湘祥团队在 Nature 子刊Nature Computational Science上发表了题为: A deep learning approach for rational ligand generation with toxicity control via reactive building blocks 的研究论文。
受 DNA 编码化合物库技术的启发,该研究提出了一种基于结构块的配体生成深度学习方法——DeepBlock,该方法针对靶标蛋白序列进行定制,同时实现精确的性质调控。DeepBlock 将生成过程清晰地划分为两个步骤:结构块生成和分子重构,分别由神经网络和提出的基于规则的重构算法完成。此外,DeepBlock 协同整合优化算法与深度学习技术,以调控生成分子的性质。实验表明,DeepBlock 在生成具有结合亲和力、合成可及性及类药性的配体方面优于现有方法。此外,当与以毒性为优化目标的模拟退火或贝叶斯优化相结合时,DeepBlock 能成功生成低毒性配体,同时保持与靶标的亲和力。
2022 年 11 月,曾湘祥团队在 Nature 子刊Nature Machine Intelligence上发表了题为:Accurate prediction of molecular properties and drug targets using a self-supervised image representation learning framework 的研究论文。
该研究提出了一种无监督预训练深度学习框架——ImageMol,该框架基于 1000 万未标记的类药生物活性分子进行预训练,用于预测候选化合物的分子靶点。ImageMol 框架旨在通过分子像素级信息,基于分子的局部和全局结构特征从未标记分子图像中预训练化学特征表示。
研究团队在 51 个基准数据集上证明了 ImageMol 在评估分子特性(即药物代谢、脑部渗透性和毒性)和分子靶点谱(即β-分泌酶和激酶)方面的高性能。 ImageMol 在美国国家转化科学促进中心的 13 个高通量实验数据集中显示出识别抗 SARS-CoV-2 分子的高准确性。 通过 ImageMol,鉴定出可用于 COVID-19 潜在治疗的临床候选 3CL 蛋白酶抑制剂。
论文链接:
https://www.nature.com/articles/s42256-025-00982-3
https://www.nature.com/articles/s43588-024-00718-0
https://www.nature.com/articles/s42256-022-00557-6