AI蛋白质设计线上实操直播课

2025 年 2 月 13 日,诺奖得主、华盛顿大学David Baker团队在Science期刊发表了题为:Computational design of serine hydrolases 的研究论文。

该研究利用 AI 从头设计了具有复杂活性位点的丝氨酸水解酶,这也是首次从头设计一种新的酶,其能够加快一个四步化学反应(该反应对于许多生物和工业过程至关重要,其中包括塑料降解和回收),其催化效率是之前设计的水解酶催化效率的 6 万倍。


这项研究是酶工程领域的一个里程碑,表明了我们现在已经可以设计出具有天然活性的酶,而且这些设计的酶甚至能够实际应用。


David Baker教授表示,酶是在温和的条件下加速化学反应的蛋白质,而即使是最优秀的人类化学家也做不到这一点。利用 AI 设计新的酶来应对各种化学挑战,无论是合成药物化合物还是分解微塑料,都将使我们得以利用大自然的高效率,而无需以来刺激性溶剂或化石燃料。

主讲老师来自北京大学,从事AI for science方向研究,目前的主要研究方向是人工智能辅助的蛋白质等分子体系的采样,在分子模拟上由丰富的实战经验。已在JCIM、communications physics等国际期刊上发表数篇文章,其设计的蛋白质采样算法UFConf的发表文章,被选为JCIM杂志的当期封面文章以及编辑推荐,具有广泛的影响力。

专题一、蛋白质设计概述与工具准备

1.为什么要做蛋白质设计?

蛋白质广阔的可能结构空间

2.蛋白质设计方法分类

目前最佳解决方案:

蛋白质结构预测:Alphafold2,Rosettafold2

固定结构序列预测:ProteinMPNN

从头设计:RFDiffusion+ProteinMPNN+Alphafold2迭代


3.Vscode的使用,ssh连接超算集群(实操)

VScode的安装

Remote ssh插件安装

~/.ssh/config中配置username, ip信息

4.Linux的配置,创建python环境(实操)

Conda create -n env_name python=3.9

5.超算作业提交(实操)

Slurm作业管理系统的教学,sbatch, salloc,scancel的使用

6.生成模型概览,特别讲Diffusion model理论

通过本天培训学员将掌握:

本专题将介绍蛋白质设计的基本背景和意义,以及一些工具的基本知识分为如下几个部分:首先介绍蛋白质设计的意义以及当前蛋白质设计的主要方法,包括Alphafold2、Rosettafold2等结构预测方法,ProteinMPNN等逆折叠模型以及RFDiffusion等结构设计方法。接着,课程将引导学员安装并配置VScode,进行SSH连接超算集群的配置,并介绍Linux环境的搭建,为后续的计算实验做好准备。最后将通过几个简单的例子来介绍在超算集群上提交作业的方式。将根据课程进度来决定是否讲解生成模型的基本原理。

专题二、深度学习蛋白质结构预测方法

1.基于深度学习的模型--Alphafold2、Rosettafold

AF2成功的原因:

a.利用MSA信息

b.Transformer提取行纵MSA的信息

c.Recycling

d.自蒸馏数据集(pLDDT的引入)

2. AF2 本地运行(实操)

2.1基于Alphafold2的复现工作—Openfold、Unifold

3.Alphafold2上机实操

3.1MSA由mmseqs2 api生成,不需要下载结构和序列的数据集(需要3TB的空间)


4.基于语言模型的模型—ESMfold(实操)

4.1ESMfold的逻辑:用Masked LM替代掉AF2中的MSA模块

4.2ESMfold安装:(确保nvcc安装)


5.蛋白质多链结构预测—Alphafold multimer

6.蛋白-核酸复合物预测—RosetaffoldNA(实操)

Add nucleic acid representation


7.蛋白-核酸-小分子复合物预测—Rosetaffold-all atom, Alphafold3


通过本天培训学员将掌握:

本专题将详细讲解多种蛋白质结构预测模型,包括Alphafold2、Rosettafold2、ESMfold、RosettafoldNA、Rosettafold All Atom和AlphaFold3。分为如下几个部分:首先我们将介绍Alphafold2模型的基本原理以及其成功的原因,接着我们会介绍ESMfold的基本原理,并进行上机实操演示,接着我们会介绍Alphafold-multimer相比单链预测的主要难点,接下来我们会介绍一些蛋白质和其他分子复合物的预测模型RosettafoldNA、Rosettafold All Atom和AlphaFold3。然后我们会上机实际操作如何以最简便的方式本地运行Alphafold2,无需加载庞大的数据集。在本专题最后我们会进行一个论文复现,利用MSA子采样来提升Alphafold2的采样多样性。让学员都能够掌握多种蛋白质结构预测模型的使用

专题三、深度学习蛋白质多构象采样方法与模型

蛋白质多构象预测(模拟)

1. 基于传统物理能量的方法—分子动力学MD

2. 基于MSA操纵的方法—MSA subsampling、AF cluster(实操)

MSA subsampling方法子采样AF2的MSA输入

MSA subsampling方法

2.1环境配置与AF2一样

2.2AF_cluster方法

2.3环境配置与AF2一样运行

2.4生成MSA

2.5模型预测


3.基于生成模型的方法—Alphaflow、UFConf、DiGAlphaflow uses flow matching(实操)

3.1Alphaflow方法

3.2python环境配置运行

3.3input_csv代表蛋白的序列信息

3.4msa_dir代表MSA的路径

3.5weights代表使用的模型

3.6.samples代表采样数目


4.UFConf使用Diffusion model(实操)

通过本天培训学员将掌握:

本专题将介绍蛋白质多构象采样的方法与模型,主要包括MSA操纵和生成模型两大类方法。分为如下几个部分:首先我们会介绍MSA操纵的方法,我们将讲解MSA subsampling和AF_cluster方法;接着我们会介绍生成模型的方法,将介绍Alphaflow和UFConf模型。接下来我们会进行AF_cluster文献中的案例复现。最后我们将介绍UFConf模型的上手实践,并对不同的蛋白质采样方法作以对比。让学员都能够掌握蛋白质多构象采样方法与模型使用工具

专题四、深度学习蛋白质数据集挖掘工具与蛋白质口袋搜索工具

1.蛋白质数据集挖掘工具

1.1序列比对和聚类工具

1.2BLAST速度慢

2.序列快速比对工具MMseqs2


2.1.对角线上的k-mer短序列匹配

22.table查找对应target序列上k-mer出现的位置

2.3.target序列和query序列的匹配


3.结构比对和聚类工具

3.1TM-align

4.结构快速比对工具Foldseek

41Foldseek团队与mmseqs系列对比

5.Foldseek上机实操


6、深度学习蛋白质口袋搜索工具

6.1.蛋白质口袋搜索

6.2Alpha sphere

7.基于结构的蛋白质口袋搜索工具--Fpocket、CavityPlus(实操)

8.基于轨迹(多构象)的蛋白质口袋搜索—Mdpocket(实操)


9.基于深度学习的蛋白质小分子结合位点预测工具—Diffdock

Diffdock上机实操


通过本天培训学员将掌握:

本专题将详细介绍蛋白质数据集挖掘工具,重点讲解序列比对工具mmseqs2和结构比对工具foldseek的应用。分为如下几个部分:首先我们会介绍序列比对的方法概览,并简要演示传统的序列比对方法如BLAST;接下来我们会介绍更有效的序列比对方法mmseqs2,并进行上机演示; 接下来我们将介绍结构比对方法,首先我们会简要介绍TM_align方法,接下来我们将重点介绍foldseek方法,并进行上机演示,我们会演示其html网页可视化和csv文件输入的不同结果展示方式。让学员掌握数据集挖掘工具的使用

蛋白质口袋搜索的传统方法与基于深度学习的创新方法。分为如下几个部分:首先我们会介绍基于结构的口袋搜索方法的基本原理,重点讲解fpocket工具,并进行上机演示;接下来我们会介绍基于深度学习的蛋白质小分子结合位点预测方法DiffDock,并进行上机演示,学员将了解这两种工具的理论基础,并通过实际操作演示,掌握如何进行蛋白质口袋的识别与分析。

专题五、深度学习在蛋白质设计中的应用

1.基于深度学习的蛋白质设计概览

2.结构生成模型--RFDiffusion

3.RFDiffusion是一个conditional的结构生成模型(实操)

3.3.RFDiffusion:基于RosettaFold

3.4.RFDiffusion-All-Atom:基于RosettaFold-All-Atom

3.5.RFDiffusion上机实操

3.6.RFDiffusion设计骨架结构


4.逆折叠模型--ProteinMPNN(实操)

4.1inverse folding模型

4.2ProteinMPNN逆折叠设计序列上机实操


5.利用AF2提高蛋白质设计的成功率(实操)

5.1Alphafold2折叠设计序列

5.2筛选选Alphafold2中pLDDT较高的序列

5.3预测结构作迭代

6.Binder design设计流程

6.1RFDiffusion设计binder

6.2ProteinMPNN-FastRelax Binder Design设计

6.3AF2 complex prediction设计

7.结构序列生成模型--ProteinGenerator

7.1ProteinGenerator是结构和序列的生成


通过本天培训学员将掌握:

本专题将深入探讨深度学习在蛋白质设计中的应用。包括如下内容:首先我们会介绍基于深度学习的蛋白质设计概览,接下来我们会介绍RFDiffusion(结构生成模型)、ProteinMPNN(逆折叠模型)、ProteinGenerator(结构与序列生成模型)的基础理论;接着我们会介绍如何利用Alphafold2来提升蛋白质设计的成功率;之后我们会进行上机实操,包括常见的蛋白质设计任务,具体包括RFDiffusion的不同使用模式、monomer motif scaffolding的迭代优化、 binder design的迭代优化。学员将通过实操,学习如何利用AlphaFold2提高蛋白质设计的成功率。我们会在本专题最后进行david baker 设计TNFR binder的论文复现。让学员都能够掌握david baker 的核心技术

专题六、基于深度学习的酶设计与语言模型的蛋白质设计

1.深度学习酶设计(实操)

11.酶设计基本原理

1.2.酶学性质预测

1.3.RFDiffusionAA模型

1.4RFDiffusionAA与RFDiffusion对比

2.基于语言模型的蛋白质设计

2.1Progen模型(实操)

2.2Progen的训练

2.3conditional tag下的语言模型训练


3.ESM2、ESM3(实操)

3.1多模态ESM3语言模型

3.2序列、结构和功能三个模块的训练


顶刊复现:

1.Diego del Alamo et al. (2022) Sampling alternative conformational states of transporters and receptors with AlphaFold2 eLife.

2.Wayment-Steele, H.K., Ojoawo, A., Otten, R. et al. Predicting multiple conformations via sequence clustering and AlphaFold2. Nature 625, 832–839 (2024).

3.Matthias Glögl et al. ,Target-conditioned diffusion generates potent TNFR superfamily antagonists and agonists.Science386,1154-1161(2024).

通过本天培训学员将掌握:

最后,本专题将介绍酶设计的基本原理及基于语言模型的蛋白质设计方法。分为如下几个部分:首先我们会介绍RFDiffusionAA(基于小分子的蛋白质设计模型)的基本原理,接下来我们会通过上机实操来演示酶设计的一个例子;接下来我们会介绍一些蛋白质语言模型,包括Progen、ESM2和ESM3的基本原理,架构,并进行上机演示。让学员能够掌握蛋白质语言模型的使用

免费赠送视频

史无前例福利

(可点击蓝色字体查看)

(可点击蓝色字体查看)

报名AI蛋白设计直播课可以得到往期两期不同专题录播课!

(含资料、视频、代码)

报一得三!超值福利! 快速学会AI蛋白质设计!助力发Nature

CADD计算机辅助药物设计线上直播课

药物研发是一个漫长而昂贵的过程,常常需要花费数十亿美元和数年时间。药物的设计和发现过程中,计算机辅助药物设计已经成为了一种重要的方法。计算机辅助药物设计(CADD)通过模拟和计算预测药物的性质、药效、毒性和代谢,为药物设计的每个环节提供准确的信息和指导。计算机辅助药物设计不仅可以加快发现新药物的速度,也可以大大减少发现过程中的花费。卡托普利、多佐胺、奥司他韦、阿利克仑、诺拉曲特等许多已获批准的药物均采用过CADD进行了优化。CADD能够快速高效地进行预测、设计、合成和评价,大大减少药物研发周期、成本和风险,提高了研发的效率和可行性


技术方法

分子对接

‌分子对接的优势:主要包括高效性、经济性和可视化‌。分子对接是一种利用计算机模拟预测小分子与受体蛋白相互作用的方法,能够在较短时间内筛选大量化合物,找到与受体结合能力较强的分子,从而加速药物研发的进程‌。相比传统的药物筛选方法,分子对接能够节省大量研发成本,降低实验失败的风险‌。此外,通过分子对接,研究人员可以直观地观察分子与受体的结合方式,有助于理解药物与靶标之间的相互作用机制‌

分子对接常用软件:

‌AutoDock‌:由Scripps Research Institute开发的免费开源软件,支持刚性和柔性对接。它使用拉马克遗传算法来优化配体在受体结合位点的放置,并包含多种评分函数来评估结合亲和力。支持多种输入文件格式,如PDB、MOL2和SDF‌

‌AutoDock Vina‌:AutoDock的改进版本,具有更高的计算效率和更好的性能。它能够在短时间内找到分子之间的最佳结合方式,广泛应用于药物发现和生物化学研究‌

Discovery Studio‌:由Dassault Systèmes BIOVIA开发,包含一系列分子对接、虚拟筛选、蛋白质建模和分子动力学模拟分析工具‌

本次分子对接培训主要采用‌AutoDock Vina‌,完全开源免费。

本次培训主要讲解10种对接方法有:金属酶蛋白对接、蛋白-多糖对接、核酸-小分子对接、柔性对接、共价对接、蛋白-水合对接、蛋白-水分子-配体对接、抗体对接、大分子对接蛋白-多肽对接、大分子蛋白-蛋白对接。

虚拟筛选

‌虚拟筛选在药物发现中的应用优势主要包括以下几个方面‌:

‌高效性和低成本‌:虚拟筛选通过计算机模拟技术,能够在短时间内对大量分子进行高通量筛选,显著减少了实验筛选所需化合物的数量,从而降低了研发成本和时间‌。此外,虚拟筛选不需要复杂的实验设备和高昂的实验费用,使得药物研发更加经济高效‌

‌缩短研发周期‌:传统的药物研发方法依赖于大量的实验筛选,过程繁琐且耗时。虚拟筛选能够快速评估和筛选潜在的药物分子,显著缩短了药物研发的周期。统计显示,虚拟筛选的阳性率维持在5%-30%之间,且成功辅助药物设计的案例正逐年增加‌

‌提高成功率‌:虚拟筛选通过计算机模拟和生物数据分析,能够帮助研究人员筛选出潜在的药物候选分子,极大地提高了药物发现的效率和成功率‌1。此外,结合分子动力学模拟等手段,可以进一步评估药物候选分子的稳定性和体内行为,优化候选分子,从而提高药物的研发成功率‌

‌适用于多种药物类型‌:虚拟筛选不仅可以应用于小分子药物的筛选,还可以在抗体药物、疫苗以及其他生物制品的研发过程中发挥重要作用‌1。这使得虚拟筛选在生物医药领域的适用范围更广,能够满足不同类型药物研发的需求。

‌减少实验需求‌:通过虚拟筛选,可以大幅减少实验筛选的需求,降低实验失败的风险。例如,MCE公司的虚拟筛选服务通过高效的分子对接技术和精准的打分函数,能够大幅减少实验筛选的化合物数量,提高发现理想先导物的可能性‌

分子动力学模拟

‌‌GROMACS在分子动力学模拟中的优势主要包括以下几个方面‌:

‌高性能和并行计算能力‌:GROMACS以其惊人的计算效率而受到青睐,尤其在并行计算和GPU加速方面表现卓越。它能够在大型超级计算机上高效运行

‌开源和免费‌:GROMACS遵循LGPL协议,是开源软件,用户可以在Github上找到其开源代码。这使得GROMACS在学术界广泛使用,并且用户可以自由地修改和扩展其功能‌

‌广泛的力场支持‌:GROMACS支持多种力场,包括AMBER、CHARMM、GROMOS和OPLS等,这使得它能够模拟不同类型的分子体系‌此外,它还支持Martini粗粒化模型和基于GBSA的隐式溶剂模型‌

‌丰富的分析工具‌:GROMACS提供了大量的分析工具,用户不必再为常规分析编写任何程序。它还包括轨迹可视化工具,可以显示模拟结果‌

‌良好的用户界面和文档‌:GROMACS的操作简单,用户可以通过命令行进行操作,且其拓扑文件和参数文件格式友好,易于阅读和设置。此外,GROMACS提供了详细的免费使用手册,帮助用户更好地使用软件‌

培训优势

一、课程设置优势:

本次培训采取线上直播授课,7天42个小时从理论到实操,手把手教授软件安装,课程长期解疑,CADD计算机辅助药物设计技术全覆盖,报名成功就发送预习视频

二、学习资料优势:

本次培训提供上课所有使用软件的安装包,PPT资料1000余页,课程每天会提供回放观看

三、培训经验优势:

我们有长达4年50余期的培训经验,受训学员达5000余人,学员好评100%,其中不乏有发表多篇CNS的学员

部分学员评价

CADD计算机辅助药物设计线上直播课表

1

讲师简介

计算机辅助药物设计主讲老师来自国内高校北京协和医院药物研究所,老师主要擅长药物虚拟筛选、计算机辅助药物设计、人工智能药物发现、分子对接、分子动力学等方面的研究,已发表sci十余篇!有十余年的CADD研究经验。

第一天

上午

背景与理论知识以及工具准备

1.PDB数据库的介绍和使用

1.1数据库简介

1.2靶点蛋白的结构查询与选取

1.3靶点蛋白的结构序列下载

1.5批量下载蛋白晶体结构

2.Pymol的介绍与使用

2.1软件基本操作及基本知识介绍

2.2蛋白质-配体相互作用图解

2.3蛋白-配体小分子表面图、静电势表示

2.4蛋白-配体结构叠加与比对

2.5绘制相互作用力

3.notepad的介绍和使用

3.1优势及主要功能介绍

3.2界面和基本操作介绍

3.3插件安装使用

下午

一般的蛋白

-配体分子对接讲解

1.对接的相关理论介绍

1.1分子对接的概念及基本原理

1.2分子对接的基本方法

1.3分子对接的常用软件

1.4分子对接的一般流程

2.常规的蛋白-配体对接

2.1收集受体与配体分子

2.2复合体预构象的处理

2.3准备受体、配体分子

2.4蛋白-配体对接

2.5对接结果的分析

以新冠病毒蛋白主蛋白酶靶点及相关抑制剂为例

第二天

虚拟筛选

1.小分子数据库的介绍与下载

2.相关程序的介绍

2.1 openbabel的介绍和使用

2.2 chemdraw的介绍与使用

3.虚拟筛选的前处理

4.虚拟筛选的流程及实战演示

案例:筛选新冠病毒主蛋白酶抑制剂

5.结果分析与作图

6.药物ADME预测

6.1ADME概念介绍

6.2预测相关网站及软件介绍

6.3预测结果的分析

第三天

1.大分子对接实例

蛋白-蛋白对接

1.1蛋白-蛋白对接的应用场景

1.2相关程序的介绍

1.3目标蛋白的收集以及预处理

1.4使用算例进行运算

1.5关键残基的预设

1.6结果的获取与文件类型

1.7结果的分析

以目前火热的靶点

PD-1/PD-L1等为例。

2.蛋白-多肽对接与实例

2.1蛋白-多肽相互作用

2.2蛋白-多肽对接算法

2.3蛋白-多肽对接流程

2.4不同条件下参数的设置

2.5蛋白-多肽对接实例

SARS-CoV-2强效D型多肽抑制剂

3.金属酶蛋白的对接实例

涉及金属酶蛋白的对接

3..1金属酶蛋白-配体的背景介绍

3.2蛋白与配体分子的收集与预处理

3.3金属离子的处理

3.4金属辅酶蛋白-配体的对接

3.5结果分析

以人类法尼基转移酶及其抑制剂为例

4.蛋白-多糖分子对接

4.1蛋白-多糖相互作用

4.2对接处理的要点

4.3蛋白-多糖分子对接的流程

4.4蛋白-多糖分子对接

4.5相关结果分析

以α-糖苷转移酶和多糖分子对接为例

5.核酸-小分子对接

5.1核酸-小分子的应用现状

5.2相关的程序介绍

5.3核酸-小分子的结合种类

5.4核酸-小分子对接

5.5相关结果的分析

以人端粒

g -四链和配体分子对接为例。

操作流程介绍及实战演示


第四天

拓展对接的使用方法

1.柔性对接

1.1柔性对接的使用场景介绍

1.2柔性对接的优势

1.3蛋白-配体的柔性对接

重点:柔性残基的设置方法

1.4相关结果的分析

以周期蛋白依赖性激酶

2(CDK2)与配体1CK为例

2.共价对接

2.1两种共价对接方法的介绍

2.1.1柔性侧链法

2.1.2两点吸引子法

2.2蛋白和配体的收集以及预处理

2.3共价药物分子与靶蛋白的共价对接

2.4结果的对比

以目前火热的新冠共价药物为例。


3.蛋白-水合对接

3.1水合作用在蛋白-配体相互作用中的意义及方法介绍

3.2蛋白和配体的收集以及预处理

3.3对接相关参数的准备

重点:水分子的加入和处理

3.4蛋白-水分子-配体对接

3.5结果分析

以乙酰胆碱结合蛋白

(AChBP)与尼古丁复合物为例


第五天

1.抗体对接

1.1抗体建模

1.2抗体抗原对接

2.其他抗原抗体生成模型的介绍

3.Linux系统基本知识

3.1Linux系统简介

3.2常用命令介绍

3.3基本操作介绍

第六天

1.分子动力学模拟

1.1实例演示

1.2指导安装Gromacs 2019.6

2.分子动力学概述

2.1分子动力学模拟原理及一般流程

3.Gromacs介绍

2.Gromacs命令介绍

2.1蛋白拓扑文件的获取

2.2溶剂化盒子的设置

2.3mdp文件的介绍

2.4后处理命令介绍


第七天

1.溶菌酶在溶剂条件下的动力学模拟

2.拓扑文件的建立

3.体系电中性

4.能量最小化

5.NPT\NVT

6.无限制的MD模拟

7.主蛋白酶及其抑制剂在溶剂条件下的动力学模拟

8.非标准残基的拓扑参数建立


AIDD人工智能药物发现与设计视频回放课

讲师简介

AIDD授课老师,有十余年的计算机算法研究和程序设计经验。研究方向涉及人工智能药物发现,深度学习药物靶标识别,CADD等。一作身份发表SCI论文数篇,包括BMC Bioinformatics, Journal of Biomedical Informatics, International Journal of Molecular Sciences等知名期刊。

第一天

1.AIDD概述及药物综合数据库介绍

2.人工智能辅助药物设计AIDD概述

3.安装环境

(1)anaconda

(2)vscode

(3)pycharm

(4)虚拟环境

4.第三方库基本使用方法

(1)numpy

(2)pandas

(3)matplotlib

(4)requests

5.多种药物综合数据库的获取方式

(1)KEGG(requests爬虫)

(2)Chebi(libChEBIpy)

(3)PubChem(pubchempy / requests)

(4)ChEMBL(chembl_webresource_client)

(5)BiGG(curl)

(6)PDB(pypdb)

第二天 ML-based AIDD

1.机器学习

(1)机器学习种类:

①监督学习

②无监督学习

③强化学习

(2)典型机器学习方法

①决策树

②支持向量机

③朴素贝叶斯

④神经网络

⑤卷积神经网络

(3)模型的评估与验证

(4)分类评估:准确率、精确率、召回率、F1分数、ROC曲线、AUC计算

(5)回归评估:平均绝对误差、均方差、R2分数、可释方差分数

(6)交叉验证

2.sklearn工具包基本使用

3.rdkit工具包的基本使用

4.化合物编码方式和化合物相似性理论知识

5.项目实战1:基于ADME和Ro5的分子筛选

6.项目实战2:基于化合物相似性的配体筛选

7.项目实战3:基于化合物相似性的分子聚类

8.项目实战4: 基于机器学习的生物活性预测

9.项目实战5:基于机器学习的分子毒性预测

第三天GNN-based AIDD

1.图神经网络

(1)框架介绍: PyG,DGL,TorchDrug

(2)图神经网络消息传递机制

(3)图神经网络数据集设计

(4)图神经网络节点预测、图预测任务和边预测任务实战

2.论文精讲:DeepTox: Toxicity Prediction using Deep Learning

3.项目实战1:基于图神经网络的分子毒性预测

(1)SMILES分子数据集构建PyG图数据集

(2)基于GNN进行分子毒性预测

4.项目实战2:基于图神经网络的蛋白质-配体相互作用预测

(1)蛋白质分子图形化,构建PyG图数据集

(2)基于GIN进行网络搭建及相互作用预测

第四天NLP-based AIDD

1.自然语言处理

(1)Encoder-Decoder模型

(2)循环神经网络 RNN

(3)Seq2seq

(4)Attention

(5)Transformer

2.项目实战1:基于自然语言的分子毒性预测

(1)SMILES分子数据集词向量表示方法

(2)基于NLP模型进行分子毒性预测

3.项目实战2:基于Transformer的有机化学反应产量预测 (Prediction of chemical reaction yields using deep learning)

4.论文精读及代码讲解:《Mapping the space of chemical reactions using attention-based neural networks》

第五天 分子生成与药物设计

1.分子生成模型

(1)循环神经网络RNN

(2)变分自动编码器VAE

(3)生成对抗网络GAN

(4)强化学习RL

2.项目实战1: 基于图数据的小分子化合物生成模型《A Graph to Graphs Framework for Retrosynthesis Prediction》

3.项目实战2: 基于NLP的抗体生成模型《Generative language modeling for antibody design》


授课时间

AI蛋白质设计线上实操直播授课时间

2025.04.12-2025.04.13 (09:00-11:30--13:30-17:00)

2025.04.19-2024.04.20 (09:00-11:30--13:30-17:00)

2025.04.26-2025.04.27 (09:00-11:30--13:30-17:00)

共计6天的课 通过腾讯会议直播 线上实操 提供全部录播

CADD计算机辅助药物设计线上直播授课时间

2025.04.19-2024.04.20 (09:00-11:30--13:30-17:00)

2025.04.22-2025.04.25 (19:00-22:00)

2025.04.26-2025.04.27 (09:00-11:30--13:30-17:00)

2025.04.28-2025.04.29(19:00-22:00)

共计7天的课 通过腾讯会议直播 线上实操 提供全部录播

AIDD人工智能药物发现与设计录播课(免费赠送)

共计五天的录播课 ,提供全部视频、资料、软件、代码

培训费用超值福利

课程报名费用:

AI蛋白质设计线上实操直播课:

公费价:每人每班¥6880元 (含报名费、培训费、资料费、提供课后全程回放资料)

自费价:每人每班¥6580元 (含报名费、培训费、资料费、提供课后全程回放资料)

CADD计算机辅助药物设计线上直播课

公费价:每人每班¥5880元 (含报名费、培训费、资料费、提供课后全程回放资料)

自费价:每人每班¥5580元 (含报名费、培训费、资料费、提供课后全程回放资料)

AIDD人工智能药物发现回放课(即报即学)

重磅优惠:

优惠1:

报二送一(同时报名两个班赠送一个学习班,赠送班任选)

两班同报:10880元 (原价18640)

三班同报:14880元 (原价23620)

特惠一:24880元 (可免费学习一整年本单位举办的任意课程)

特惠二:28880元(可免费学习两整年本单位举办的任意课程)

优惠2:提前报名缴费可享受300元优惠(仅限十五名)

优惠3:报名直播课程可赠送往期课程回放(报两个班赠送全部回放)

(可点击跳转详情链接):

回放一:

回放二:

回放三:

回放四:

回放五:

回放六:

回放七:

回放八:

回放九:

报名咨询方式(请二维码扫描下方微信)

微信:766728764

电子邮箱:m15238680799@163.com

电话:15238680799

引用往期参会学员的一句话:

发现真的是脚踏实地的同时 需要偶尔仰望星空 非常感谢各位对我们培训的认可!祝愿各位心想事成

ad1 webp
ad2 webp
ad1 webp
ad2 webp