分子对接实验全流程详解:从PDB数据库到Autodock软件应用
分子对接实验全流程详解:从PDB数据库到Autodock软件应用
分子对接是研究蛋白质与小分子配体相互作用的重要方法之一。本文将详细介绍如何使用PDB数据库、PubChem数据库以及Autodock软件进行分子对接实验,包括大分子蛋白和小分子配体的准备、Grid map的设置以及结果分析等关键步骤。
PDB数据库使用
PDB(Protein Data Bank)数据库是存储蛋白质和核酸三维结构信息的重要资源。访问PDB数据库的官方地址:https://www.rcsb.org/
以热休克蛋白HSP90AA1为例,其PDB ID为7DHG。在搜索栏输入7DHG,主要关注以下几个方面:
- Download:下载文件,一般选择PDB Format即可
- Released:发表时间
- Method:数据获取方法,一般只有X-Ray(X射线)和NMR两种
- Resolution:分辨率指标,越小说明分辨率越高,一般小于2Å就足够好了
继续向下滚动页面,可以查看该蛋白的具体链信息。对于一些含有小分子的蛋白,还需要关注小分子的相关信息。例如,7A2O示例中需要记住小分子的ID,在后续处理中可能需要去除。
PubChem数据库中小分子配体的获取
如果在PubChem数据库中只能找到小分子的2D结构(SDF格式),而没有3D结构,可以使用Chem3D软件将2D结构转化为3D结构。具体步骤如下:
- 将2D结构的SDF文件导入Chem3D
- 通过Calculations/MM2/Minimize Energy实现能量最小化
但是Chem3D软件只有Windows版本,且属于ChemOffice全家桶的一部分,资源较难获取。因此,推荐直接在其他数据库中查找小分子配体的mol2格式结构,然后使用OpenBabel或MGLTools将其转化为pdbqt格式。
分子对接前言
本教程将以大黄素对食管癌的影响研究为例,介绍分子对接的具体步骤。大分子蛋白以ESR2蛋白为例,其PDB ID为7XVY;小分子配体以大黄素(emodin)为例,其分子ID为MOL000472。
B站相关推荐视频:https://www.bilibili.com/video/BV1NK411i7No/
Autodock Tools和Autodock本身的下载及注意事项将在后续单独介绍。文章的快速实践命令总结位于:http://t.csdnimg.cn/hGanb
大分子蛋白准备
PDB数据库下载蛋白
具体操作可参考另一篇博客:http://t.csdnimg.cn/QDEAS
pymol前置处理
具体操作可参考另一篇博客:http://t.csdnimg.cn/i0vpE
其他处理(添加分子伴侣、判断是否删去同源肽链)
蛋白质的层级结构
回顾蛋白质的层级结构:
- 一级结构:氨基酸序列,无空间意义。可以在Uniprot数据库查询。
- 二级结构:肽链主链骨架的空间位置(α-螺旋、β-折叠、β-转角、无规则卷曲)。
- 超二级结构:相邻的二级结构单元形成的有规则的组合体。
- 结构域:肽链上几个相邻的超二级结构单元的组合,每个结构域分别代表一种功能单位。
- 三级结构:多肽链中全部氨基酸残基的相对空间位置。
- 四级结构:蛋白质含有2条或2条以上多肽链,每一条多肽链都有其完整的三级结构,称为亚基。
分子伴侣
分子伴侣在蛋白质折叠过程中起着重要作用。在分子对接之前,可能需要添加分子伴侣。
判断是否需要删去同源肽链
如果一个蛋白有多个同源的肽链,是否可以只保留一条进行分子对接取决于分子对接的位点是否处于多个亚基的结合区域。
Autodock Tools前置处理
加载蛋白
打开Autodock Tools,如果页面显示不全,需要确保adt.bat文件与Autodock4、Autogrid4两个文件放在一起。选择File/Read Molecule后选择文件加载。
加氢
选择Edit/Hydrogens/Add进行加氢,弹出页面后选择YES。加氢分为几种情况,可以加全氢、极性氢或活性位点附近氨基酸残基加氢。
计算总电荷
选择Edit/Chargs/Compute Gasteiger,即可计算总电荷。
指定原子类型
选择Edit–Atoms–Assign AD4 type,即可指定原子类型。
转为pdbqt文件
选择File/save/write PDBQT后出现如下界面,直接点击OK,转为pdbqt格式。
小分子配体准备
如果事先已经准备好了小分子的pdbqt文件,可以跳过此步骤。
加载配体
重新打开autodock tools软件,或者点击Edit/Delete/Delete All Molecules清空页面。选择Ligand/Input/Open加载小分子配体文件。
选择并判断配体的 Root
选择Ligand > Torsion Tree > Choose Root和Ligand > Torsion Tree > Detect Root。
然后选择Ligand > Torsion Tree > Show Root Expansion。
查看可旋转的键
选择Ligand > Torsion Tree > Choose Torsion,绿色的表示可以旋转,然后点击Done。
保存成PDBQT
点击Ligand—Output > Save as PDBQT即成功保存pdbqt文件。随后点击Edit/Delete/Delete All Molecules清空软件页面(页面留下绿色小球不影响后续操作)。
Grid map准备
重新打开autodock tools软件,或者点击Edit/Delete/Delete All Molecules清空页面。
加载大分子蛋白和小分子配体
点击Grid > Macromolecule > Open,导入大分子蛋白的pdbqt文件,提示是否保留分子中的电荷,选择Yes。如果你是刚刚根据上文用autodock tools处理小分子配体为pdbqt格式文件的话,选择Grid > Set Map Types > Choose Ligand…导入小分子配体的pdbqt格式文件;如果你是之前就处理好了小分子配体的pdbqt格式文件的话,直接选择Grid > Set Map Types > Open Ligand…最终页面如下(如果没看到小分子配体的话,可以旋转缩放一下界面,可能挡住了而已):
移动小分子配体
点击Preference,选择取消Transf. Root Only后可以看到mouse transforms apply ...前面的勾也被取消了。此时我们就可以鼠标右键选择小分子配体了,把小分子配体移动到合适的位置(即远离大分子蛋白一定的距离),如下:
然后我们把Transf. Root Only选项再勾上。
设置对接口袋
选择Grid > Grid Box…,打开Grid Options对话框。鼠标中键滚轮可以调整x,y,z三维大小及Spacing(也就是前四个选项)其中Spacing (angstrom)是整体缩放盒子大小的。最终调整盒子大小和位置为完全包裹住大分子且不接触小分子配体(如果明确蛋白活性口袋位置,那么也可以只包裹住该位置),如下:
点击Grid Options弹窗的File > Close saving current退出。
保存GPF文件
选择Grid > Output > Save GPF...,文件名需要手动加上后缀名.gpf。我一般文件名命名为蛋白质PUB ID_小分子配体MOL ID后四位.gpf的格式,譬如这里的7xvy_0472.gpf
运行Grid
- 选择Run > Run AutoGrid,在Program Pathname框中选择atuogrid4.exe文件所在位置。注意:一定要自己选择一下,虽然这个窗口打开后这里默认有值autogrid4.exe!
- Parameter Filename框中选择上一步生成的.gpf文件。注意:也是要自己选择一下,虽然窗口打开后这里默认有值!选中之后可以发现Log Filename也会检测到值。
- 最后点击Launch。等待窗口的任务完成,弹窗会自动消失(需要一定时间),此时工作目录会多出一堆文件。
正式分子对接
点击Edit/Delete/Delete All Molecules清空软件页面。
加载大分子蛋白和小分子配体
- 导入Receptor(即大分子蛋白):Docking > Macromolecule > Set Rigid Filename…(导入后页面没有什么变化是正常的)
- 导入Ligand(即小分子配体):同样的,如果你是刚刚根据上文用autodock tools处理小分子配体为pdbqt格式文件的话,选择Docking > Ligand > Choose...导入小分子配体的pdbqt格式文件如果你是之前就处理好了小分子配体的pdbqt格式文件的话,选择Docking > Ligand > Open...。选择后,对话框显示如下,选择Accept。
设置算法
一般算法选择:Docking > Search Parameters > Genetic Algorithm,默认设置,点击Accept。但是如果你对于准确度要求不是很高,可以选择Docking > Search Parameters > Local Search Parameters,这样会快一些。
导出DPF文件
设置对接参数。ADT菜单栏:Docking > Docking Parameters…,默认设置,点击Accept。保存算法:Docking > Output > Lamarckian GA (4.2)…。(如果你在设置算法一步选择了Local Search Parameters,那么这里选择Local Search(4.2))注意文件名需要手动加上后缀名.dpf。我一般文件名命名为蛋白质PUB ID_小分子配体MOL ID后四位.dpf的格式,譬如这里的7xvy_0472.dpf
运行Dock
运行:Run > Run AutoDock,和运行Grid一样的注意事项。如下,点击Launch后等待弹窗的任务完成,弹窗会自动消失(会比运行Grid快一些),对接完成。点击Edit/Delete/Delete All Molecules清空软件页面
结果分析
打开.dlg文件:Analyze > Dockings > Open...。(可能有warning弹窗,直接选择ok就好)显示Receptor大分子蛋白:Analyze > Macromolecule > Open...,显示窗口自动导入Receptor。查看分子对接结果:Analyze > Conformations > Play, ranked by energy...。
- 查看第一个结合点位。因为是按照能量大小的绝对值来排序的,绝对值越大的放在越前面,说明分子对接的效果越好。所以一般我们看第一个就行了。
- 点击倒数第二个图标显示Set Play Options面板
- 点击Show Info图标显示Conformation 1 info面板。其中我们最关注的就是binding_energy的值,这里它= -7.71
- 点击Build H-bonds图标显示Hydrogen Bonds面板
- 点击Write Complex图标保存成pdbqt格式文件。需要加上.pdbqt后缀,我一般命名为7xvy_0472.pdbqt
(图中数字表示第几步骤,箭头表示点击后显示什么面板。)
结合能(键能)补充知识
结合能(键能):将1摩尔气态分子完全离解为气态原子所吸收的能量,单位通常为千焦每摩尔(KJ/mol),反映了形成或断裂一个化学键所需要或释放的能量大小,因此是化学键强度的直接体现。结合能排序:离子键 > 共价键 > 金属键 >> 氢键 ≈ π-cation键 > π-π堆积 > 范德华力其中离子键、共价键、金属键属于化学键。氢键及以后属于次级键。
本文内容参考自CSDN博客,原文链接:https://blog.csdn.net/zhiaidaidai/article/details/142102628