计算机模拟进行分子对接
北京市陈经纶中学 王子巍、王喆 学科:信息学化学 【内容摘要】
所谓分子对接就是受体和底物之间通过能量匹配和几何匹配而互相识别的过程。分子对接在超分子建筑学和药物设计中都具有非常重要的意义,运用分子对接我们可以揭示超分子体系的结构和形成过程。分子对接主要研究分子间(即配体和受体)相互作用,并且预测并计算结合模式和亲和力的一种理论模拟方法。
近年来,分子对接方法已成为计算机辅助药物研究领域的一项重要技术,在数据库搜索,组合库设计及蛋白作用研究方面得到广泛发展
因此分子对接具有极强的相士意义和发展前景
【关键词】 分子对接 Docking Autodock 1、前言:
1.1历史
分子对接这一想法的历史可以追溯到19世纪提出的受体学说,Fisher提出的受体学说认为,药物与体内的蛋白质大分子即受体会发生类似钥匙与锁的识别关系,这种识别关系主要依赖两者的空间匹配。随着受体学说的发展,人们对生理活性分子与生物分子的相互作用有了更加深刻的认识,从基于空间匹配的刚性模型逐渐发展成为基于空间匹配和能量匹配的柔性模型。模型的优化使通过计算模拟分子间相互作用的设想更容易实现。另一方面,计算机和计算科学的迅速发展又使得人们能够处理大量数据,这两方面的因素共同促成了分子对接方法的出现。
早期的分子对接方法用分子力学方法或者量子化学方法计算小分子之间分子识别,在一些分子模拟软件包中也含有分子对接的模块。但是由于算法和计算机处理能力的限制,早期的对接方法较难处理含有大分子的分子对接过程。
1995年由Accelrys公司开发的计算化学软件Affinity上市,这是第一个可以进行有大分子参与的商业化分子对接软件,此后,商业化和免费的分子对接软件层出不穷。现在应用中的分子对接软件涵盖了刚性对接、半柔性对接、柔性对接等各种对接方法,在能量优化方面则使用了人工神经网络、遗传算法、模拟退火、禁忌搜索、局部搜索等各种方法,目前的分子对接方法是研究小分子与大分子相互作用模式、生物大分子间识别、分子自组装、超分子结构等课题的常用方法之一。
1.2原理与方法
分子对接方法的两大课题是分子之间的空间识别和能量识别。空间匹配是分子间发生相互作用的基础,能量匹配是分子间保持稳定结合的基础。对于几何匹
配的计算,通常采用格点计算、片断生长等方法,能量计算则使用模拟退火、遗传算法等方法。
各种分子对接方法对体系均有一定的简化,根据简化的程度和方式,可以将分子对接方法分为三类。
刚性对接:刚性对接方法在计算过程中,参与对接的分子构像不发生变化,仅改变分子的空间位置与姿态,刚性对接方法的简化程度最高,计算量相对较小,适合于处理大分子之间的对接。
半柔性对接:半柔性对接方法允许对接过程中小分子构像发生一定程度的变化,但通常会固定大分子的构像,另外小分子构像的调整也可能受到一定程度的限制,如固定某些非关键部位的键长、键角等,半柔性对接方法兼顾计算量与模型的预测能力,是应用比较广泛的对接方法之一。
柔性对接:柔性对接方法在对接过程中允许研究体系的构像发生自由变化,由于变量随着体系的原子数呈几何级数增长,因此柔性对接方法的计算量非常大,消耗计算机时很多,适合精确考察分子间识别情况。
2、可行性与优势
2.1对接分子
分子对接的目的是找到底物分子和受体分子间的最佳结合位置,所以要面对的重要问题是如何找到最佳的结合位置和如何确定对接分子间的结合强度。
如何找到最佳的结合位置牵涉到优化的问题。底物分子和受体分子都是可以自由转动和平动的,同时两个分子自身的构象也存在变化,因此它们之间可能的结合方式是非常复杂的,所以简单的系统搜索方法是不够的,要引入其他高效的优化方法,常用的有遗传算法、模拟退火以及禁忌搜索等。
如何确定对接分子间的结合强度涉及到底物分子和受体分子间结合能力的预测,牵涉到结合自由能的计算。结合自由能包括以下几个方面的贡献: 1( 受体分子和底物分子气态下分子对接过程的自由能变化,约为对接过程中的焓变;
2( 受体分子、底物分子以及复合物分子的溶剂化自由能;
3( 对接过程中的熵变。
在这几项中,气态下分子对接过程的焓变可以通过分子力学的方法简单求算,但去溶剂化能准确而快速的求算还存在一定的问题,不过熵变的计算可能是最大的问题,因为它的计算需要耗费大量时间,而在实际的应用设计过程中,研究人员总是希望能快速筛选成千上万的分子。所以目前采用的是较为简单的自由能评价方法。
2.2AUTODOCK对接方式
AUTODOCK是Scripps的Olson科研小组开发的分子对接软件包,最新的版
本为3.05,AUTODOCK采用模拟退火和遗传算法来寻找受体和配体最佳的结合位置,用半经验的自由能计算方法来评价受体和配体之间的匹配情况。在AUTODOCK中,配体和受体之间结合能力采用能量匹配来评价。在1.0和2.0版本中,能量匹配得分采用简单的基于AMBER力场的非键相互作用能。非键相互作用来自于三部分的贡献:范得华相互作用,氢键相互作用,以及静电相互作用。在3.0版中,AUTODOCK提供了半经验的自由能计算方法来评价配体和受体之间的能量匹配。
在最早的AUTODOCK版本中,作者采用了模拟退火来优化配体和受体之间的结合。
3.0版本中,Morris等发展了一种改良的遗传算法,即拉马克遗传算法(LGA)。测试结果表
明,LGA比传统的遗传算法比模拟退火具有更高的效率。在LGA方法中,作者把遗传算法和局部搜索(local search)结合在一起,遗传算法用于全局搜索,而局部搜索用于能量优化。在AUTODOCK中,局部搜索方法是自适应的,它可以根据当前的能量调节步长大小。LGA算法引入了拉马克的遗传理论,LGA最大的特点就是通过进化映射(developmental mapping)把基因型转化为表现型而实现局部搜索和遗传算法的结合。基因型空间通过遗传算子突变和交叉来定义;而表现型则通过问题的解来定义,这里表示体系的能量得分。
2.3其它主要分子对接软件
FlexX
FlexX是德国国家信息技术研究中心生物信息学算法和科学计算研究室开发的分子对接软件,目前已经作为分子设计软件包Sybyl的一个模块实现商业化。FlexX使用碎片生长的方法寻找最佳构像,根据对接自由能的数值选择最佳构像。FlexX程序对接速度块效率高,可以用于小分子数据库的虚拟筛选。
DOCK
Dock是目前应用最广泛的分子对接软件之一,由Kuntz课题组开发。Dock应用半柔性对接方法,固定小分子的键长和键角,将小分子配体拆分成若干刚性片断,根据受体表面的几何性质,将小分子的刚性片断重新组合,进行构像搜索。在能量计算方面,Dock考虑了静电相互作用、范德华力等非键相互作用,在进行构像搜索的过程中搜索体系势能面。最终软件以能量评分和原子接触罚分之和作为对接结果的评价依据。
3.Autodock分子模型的对接
3.1导入大分子
3.1.1 打开文件
初始引入文件的格式可以是:MMCIF 文件(.cif),MOL2文件(.mol2),PDB文件(.pdb),MEAD文件(.pqr)。 推荐为PDB文件(.pdb)最好。
File ? Read Molecule ? 选择所要打开的大分子文件路径及名称 ? Open 3.1.2 查看大分子
键 盘 鼠 标
按下左键 按下中间滚轮 按下右键
选择 转动 平动
按住Shift键 快速缩放 缩放 3.2大分子的修饰
3.2.1 加氢
首先要做的是要为大分子添加氢原子,这一步极为重要。
Edit ? Hydrongens ? Add
*1? All Hydrogen
*2? Polar Only
? noBondOrder
? withBondOrder
? Yes
? no
*1:如果大分子是非蛋白质类物质;或者想要为显示的所有分子都添加氢原子。
:只为蛋白质添加氢原子。 *2
因为很多程序或是结构数据都不包含为数众多的氢原子,而没有氢原子的大分子在之后的添加电荷一步中所带电荷为非整数,导致之后的一些必须文件无法生成。
3.2.2 删除某些原子或分子
在某些情况下,我们需要删除一些与计算无关,或是会产生干扰的原子或残基,例如:但我们要计算的大分子蛋白质和DNA周围有游离水时,要去除这些水分子,以免干扰计算。
要删除这些原子或游离小分子,首先要选中它们,然后再进行删除。
Select ? Select From String:
Molecule Molecule List „
Chain Chain List „
Residue HOH* Residue Sets „
Atom * Atom List Sets „
选择 Add 之后,保持带有黄色* 的状态,选择 Dismiss 退出。 Edit ? Delete ? Delete AtomSet ? 出现 WARNING ? 选择 CONTINUE 即可删除所选原子或残基。
3.3导入配体小分子
3.3.1文件类型
经试验:PDB文件(.pdb)和MOL2文件(.mol2) 都可以使用,没有问题。 Ligand ? Input ? Open ...(AD3): ?
将 File of type 改为 PDB files:(*.pdb)?选择文件路径以及文件名 ? Open
3.3.2 说明
打开后小分子的位置只与大分子与小分子的坐标数据有关,而与两者的相互作用无关。
3.3.3 查看小分子
与查看大分子的方法相同。
3.4修饰配体小分子
3.4.1 一般修饰
与大分子一样,可以按原子类型显示颜色,添加氢原子,和删除某些原子或残基。除此之外,还可以在 Color 中选择 by Molecules,它会将大分子和小分子分别示以不同颜色,可以清楚的区别大分子与小分子。
3.4.2 特殊修饰——为 AutoGrid 作准备
1只显示小分子 ?
Display ? Show/Hide Molecule
Hide All 全部显示开关
?大分子 ON/OFF 大分子显示开关
?小分子 ON/OFF 小分子显示开关
在这里,调节到只显示小分子,然后放大小分子,以方便一下的步骤中观察小分子。
2 寻找根原子 ?
Ligand ? Torsion Tree ? Detect Root„
自动找到根原子是配体中可旋转键最多的原子。除此之外还可以选择根原子:
Ligand ? Torsion Tree ? Choose Root
另外,可从Show/Hide Root Marker 选择是否显示根原子。 3选择可旋转键 ?
Ligand ?Torsion Tree ? Choose Torsions„:
Number of rotatable bounds = X/Y
? Make peptide backbone bounds rotatable
? Make amide bounds rotatable (non- rotatable)
? Make guanidinium bounds rotatable
? Vlake rotatable bounds between selected rotatable
? Make all rotatable bounds rotatable (non- rotatable)
? Done
所用到的:?使得酰胺键可旋转/不可旋转
?使得所有的键可旋转/不可旋转
4调整可旋转键的数量 ?
Ligand ?Torsion Tree ? Set Number of Torsions:
在 number of active torsions:中可调整可旋转键的数量
根据经验来讲,一般选择 使得酰胺键不可旋转 。而比较大些的小分子(>100个原子),且可旋转键较多的(>20个),可选择 使得所有的键不可旋转 ,或者适当调整可旋转键得数量,以简化计算。
注:以上经验只适用于部分情况,仅供参考。
5 存储文件 ?
Ligand ? Output ? Save as PDBQ„(AD3) ? 输入文件名:*.out.pdbq ? Save
注意:? 从这一步开始,所有存储文件的文件名都要一致。
? 所有存储文件都要输入后缀名,否则程序不认。
? 尽量将文件都存在同一目录下,以方便之后一起移动。 3.5AutoGrid
3.5.1 大分子
1选择大分子 ?
Grid ? Macromolecule ? Choose„(AG3) ? 选择大分子 ? Select Molecule:
程序会自动检测有没有非整数电荷。如果没有,会弹出一个对话框:Fond no non-integral charge on * * *没有非整数电荷,或者如画面中显示的:“-added Kollman charges ;–merged nphs; –added salvation paramelers。如果有,就会出现一个警告:Non-integral charge on * * * (有非整数电荷),必须在输出文件中改正~两种情况都选择 OK 进入下一步。
2修改非整数电荷 ?
如果显示有非整数电荷,则要选择 No 和 Cancle 放弃这项。进入: Edit ? Charges ? Check Total Residues: 对话框中列出了含有非整数电荷的残基名,选择其中一个,再选 Spread Charge
Defucit over all atoms in residue 将电荷分散至所有原子。
将分子中的所选残基放大至可以看清每个原子的电荷数,选择其中一个电荷数较大的原子(例如:羰基氧),会弹出一个对话框,让你可以修改电荷数。(如果没有弹出,则再次双击或单击列表中的残基直到可以修改电荷数。)
每个残基整体有一个较大的黄色的数字,代表整个残基的电荷加和数。修改某个原子的电荷数以抵消这个加和数使之为零,则修改成功。
用同样的方法修改所有含有非整数电荷的残基。全部修改完毕后,再执行第一步则可。
3 定义未识别原子 ?
在没有非整数电荷的情况下,程序会检测大分子所含有的原子种类。此程序只识别C、H、O、N、S五种原子,如果大分子中含有其它类原子,程序会提示:* has unusual atom type:# „„you can define 2 types。此时,要输入参数来定义这类原子(最多不能超过2种:X和M)。选择 Yes :
Atom Tyoe: M or X 原子名称
Rii 与相邻原子间距离
epsii 势阱(默认.1485)
4储存文件 ?
选择 OK ? 存储文件(*.pdbqs)。
3.5.2 小分子
1 选择小分子 ?
Grid ? Set Map Types ? Choose Ligand„(AG3) ? 选择小分子 ? Select Molecule ?弹出对话框 ? 确定
2检查生成图谱的种类 ?
弹出的第二个对话框上写明了小分子所含的元素种类,检查无误后,确定。 有误则及时改正,在下方的选项中,可以钩除不含的元素种类,如:S等。 3.5.3 Grid Box
1选项选择 ?
Grid ? GridBox„ ?
每一个下拉菜单显示如下表:
Grid Options
File Center View Hel
p
Close saving ?Pick an atom ?Show box current
Close w/out ?Center on ligand ?Show box as saving lines
?Center on ?Show center
macromolecule marker
?On a named atom ?Adjust
marker size
首先,在 Center 中选择 ?Center on ligand 或 ?Center on macromolecule 。
然后,在 View 中,选成如表中所示,最为清楚,可进入下一步。
2调整Grid Box的大小 ?
使用说明:
此对话框中共有7个拇指转轮:两套红黄绿三色的和一个灰色的。
首先,移动此对话框,使其可以同时看见ADT的主界面和此对话框,此时可以看见分子上出现一个红黄绿三色的中空的盒子。
其次,逐一转动前三个红黄绿拇指转轮,可以分别调节盒子x轴y轴z轴的长度,来调节盒子长宽高的大小(最大为126)。
然后,如果盒子过大或过小,可以调节中间灰色拇指转轮的,来整体缩放盒子大小(最大到1)。
最后,在选定盒子中心的基础上,可以通过转动最下方的三个红黄绿转轮来调整盒子的中心,已达到计算要求。
3储存设定 ?
File ? Close saving current
4Grid Box的意义 ?
Grid Box的意义在于:程序将在这个盒子的范围内搜索小分子与大分子对接的最佳位点。所以,如果想要整体搜索对接位点,最好将大分子全部包括在盒子以内;而如果,已知某些位置不可能,或想要定点搜索,则应将盒子设定在某一特定部分,避免浪费时间和减少精确度。
这一步在整个计算中非常重要。
3.5.4 运行autogrid3
1移动文件 ?
autogrid3要求,运算前的所有准备文件都要与可执行程序autogrid3 在同一目录下,即:root(或某用户)/„/dist305/src/autogrid/将所有文件(*pdb×2、*.out.pdbq、*.pdbqs、*.gpf)移至此处/
2在终端中运行 ?
在ADT中运行autogrid和autodock会有较多错误,所以建议在终端中运行。
首先,打开一个终端:
在linux桌面上点击鼠标右键 ? 选择Open Terminal然后,进入到autogrid3所在的目录:
cd „/„/dist305/src/autogrid ? 回车 ? 显示:„/„/dist305/src/autogrid> ? 输入命令:./autogrid3 –p *.gpf –l *.glg ?
回车 ? 如果没有错误则开始运行,遇到错误则会跳出。
最后,在autogrid3开始运行后,可以再新建一个终端,用“top I ? 回车”命令,可以看见后台运行情况。
3结果文件 ?
运行结束后,会在autogrid3所在的目录下生成一个结果文件 *.glg 。此文件不可再ADT下打开查看,是运行autodock的必须文件。
3.6AutoDock
3.6.1 设定参数
1选择大分子 ?
Docking ? Mocromolecule ? Choose„(AD3) ? 选择大分子 ? Select Molecule
2选择配体小分子 ?
Docking ? Ligand ?Choose„(AD3) ? 选择小分子 ? Select Molecule
3 设定搜索参数 ?
Docking ? Search Parameters ? Genetic Algorithm„
4设定对接参数 ?
Docking ? Docking Parameters„ ?
5选择算法 ?
Docking ? Output ? Lamarckian GA„(AD3)
6 存储文件 ?
所有参数都设定完毕后,存储文件(*.dpf)
Docking ? Output ? Lamarckian GA„(AD3)输入文件名*.dpf ? Save 3.6.2 运行autodock3
1移动文件 ?
由于之前运行autogrid3,所以之前的文件和autogrid3生成的结果文件都在„/„/dist305/src/autogrid目录下。必须将这些文件全部移动至„/„/dist305/src/autodock目录下,否则autodock3无法找到这些文件。另外,上一步存储的*.dpf文件,也需要移动至„/„/dist305/src/autodock目录下。 2在终端下运行 ?
如果之前运行autogrid3的终端未关闭,并且在„/„
/dist305/src/autogrid>下,那么首先要用“cd ..”命令退出一级目录,变成„/„/dist305/src>,在用“cd autodock”进入„/„/dist305/src/autodock目录下,方可运行。
输入命令:./autodock3 –p *.dpf –l *.dlg ? 回车
如果没有错误便开始运行,遇到错误跳出。
3 结果文件 ?
autodock3运行结束后生成一个*.dlg文件,此文件在ADT下可视,用作最后的分析依据。
3.7运算结果的分析
3.7.1 直观分析
1打开结果文件 ?
autodock3运行后的结果文件*.dlg文件在ADT下可是,可以较为直观的观察结果。
在打开结果文件之前关闭所有分子的显示开关:
Display ? Show/Hide Molecule ? 关闭所有分子 ? Close Analyze ? Dockings ? Open ? 选择结果文件所在的路径 ? 选择结果文件*.dpf ? Open
然后再打开大分子,以供查看小分子的相对位置:
Display ? Show/Hide Molecule ? 只打开大分子和结果文件 ? Close 2播放结果文件 ?
Analyze ? Conformations ? Play„
Player:
Player
快进倒放 倒序逐个现在逐个顺序顺放 快进一般一般至第播放 倒放 是第播放 播放 至末没用 没用 一个 几个 一个 3.7.2 数据分析
结果文件提供了一些参数进行比较分析:
Analyze ? Conformations ? Load„
可在对话框上方查看详细的参数,包括:
项目 参数 备注
Rank:
Docked Energy: 对接能
Cluster RMS:
Ref RMS:
freeEnergy: 自由能
kl:
InterMolecularEne 分子内能
rgy:
Internal Energy: 内能
其它一些参数,如:原子坐标等可以查看*.dlg的文本输出文件。
至此,一个基本的计算过程就结束了。
参 考 文 献
1 Westhead R D, Clark E D, Murray W C. A comparison of heuristic search algorithms for molecular docking. J Comput-Aided Mol Design, 1997 (11): 209 2 Morris M G, Goodesll S D, Huey Ruth, et al. Distributed automated docking of flexible ligands to proteins: Parallel applications of Autodock2.4. J Comput-Aided Mol Design, 1996 (10): 293
3 Clark E D, Westhead R D. Evolutionary algorithms in computer-aided molecular design. J Comput-Aided Mol Design, 1996 (10): 337
4 Makino S, Kuntz I. Automated flexible ligand docking method and its application for database search. J Comput Chem, 1997, 18(14): 1812
5 康立山,谢 云,尤矢勇,等. 模拟退火算法. 北京:科学出版社,1995
6 刘 勇,康立山,陈毓屏. 遗传算法. 北京:科学出版社,1995
7 Lybrand T P, Curr(Opin(Struct(Biol., 1995, 5, 224—228.
8 Kollman P A, Curr(Opin(Struct(Biol., 1994, 4, 240-245.
致谢
北京师范大学环境工程学院 王燕教授