分子模拟方法及其在分子生物学中的应用
欧阳芳平,徐慧,郭爱敏,李燕峰
(11中南大学物理科学与技术学院,长沙410083;21中南大学理论材料与理论生物研究室,长沙410083)
摘要:常用的分子模拟方法有:量子力学法、分子力学方法、蒙特卡洛法和分子动力学法。四种方法各有优势,共同成为分子模拟的组成部分。综述了分子模拟法在分子生物学中的应用,最后介绍了分子模拟的发展方向,并预测了其未来的发展趋势。
关键词:分子模拟;分子动力学;分子生物学;生物大分子
中图分类号:Q61 文献标识码:A 文章编号:1672-5565(2005)-01-0033-04
Molecularsimulationmethodsanditsapplicationinmolecularbiology
OUYANGFang-ping,XUHui,GUOAi-min,LIYan-feng
(11CollegeofPhysics,CentralSouthUniversity,Changsha,410083,China;
21Theoreticmaterialandtheoreticbiologylab,CentralSouthUniversity,Changsha,410083,China)
Abstract:Inthisarticle,wesystematicallyreviewseveralgeneralmolecularsimulationmethods:quantummechanicsmethods,MonteCarlomethodandmoleculardynamicsmethod.Eachmethodhasitsownadvantage,combiningwitheachotherasawhole.Additionally,wesummarizetheapplicationofmolecularsimulationinMolecularBiology.Finally,weintroducethedevelopmentdirectionofmolecularsimulationandpredictitstrend.
Keywords:molecularsimulation;molecularmechanics;MolecularBiology;biopolymer
分子模拟又称“计算机模拟”或“计算机实验”,是一种根据实际体系,在计算机上进行的实验,通过比较模拟结果与实际体系的实验数据来检验模型的准确性,并可检验由模型导出的解析理论所作的简化近似是否成功。用分子模拟不但可以模拟现实中能进行的实验过程,而且可以用来模拟、研究如分子在各种表面上的动态行为、玻璃态的分子结构、分子运动的特征、蛋白质的折叠等现代物理实验方法难以计量的物理现象与物理过程。分子模拟最先是应用于生物分子领域[1],20世纪70年代,由于生物分子学实验技术的进步,X射线、NMR等技术的使用,使得研究生物分子的内部结构成为可能。从那以后,分子模拟被用来理解、预测、模拟蛋白质、核酸的结构和性质,以及模拟DNA的双螺旋结构。
分子生物学是从分子水平研究生物大分子的结
构与功能从而阐明生命现象本质的科学。生物大分子结构研究首要任务,即核酸和蛋白质等的研究,包括其间的相互作用、相互反应和信息传递。理解生物过程要求多方面的知识和方法,包括生物学、化学,物理学和计算机科学的应用等。我们研讨生物系统的最大难题是生物系统的复杂性,用牛顿力学来解释是远远不够的,用量子力学来研究困难很大(原因在于即使一个最简单的生物大分子的量子力学方程式,甚至不可能求得解析解),一个可行的方法是应用分子模拟技术进行处理。因此,分子模拟成为分子生物学中的一个重要的研究手段。
1 分子模拟方法
一般说来,分子模拟方法中主要有4种:量子力学方法,分子力学方法,分子动力学和分子蒙特卡洛
收稿日期:2004-02-21;修回日期:2005-02-24
基金项目:国家自然科学基金(60171043)与湖南省自然基金(03JJY3076)资助。
作者简介:欧阳芳平(1975-),男,湖南郴州人,硕士,讲师。主要研究方向:生物信息学中的理论计算与分子模拟。Tel:013875846365,E-mail:
ouyangfp@163.net。
© 1995-2005 Tsinghua Tongfang Optical Disc Co., Ltd. All rights reserved.
生 物 信 息 学 第3卷34 方法。
111 量子力学方法
参数和作用力来讨论分子的结构变形,即通过表征键长、键角和二面角变化以及非键相互作用的位能函数来描述分子结构改变所引起的分子内部应力或能量的变化。分子模拟的系统是实际系统的一部分,要使模型能反映研究对象的特征,模型中还需设置符合实际系统的原于间的作用势和晶体边界条件。常用的边界条件有自由边界、刚性边界、柔性边界和周期性边界。作用势采用从量子力学原理推算出的作用势或采用实验数据和光谱数据的经验性作用势。
分子力学是通过分子力场(ForceField)这个分子模拟的基石来实现的。分子力场是原子尺度上的一种势能场,它是由一套势函数与一套力常数构成,由此描述特定分子结构的体系能量。该能量是分子体系中成键原子的内坐标的函数,也是非键原子对距离的函数。分子力场近年来的发展才使分子力学有了用武之地,使分子模拟方法从不能区别化学特征的理论物理研究小组,进入能在化学上区分的分子设计实验室。早期的分子力场,如CFF、MM2、MMP2、MM3、AMBER等,仅能够描述有限的几种元
量子力学方法是基于量子力学的分子模拟,它借助计算分子结构中各微观参数,如电荷密度、键序、轨道、能级等与性质的关系,设计出具有特定性能的新分子。它们的共同点是对电子的相互作用采用量子化学的知识进行描述,而不是采用经验性的势能函数来表示,这种方法有很强的理论基础。量子力学方法可以分为从头计算法[2](abinitio)和半经验法[3-4](Semi-Empirical)两类。其中从头计算法不借助任何经验参数,它以Hartree-Fock-Roothann方程为出发点,适当的选择表示原子轨道
的基本集后,计算各种所需的积分,然后进入自洽求解。它广泛用于计算平衡几何形状、扭转势以及小分子的电子激发能。从头计算方法可提供有关键立体结构和构象的可靠信息,当传统工艺不能直接运用或很难得到复杂体系的立体几何结构与构象能的关系的情况下,从头计算法能得到较好的结果。随着计算机硬件和算法的发展,已将此技术用到大分子,包括聚合物的低聚物、生物大分子在内的模型,并有较好的结果。著名的从头计算程序有系列Gaussian程序,如Gaussian92,Gaussian98等。半经验
素与一些轨道杂化的原子,在物理化学生物学研究领域有很多的应用,但还不能满足发展的需要。90年代以来发展的DRRIDING、UFF、COMPASS分子力场,几乎覆盖了整个元素周期表,也用于生物大分子。
113 蒙特卡洛方法
方法是对从头计算中的许多积分采用经验参数替代的简化方法,所使用的经验参数是通过对实验数据的拟合得到的。另外,半经验方法还采用了价电子近似,假定分子中各原子的内层电子可以看作对分子不极化的原子实的一部分,而只处理价电子,这样进一步减少了计算时间。量子力学的半经验计算法如CNDO(全略微分重迭法completeneglectofdifferen2tialoverlap)、MNDO(修略微分重迭法)、AMI(Austin模
蒙特卡洛法因利用“随机数”对模型系统进行模拟以产生数值形式的概率分布而得名,作为一种独立的方法,20世纪40年代中期才开始发展。此法与一般计算方法的主要区别在于它能比较简单地解决多维或因素复杂的问题,它要利用统计学中的许多方法,又称统计实验方法。该方法不象常规数理统计方法那样通过真实的实验来解决问题,而是抓住问题的某些特征,利用数学方法建立概率模型,然后按照这个模型所描述的过程通过计算机进行数值模拟实验,以所得的结果作为问题的近似解。因此,蒙特卡洛法是数理统计与计算机相结合的产物。如果所要求解的问题是某种事件出现的概率,或者是某个随机变量的期望值,就可用蒙卡特洛法得到这种事件出现的概率,或者以这个随机变量的平均值作为问题的解。这就是MonteCarlo法的基本原理。如何用数学方法在计算机上实现数值模拟实验,便构成了MonteCarlo法最独特的内容。
型I)、PRDDO、密度泛函理论(Densityfunctiontheory)以及PM3(parametricmethod3)等用于计算构象能与结构的X射线结果分析,以此分析平衡态性质。目前,MNDO、AMI等方法最大可计算含500个原子的体系。
112 分子力学法(MolecularMechanics)
分子力学法又称Forcefield方法,是在分子水平上解决问题的非量子力学方法。其原理是,分子内部应力在一定程度上反映被计算分子结构的相对位能大小。该法可用来确定分子结构的相对稳定性,广泛地用于计算各类化合物的分子构象、热力学参数和谱学参数,其中很重要的是要知道怎样计算原子间的相互作用。分子力学从几个主要的典型结构
© 1995-2005 Tsinghua Tongfang Optical Disc Co., Ltd. All rights reserved.
第1期 欧阳芳平,等:分子模拟方法及其在分子生物学中的应用 35
由于生物大分子链由大量的重复单元构成,聚合反应存在着随机性。分子量的大小分布、共聚物中的序列分布、大分子的构象、降解,都存在着随机性问题,无疑成为MonteCarlo法研究的最佳对象。MonteCarlo方法没有迭代问题也没有数值不稳定的
2.1 核酸的分子模拟
核酸的分子模拟包括DNA的分子模拟、RNA
(核糖核酸)的结构模拟和反义RNA的分子设计等。当前,以数皮秒的时间标度核酸的分子模拟可以获取核酸序列以及各种溶剂条件对结构和分子的运动的影响信息,也可以在非常详细的层面上跟踪构型变化的过程以及核酸形成的大的生物分子配合物研究。当时间尺度提升至数百皮秒,则全溶剂化的核酸系统的分子模拟已逐步面向实际体系。而且,随着算法的改进已使得高度变化的核酸体系的精确分子模拟成为可能,依赖于强大的计算机,能模拟一些更复杂的反应,如RNA催化及折叠等。2.2 蛋白质的分子模拟
情况,收敛性可得到保证,但是否收敛得解要由所取模型的正确性决定。蒙特卡洛方法的收敛速度与维数无关,而且误差容易确定,计算量没有分子动力学那样大,所需时间少些。114 分子动力学方法[6]
分子动力学模拟的基本原理是建立一个合适的粒子系统,利用牛顿运动方程确定系统中粒子的运动,通过求得粒子动力学方程组的数值解,决定系统中各个粒子在相空间中的运动规律,然后按照统计物理和热力学原理得出系统相应的宏观物理特性。分子动力学的目标是研究体系中与时间和温度有关
的性质,通过求解运动方程(如牛顿方程、哈密顿方程和拉格朗日方程),分析系统中各粒子的受力情况,用经典的或量子学的方法求解系统中各粒子在某时刻的位置和速度,来确定粒子的运动状态。分子动力学可用于蛋白质结构预测、折叠-解折叠、蛋白质-配体识别、核酸(DNA,RNA)结构模拟等分子生物学领域。
115 四种方法各具特色与相互关系
目前,分子模拟是蛋白质空间结构模拟和分子设计的一个很重要的方法。借助于先进的计算机图形工作站,通过图形接口,既可方便地建立多肽、蛋白质分子的初始模型,也可以显示已被测定的蛋白质分子的空间结构。分子模拟技术对预测蛋白质肽链折叠和蛋白质结构、总结蛋白质结构规律、揭示蛋白质的结构与功能的关系等都是有力的帮助和促进。同时,分子模拟与遗传算法、模拟退火、多维统计和模糊集合论方法等成为蛋白质的结构与功能的预测的一种重要方法[7]。
科学家利用分子模拟技术,根据一种蛋白质的基因编码,准确地预测了它是怎样折叠成三维结构的[8]。纽约州立大学石溪分校的CarlosSimmerling和他的同事们从分子量较小的蛋白质开始着手。他们研究了一种小分子量的人造蛋白质———“色氨酸
(Trp-cage)。这种蛋白质仅由20个氨基酸构笼”
成[9]。Berriz和Shakhnovich,模拟了小的三螺旋束蛋白的折叠[10],Daggett和Fersht模拟了小的单结构域蛋白的动力学折叠[11]。Sanchez和Kiefhaber[12]模拟了蛋白质折叠中二态模型和具有隐藏中间体的三态模型。
2.3 细胞信号转导中的分子模拟
以上四种分子模拟方法各有特色:量了力学方法能得到有关立体构型和构象能的可靠信息,可以描述电子结构的变化;分子力学法研究的是体系的静态性质,描述基态原子结构的变化,得到比分子动力学更精确的值;蒙特卡洛法的误差容易确定,计算量没有分子动力学那样大,费时少,就获取某种状态的统计平均结构这一点而言,蒙特卡洛方法往往比分子动力学更有效;分子动力学能研究体系中与时间和温度有关的性质,是动态性质,它既克服了蒙特卡洛法仅能够描述不同温度下分子结构的特征,却不能描述不同温度下体系从一种热力学状态向另一种热力学状态演变过程的缺点,也克服了量子力学法中仅能计算绝对温度零度的真空中的孤立分子和分子力学只能计算绝对温度零度的分子体系等问题,能计算任何温度下分子体系的结构与性质。当然,四种模拟方法构成了与分子模拟密不可分的组成部分。
细胞信号的转导是分子生物学的重要研究领域,它研究细胞内、细胞间信息传递的分子基础。构成生物体的每一个细胞的分裂与分化及其它各种功能的完成均依赖于外界环境所赋予的各种指示信号,在这些外源信号的刺激下,细胞可以将这些信号转变为一系列的生物化学变化,例如蛋白质构象的转变、蛋白质分子的磷酸化以及蛋白与蛋白相互作用的变化等,从而使其增殖、分化及分泌状态等发生
2 分子模拟在分子生物学中的应用
© 1995-2005 Tsinghua Tongfang Optical Disc Co., Ltd. All rights reserved.
生 物 信 息 学 第3卷36
改变以适应内外环境的需要。信号转导研究的目标是阐明这些变化的分子机理,明确每一种信号转导与传递的途径及参与该途径的所有分子的作用和调节方式以及认识各种途径间的网络控制系统,分子模拟成为信号转导研究的一重要研究方法。2.4 生命过程的模拟
分子进行量子化学第一原理的计算,这对从本质上
解决蛋白质空间结构与功能、活性的关系,理解其生物功能的物理本质,了解蛋白质分子各部位的电子密度分布和能级分布,搞清楚药物分子与蛋白质分子相互作用的机理都极为重要。我们也正在尝试MD与神经网络、MD与CA、MD与遗传算法的结合
随着生物学知识的积累和计算机技术的发展,
分子模拟技术成为研究生命过程的新方法,生物学家将有可能利用这种新的工具来研究生命过程机制,建立生命复杂体系的分析系统和计算机虚拟实验室。典型的是日本Keio大学学者设计的电子细胞E—cell[13-14]和美国康涅狄格州州立大学学者设计的虚拟细胞V—cell[15]。通过这种电子细胞的计算机平台,当我们输入一定信号和刺激,就可通过画面和数字,反映细胞不同时问、不同空间、不同物质的变化和反应,使人们能实时看到某个因素和环节对细胞、整体及生命活动的影响。
用以解决MD中的计算速度问题,优化计算方法。
此外,我们认为如何从物理学科、材料学科和生命科学等交叉领域去发展分子模拟技术是研究者值得思考的问题。
参考文献(References):
[1] JosephC1J1Chem[J]1Educ,1993,70(11):9041
[2] HehreWJ,RadomL,ShleyerPVR.PopleJ,abinitioMolecularOr2
bitalTheory,NewYork:Wiley,19861
[3] StewartJJP.In:ReviewsinComputationalChemistry,Vol.1.Lipkowitz
KBandBoydDB(Eds)[C].NewYork:VCH,1990,45-811[4] DewarMJS,ZoebischEG,HealyEF,StewartJJP.J.Am[J].
Chem.Soc.,1985,107:3902-39091
[5] 杨玉良(YANGYu-liang)1高分子中的MonteCarlo方法(Monte
CarloMethodinPolymer)[M]1上海:复旦大学出版社(Shanghai:FuDanUniversityPress).19941
[6] 赵南明(ZHAONan-ming),周海梦(ZHOUHai-meng)1生物物
3 问题与展望
分子模拟正处在这样一个交叉学科的新生长点
上,国际上的动向集中在三个方面:一是用分子模拟技术来“扫荡”大分子计算中以往尚不能解决的理论问题与实验问题;二是用分子模拟技术来代替以往的化学合成、结构分析、物性检测等实验而进行新材料与分子的设计;三是分子模拟方法本身的不断发展。
近年来,随着计算机软硬件技术的飞速发展,计算机的执行速度和计算速度大幅度提高,因此对于分子生物学中生物大分子的计算模拟,在优化算法法、节约计算时间的同时要考虑提高模拟的精确度。当然,在今后一段时间里,发展和开发生物大分子力场仍是关注的重点。在蛋白质动力学中,我们正尝试建立包括考虑疏水作用的新势函数,将有另文报道[15]。
另外,分子模拟技术发展到今天,单一的方法已不能满足需要,将分子力学法和量子力学法(QM/MM)交叉结合,既对某些关键部位使用精确的量子力学能量函数,而其他部位使用分子力学的位能函数,实现优势互补,使得新方法既能模拟原子数目很大的体系,又能考虑电子的结构及运动。今后,随着分子模拟技术的发展,人们已经有可能对蛋白质全
理学(Biophysics)[M]1北京:高等教育出版社(Beijing:HigherEd2
ucationPress)120001
[7] Simmerling,C.,Strockbine,Strockbine&Roitberg,A.E.All-atom
structurepredictionandfoldingsimulationsofastableprotein[J].Jour2naloftheAmericanChemicalSociety,2002,124:11258-11259.[8] Neidigh,J.W.,Fesinmeyer,R.M.&Andersen,N.H.Designinga20
-residueprotein[J].NatureStructuralBiology,2002,9,425-4301[9] G.F.Berriz,E.I.Shakhnovich,Characterizationofthefoldingkinetics
ofthree-helixbundleproteinviaaminimalistLangevinmodel[J]1J.Mol.Biol.2001,310:673-6851
[10] V.Daggett,A.R.Fersht,Isthereaunifyingmechanismforprotein
folding[J]1TrendsBiochem.Sci.2003,28:18-251
[11] I.E.Sanchez,T.Kiefhaber,Evidenceforsequentialbarrierandobliga2
toryintermediatesinapparenttwo-stateproteinfolding[J]1J.Mol.Bi2ol.2003.3251
[12] NormileD,Buildingworkingcells’insilico’[J].Science,1999,284
(5411):80-1.
[13] TomitaM,Whole-cellsimulation:agrandchallengeofthe21stcen2
tury[J]1TrendsinBiotechnology,2001,19(6):205-10.
[14] SlepchenkoBM,SchaffJC,andChoiYS,NumericalApproachtoFast
ReactionsinReaction-DiffusionSystems:ApplicationtoBufferedCal2ciumWavesinBistableModels[J].JournalofComputationalPhysics.2000,162:186-218.
[15] 欧阳芳平,徐慧1蛋白质分子量子化学计算方法的研究进展
[J]1生物信息学,2004,2(2):42-461
© 1995-2005 Tsinghua Tongfang Optical Disc Co., Ltd. All rights reserved.
因篇幅问题不能全部显示,请点此查看更多更全内容