由于计算机辅助药物设计技术在新药开发过程中起到至关重要的作用,通过该技术可以使新药前期研发的时间显著缩短,可以节约大量的人力和财力。
国家政策鼓励全民创新,在此政策驱动下科技进步飞快,产品标签从之前的“中国制造”加速走向“中国创造”。特别是在制药领域,各类创新药正在逐渐取代仿制药的临床应用地位,引领一个全新的时代。在创新药开发过程中,计算机辅助药物设计的兴起使得研发历程大大缩减,在临床前研发中被广泛应用。
计算机辅助药物设计( computer- aided drug design , CADD) 是最近几年发展起来研究与开发新药的一种崭新技术,通过结合计算机的超强算力、复杂的逻辑判断和简明清晰的图形显示等功能,使量子化学、分子力学、药物化学、生命科学、计算机图形学和信息科学等多学科交叉在一起形成的崭新技术。
计算机辅助药物设计主要是通过分析受体与配体的相互作用,进行先导化合物的优化与设计。受体(receptor)主要是生物体的细胞膜上或细胞内的大分子,具有很高的特异性和专一性,主要包括:
配体(ligand)是和受体蛋白特异性结合的任何分子,这里主要是指药物小分子。配体通过分布到受体部位,随后与受体蛋白特异性结合(binding)后产生药理作用,一般只分析受体中对药效有影响的关键氨基酸残基。
2)基于配体的药物设计(ligand-based drug design,LBDD),如:定量构效关系(QSAR)、药效基团模型、受体映射、基于分子形状的叠合等。CADD技术的引入大大提高了药物设计水平,使之趋向于定向化和合理化,为新药开发开辟了广阔的前景。
分子对接技术是计算机辅助药物设计的常用技术之一,也是最重要的计算机辅助药物设计手段,是最近几年特别成熟的直接药物设计方法。主要是利用-化学和量子力学等学科的方法,通过模拟分子的3D构象和分子间相互作用方式来预测受体-配体复合物结构(图2)。分子对接技术既能研究配体与受体的相互作用方式,预测其结合模式和亲合力,也可以发现并优化先导化合物分子,从而实现基于结构的药物设计(SBDD)。
具有明确的生物大分子的三维构象是分子对接的基础,可以通过X-射线晶体衍射、核磁共振方法、同源模建(homology modeling)等方法得到。对于未解析的蛋白晶体结构,如果知道一级序列,最常用的方法是通过同源建模预测其晶体结构。
目前,随着计算机技术的快速发展、被披露的靶酶晶体结构的数目快速增长和商用数据库的日益更新,使分子对接技术在药物设计中取得了前所未有的成功,已经成为SBDD研究中最重要的方法,目前常用的分子对接软件有 DOCK、F1exX、GOLD、Autodock、Maestro等。
药效团是一系列活性分子最大的重叠部分,并且具有相似药理学活性和被靶标的相同结合位点识别分子的最大公分母,半岛·BOB官方网站目前产生药效团的主要方法包括
1)基于配体生产的药效团:主要是通过大量的活性分子构成训练基,然后进行叠合,最后用叠合后的构象产生药效团。药效团产生后需要评估产生的药效团是否正确和能否区分活性化合物和非活性化合物,通过一定数量的活性和非活性分子构成测试集验,通过将测试集的每个化合物进行匹配,如果药效团能匹配活性化合物不能匹配非活性化合物,证明构建的药效团是正确的,反之是错误的;
2)基于受体-配体产生药效团模型,通过已知的共结晶复合物构建药效团,其优点是该共结晶复合物-有明确的作用方式,同时所出构象是能起药效的活性构象。
药效团特征元素主要包括1)氢键受体:如O、N、S等;2)氢键供体:如-OH、-NH、-NH2、-SH等;3)电荷中心:如NH4+、COO-等4)疏水基团:如-CH3、苯环、芳杂环等;5)空间位阻等特征元素组成(图3)。
理想的药效团模型应该有3-5个特征元素,随着特征元素数目逐渐增多,最终会导致无法生成药效团。
药效团需要存在于配体中,同时在受体结合位点有适当的空间构型。因此,了解配体的构象性质以及配体与蛋白质结合所需的活性构象至关重要。
化合物活性构象可以通过构象搜索方式获得,构象搜索可以生成多种构象,将生成的全部构象进行叠合。分析叠合后的构象可以推断和解释受体与配体之间最可能的相互作用模式。通过对先导化合物的药效团修饰,可以产生一系列化合物。
随后通过实验进行活性测试,对实验结果进行构效关系分析,可得到比先导化合物活性更高且毒性更低的分子。
目前产生药效团常用的软件有Sybyl、Maestro、Discovery Studio等,这些软件主要区别在于对柔性构象的处理和药效特征结构的叠合方式。
众所周知,计算机辅助药物设计最重要的手段是分子对接,分子对接依赖于蛋白质晶体结构,由于成本及时间有限,与呈爆炸型增长的基因序列相比,目前已解析可供使用的蛋白质晶体结构其实不多,蛋白质晶体结构可以通过PDB数据库获取。为了得到更多的蛋白晶体结构,诞生了蛋白质结构预测方法。
从头预测(ab initio)目前是结构生物学界的一个研究热点与难题;而基于模板的蛋白质预测方法(Template-based)则显得更为成熟,其中同源建模是基于模板的蛋白质预测方法中最著名的一种预测方式。
同源建模主要以已知的蛋白质三维结构为模板推测未知的蛋白质结构,这种方法的准确度也相对较高。蛋白质同源建模的软件及web非常多,同时大部分计算机辅助药物设计(CADD)软件也自带这一功能。这些资源使用难度较高,其中有部分是收费的。
定量构效关系在药物设计中广泛使用,其理论基础是使用数学模型对药物分子的化学结构和生物活性进行定量分析,找到药物的化学结构与生物活性之间的量变规律,为先导化合物优化提供依据。
QSAR假定同系分子生物活性变化与其特异的理化性质变化相关,包括疏水性、电负性和立体效应三个方面,并且这三个方面相互独立互不干扰。
目前,常见的QSAR模型有两个主要包括:1)规则模型(rule-based model):主要是通过专家经验制定的各种规则建立的模型;2)统计模型(statistic-based model):基于回归分析、偏最小二乘、神经网络等数学模型建立的模型。定量构效关系(QSAR)方法主要用于预测Logp、溶解度和生物活性等化学结构的性质,同时也对结构和毒性间的毒理学解释提供了方便。
目前QSAR主要通过主成分回归分析法和偏微分最小二乘法来克服维数限制,两方法的主要区别是:1)主成分分析法得到的解释更有普遍性;2)偏微分最小二乘法运算较快,在实际应用中更受欢迎。常用的QSAR软件主要包括:Maestro、Forge、Sybyl、Discovery Studio等。
随着计算机辅助药物设计已作为一种实用性的工具被应用到药物研究的各种环节,并且已有许多应用理论方法设计而获得成功的药物发表和上市(表1)。这标志着该领域的研究已开始向实用化方向迈进,并已成为创新药物研究的核心技术之一。
由于计算机辅助药物设计技术在新药开发过程中起到至关重要的作用,通过该技术可以使新药前期研发的时间显著缩短,可以节约大量的人力和财力。基于需要量的逐年增长,国内掀起了计算机辅助药物设计潮流,成立了很多拥有计算机辅助药物设计平台的公司(表2)。