摘 要:采用分子电性距离矢量(Molecular Elect ronegativity Distance Vector ,MEDV)表征了三嗪类化合物的分子结构,并运用多元线性回归(Multiple Linear Regression ,ML R) 建立了该类化合物结构与其发光菌和大型蚤毒性的定量结构2毒性相关(Quanti2tative St ruct ure2Toxicity Relationship ,QSTR) 模型,同时采用留一法交互检验对所建模型进行了分析和验证,建模计算值的相关系数R 分别为0. 970 和0. 952 ,留一法交互检验预测值的相关系数RLOO分别为0. 917 和0. 921 ,并进一步阐述了结构与毒性之间的关系。结果表明,三嗪环上π电子离域程度减小有利于毒性增加,侧链N 上取代基数目增加,化合物毒性减小。为进一步预测该类化合物的毒性,进行药物筛选提供了有效的理论依据。
关键词:分子电性距离矢量;构效关系;三嗪类化合物
中图分类号:O641 文献标识码:A 文章编号:100626144 (2010) 0120015206
三嗪类化合物作为除草剂和杀虫剂的中间体日益得到广泛的重视和应用,但在应用过程中,其对天然水体、土壤和食品[124 ] 等有较大的污染。随着越来越多的新型三嗪类化合物不断地出现[526 ] ,加之其在自然环境中结构的多样性,因此研究三嗪类化合物的毒性效应具有十分重要的意义。近年来,量子化学计算方法常被用于有机污染物的定量构效关系 (Quantitative St ruct ure2ActivityRelationship ,QSAR) 研究中[7212 ] 。本文着重研究了12 种三嗪类化合物,利用分子电性距离矢量计算出参数,用该参数以及化合物的发光菌毒性和大型蚤毒性建立了定量结构2毒性相关(Quantitative St ruct ure2Toxicity Relationship ,QSTR) 模型,并进一步论述了结构与毒性之间的关系,为今后预测类似结构化合物的毒性,进行药物筛选提供理论依据。
1 基本原理与方法
通常分子由各种不同属性的原子按不同连接方式(化学键) 构成。而原子之间的相互作用与原子电性及相隔距离密切相关。一般而言,依据库仑定律,电性越大,距离越小,相互作用就越大。另一方面,不同原子类型之间的相互作用方式也不同。原子间相互作用取决于各原子相对电性和它们之间的相对距离。
分子电性距离矢量(MEDV) [13214 ] 就是基于这种原理推导得出的一种结构参数矢量。该方法考虑的是各类非氢原子之间的电性相互作用,而非氢原子与氢原子之间的键可以看成是定域的,对非氢原子之间的电性相互作用无影响。按非氢原子与其它非氢原子连接的数目分类,如果非氢原子与k 个非氢原子相连,则该原子就称为第k 类原子,对于已经发现和合成的绝大多数有机物分子中各种非氢原子最多只有4 种原子类型,各类原子的相互作用按以下方式组合:Mkl( k = 1 , 2 , 3 , 4 ; k ≤l ≤4) ,表示第k 类原子与第l 类原__子的作用项, Mkl计算方法如下:
Mkl= Σi ∈k , j ∈lqiqjd2ij(1 ≤k ≤l ≤4) (1)
式(1) 中, k 或l 是原子类型(共4 类) ,原子i 或j 分别属于第k 类原子和第l 类原子; qi 和qj指原子i 和j的相对电性; dij表示原子i 和j 之间的距离(以相对键长表示) ,是从原子i 通过一个或多个化学键连接到原子j 的所有路径中各个相对键长加和的最小值。这样就得到10 个变量:M11 , M12 , M13 , M14 , M22 , M23 ,M24 , M33 , M34 , M44 ,即为MEDV。
2 数据集的选取及回归分析
2. 1 数据集的选取及划分
本工作所用的三嗪类化合物及其毒性数据取自文献[728 ] ,如表1 所示。化合物对发光菌和大型蚤的毒性大小以半抑制浓度( EC50 ) 表示,单位为mol/ L ,本工作在QSTR 研究中均以其负对数表示。定量构效关系中重要的一部分是对所建模型的外部样本预测能力和真实有效性进行验证,其中留一法(Leave2One2Out ,LOO) 交叉检验(Cross2Validation ,CV) 是目前较为广泛使用的一种模型验证方法。
2. 2 多元线性回归模型的建立
多元线性回归(Multiple Linear Regression ,MLR) 是一种经典的建模方法,它对自变量和因变量加以线性拟合以得到最小二乘(Least Square ,LS) 意义下的最佳结果。首先计算出12 个化合物的MEDV ,结果见表2 ,将化合物的MEDV 与其毒性( - lgEC50 ) 相关联建模。在多元线性回归过程中,为了消除变量间偶然相关的影响,剔除影响模型稳定性的自变量,使回归方程始终显著,需要在多元回归分析中引入逐步回归 (SMR) 的方法。
本文中逐步回归采用SPSS 程序,方法为逐步观察R、SD、F、RLOO 、SDLOO 、FLOO随引入变量数的增加而变化的情况,逐步回归的过程如表3 、表4 所示。
从表3 的结果可以看出,当引入变量M33 、M13 、M22 时, R 和RLOO出现最大值(0. 970 和0. 917) ,SD 和SDLOO有最小值(0. 175 和0. 287) ,此时模型最为稳定且具有对外部样本最佳的预测能力。通过以上分析,可知选用M33 、M13 、M22 这3 个变量建立方程最好。
用化合物的MEDV 与其发光菌毒性( - lgEC50 ) 相关联,建立如下QSTR 方程:
- lgEC50 (发光菌) = 4. 564 + 0. 279M13 - 0. 040M22 - 0. 375M33 (2)
N = 11 , R = 0. 970 ,SD = 0. 175 , F = 37. 026
由表4 的结果可以看出,当引入变量M13时, R 和RLOO出现最大值(0. 952 和0. 921) ,SD 和SDLOO有最小值(0. 119 和0. 160) ,此时模型最为稳定且具有对外部样本最佳的预测能力。通过以上分析,可知选用M13 这个变量建立方程最好。
用化合物MEDV 与其大型蚤毒性活性( - lgEC50 ) 相关联,建立如下QSTR 方程:
- lgEC50 (大型蚤) = 4. 220 + 0. 135M13 (3)
N = 7 , R = 0. 952 ,SD = 0. 119 , F = 48. 538
使用方程(2) 和方程(3) 对三嗪类化合物的毒性( - lgEC50 ) 进行估计与预测,结果如表1 所示,并将计算结果与观察值相关情况绘于图1 中。
从图1 可以看出,各个样本都均匀分布于过原点的45°直线周围,表明MEDV 与三嗪类化合物的发光菌毒性和大型蚤毒性( - lgEC50 ) 呈明显的线性相关。
3 三嗪类化合物发光菌和大型蚤毒性QSTR模型比较
将本工作的回归结果与前人工作进行比较,结果见表5 。由表5 可以看出,分子电性距离矢量计算的结果明显优于其它方法。
4 结论
分子电性距离矢量计算简单,结构参数的取值完全来自分子本身的结构,不需要加入任何经验性的性质参数或校正参数,较为客观。且计算易程序化,只需要输入分子中原子及其连接关系就能很容易得到分子电性距离矢量值。采用MEDV 描述子表征三嗪类化合物分子的结构信息,较准确地模拟和预测了该类化合物的发光菌和大型蚤毒性( - lgEC50 ) ,取得了较满意的结果。研究表明,MEDV 能较好地表征这类化合物的分子结构,所建模型具有良好的稳定性和预测能力,同时为三嗪类化合物作为药物分子的设计提供了如下的理论依据:从所建模型可以看出,描述子M13 与三嗪类化合物的毒性呈正相关, M33与化合物的毒性呈负相关,根据M13 和M33 所代表的物理意义,可以得出如下结论:三嗪环上π电子离域程度减小有利于毒性增加,如1 号化合物与7 号化合物相比,2 号化合物和5 号化合物相比,3 号化合物和6 号化合物相比,都表现出相同的变化规律,其原因可能是由于N 原子与C 原子在同一周期,N 原子上的孤对电子能与π电子产生很好的p2π共轭,而Cl原子则不能;三嗪环侧链N 上取代基数目增加,化合物毒性减小。这一现象的发现对该类化合物作为药物的设计及毒性预测具有重要意义。
展源
何发
2020-05-27
2020-05-27
2020-05-27
2020-05-27
2020-05-27
2020-05-27
2020-05-27
2020-05-27
2021-05-25
加载更多