全局与局部模型对QSAR／QSPR预报能力比较被引量：3

Comparison of predictions between global and local model for QSAR/QSPR

导出

摘要针对两组数据进行了比较讨论,试图说明在QSAR／QSPR研究中经常碰到的一个基本问题。第一组为一散布度(diver- sity)很大分子结构多样化的大样本数据;第二组则是按照分子结构相似度筛选出来的散布度较小结构相似的小样本数据。对于第一组数据,因数据集分散,全局模型难以完全描述物质结构特征与其性质之间的关系,所得回归结果很差(检验集相关系数Q2=0．68、平均预报偏差(RMSEP)=40．65)。试采用新近提出的局部懒惰回归(Local lazy regression,LLR)对其进行改善,但实际结果是局部模型的效果更差(Q2=0．60、RMSEP=45．05)。继对散布度较小且相对均匀(结构相似)的数据集用LLR方法建立局部模型,此时得到的预报结果(Q2=0．90、RMSEP=24．66)却明显优于全局模型(Q2=O．86、RMSEP=29．37)。 Two datnsets were compared with each other to illustrate a basic problem in the research field of QSAR/QSPR. One of the datasets was a big dataset of large structural diversity, the other was a small dataset which was screened by structural similarity. For the first dataset, the global model couldn＇t recognize the relationship between structural features of molecules and their properties because of the great structural diversity, the result of regression was not good with Q^2= 0.68 and the RMSEP （ root mean square error of prediction） =40.65 for global model. And then, a new method called local lazy regression （LLR）, which obtains a prediction for a query molecule using its local neighborhood rather than considering the whole data set, was used to try to improve the effect of prediction. However, the result of LLR was even worse （ Q^2= 0.60, RMSEP = 45.05）. But for the second dataset, the result from LLR model （ Q^2= 0.90, RMSEP = 24.66） was much better than the one from global model （ Q^2=0.86, RMSEP = 29.37）.

作者周新奇梁逸曾袁大林梁晟

机构地区中南大学中药现代化研究中心

出处《计算机与应用化学》 CAS CSCD 北大核心 2007年第1期83-86,共4页 Computers and Applied Chemistry

基金国家自然科学基金资助项目(20475066 20235020)

关键词全局模型局部懒惰回归 K-最近邻算法 QSAR/QSPR 预报能力 global, model, local lazy regression, K-nearest neighbor algorithm, QSAR/QSPR, prediction

分类号 Q655 [生物学—生物物理学]

引文网络
相关文献

参考文献20

1Lemont B Kier and Lowell H Hall. Molecule Structure Description :The Electretopologlcal State. San Hiego, California: Academic Press, 1999.
2Carbo-Dorca R, Amat L, Besalu E, et al. Journal of Molecular Structure ( Theochem), 2000, 504 : 181 - 228.
3Brian W Clare, Claudiu T Supuran. Eur J Med Chem, 1999, 34:463 - 474.
4Liu SS, Yin CS and Cai Shaoxi, ctal. J Chin Chem Soc, 2001,48:253 - 260.
5Liang GZ, Mei H and Zhou P, et al. Aeta Phys Chim Sin, 2006,22(3) : 388 -390.
6Agatonovic-Kustrin S, Bereaford R, Pauzi A and Yusof M. Journal of Pharmaceutical and Biomedical Analysis, 2001,26:241 -254.
7Leardi R, Lupia? ez A Chemolab, 1998, 41:195 -207.
8Peter Winett. J Chem Inf Comput Sci, 1998, 38:983 - 996.
9Andrcas Bender and Glen RC. Org Biomol Chem, 2004, 2:3204 -3218.
10Raymond John W, C John Blankley and Peter Willett. Journal of Molecular Graphics and Modeling, 2003, 21:421 -433.

同被引文献39

1桂连友,刘树生,陈宗懋.外源茉莉酸和茉莉酸甲酯诱导植物抗虫作用及其机理[J].昆虫学报,2004,47(4):507-514. 被引量：78
2董永春,白志鹏,吴德明,刘瑞华,朱红星.水溶性阴离子偶氮染料还原脱色性能的QSPR研究[J].计算机与应用化学,2004,21(5):695-700. 被引量：7
3程杰,刘波,杨小震.自组装二十烷二羰基二-L-谷氨酸纳米管的分子模拟[J].计算机与应用化学,2005,22(1):1-4. 被引量：3
4徐士友.拓扑指数~mV与无机氢化物pKa_1的关系[J].合肥工业大学学报（自然科学版）,2006,29(3):272-274. 被引量：1
5ZHANG Xing-Chuan,YU Jing,WANG Zun-Yao,LIU Hong-Xia.QSPR Studies on lgK_(ow) and lgK_(oc) of Fluorobenzenes and Property Parameters Based on HF and DFT Calculations[J].Chinese Journal of Structural Chemistry,2006,25(7):823-829. 被引量：5
6袁大林,梁逸曾,许青松.QSAR/QSPR模型中的蒙特卡罗交叉效验评价[J].计算机与应用化学,2006,23(6):569-573. 被引量：3
7杭烨超,李吉来,李卓,黄旭日,耿彩云,李方实,孙家锺.理论线性溶解能参数在苯砜基羧酸酯类化合物急性毒性QSAR研究中的应用[J].分子科学学报,2006,22(5):338-343. 被引量：6
8张运陶,范磊.基于量化参数的脂肪醇沸点QSPR研究[J].计算机与应用化学,2006,23(12):1296-1300. 被引量：10
9E. Wassim Chehab John V. Perea Banu Gopalan Steve Theg Katayoon Dehesh.Oxylipin Pathway in Rice and Arabidopsis[J].Journal of Integrative Plant Biology,2007,49(1):43-51. 被引量：14
10陆文聪,殷文宇,李国正,刘太昂.支持向量回归方法用于1,4,2-二氮磷杂环戊-5-(硫)酮类化合物除草活性的QSPR研究(英文)[J].计算机与应用化学,2007,24(1):69-73. 被引量：6

引证文献3

1曹慧,李祖光,陈可先,高建荣,沈德隆.茉莉酸类化合物的QSPR研究[J].计算机与应用化学,2008,25(8):957-963. 被引量：4
2何琴,郭丽丽.QSAR结合人工神经网络预测磺酰脲类除草活性[J].许昌学院学报,2012,31(2):87-90.
3余训爽.基于PCA-BPNN对无机氢化物pK_a的QSPR研究[J].安徽大学学报（自然科学版）,2013,37(6):104-108.

二级引证文献4

1张婵娟,张生万,吴菊花,尉立刚,张永成,齐尚忠.三嗪类化合物定量结构与毒性关系的研究[J].计算机与应用化学,2010,27(3):387-391. 被引量：2
2柴薇薇.探析茉莉酸类化合物的抗逆生理作用[J].科技风,2011(24):59-59.
3魏丹,李祖光,聂晶,敬刚,吴慧珍.茉莉酸氨基酸共轭物的QSPR研究[J].农药,2013,52(9):635-638.
4李祖光,敬刚,魏丹,黄友好.茉莉酸类化合物的合成研究进展[J].有机化学,2013,33(11):2310-2324. 被引量：2

1王三应,孙萍萍,张磊,张翌,李莎,李燕,杨继红.羊轮状病毒LLR VP4单克隆抗体的制备与特性研究[J].中国人兽共患病学报,2009,25(11):1074-1078. 被引量：2
2张列琤,尹京苑,李重河,郭景康.用头发微量元素诊断前列腺肿瘤的研究[J].计算机与应用化学,2009(6):705-711. 被引量：2
3赵雅静,高雪军,刘晨鸣,魏至栋,冯德杰,朱莉萍.轮状病毒LLR疫苗株VP7基因的遗传变异研究[J].中国生物制品学杂志,2008,21(12):1074-1077. 被引量：6
4鱼轲,魏至栋,蒋琳.轮状病毒LLR株VP7抗原表位的预测与验证[J].微生物学免疫学进展,2011,39(1):10-14. 被引量：1
5卓越,田桦,王大江,杨景云.菌群检测值的模式识别分析法判断肠道菌群失调的研究[J].中国微生态学杂志,1997,9(5):20-21.
6吴超,钟一文.蛋白质功能预测的蚁群优化算法[J].广西师范大学学报（自然科学版）,2011,29(3):136-141. 被引量：2
7Xiangdong Fu,Jianru Zuo, National Center for Plant Gene Research, Institute of Genetics and Developmental Biology, Chinese Academy of Sciences, Beijing 100101, China. xdfu@genetics.ac.cn.PAT: waking up a lazy sleeping beauty[J].Cell Research,2007,17(5):387-388.
8杜忠娟,钟民涛,伦永志,刘奔,张伟,王晓丽,李星云,曹靖,宁安红,黄敏.香菇C_(91-3)转录本Unigene14872基因Pkinase结构域的克隆表达及其生物信息学分析[J].微生物学杂志,2014,34(1):22-27. 被引量：2
9苗莉云,王孝安,王志高.太白红杉群落物种多样性与环境因子的关系[J].西北植物学报,2004,24(10):1888-1894. 被引量：15
10印海建,田旭东,石太平.子模型技术在全钢载重子午线轮胎有限元分析中的应用[J].轮胎工业,2011,31(10):597-602. 被引量：1

计算机与应用化学

2007年第1期

浏览历史

内容加载中请稍等...

全局与局部模型对QSAR／QSPR预报能力比较被引量：3

参考文献20

同被引文献39

引证文献3

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

全局与局部模型对QSAR／QSPR预报能力比较 被引量：3

参考文献20

同被引文献39

引证文献3

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

全局与局部模型对QSAR／QSPR预报能力比较被引量：3