基于gSpan算法的未知化合物毒性预测被引量：4

Predicting the toxicity of unknown chemicals based on gSpan algorithm

下载PDF

导出

摘要 gSpan算法是一种基于频繁图的挖掘算法。该算法基于无候选人产生的频繁子图,在图中建立字典序标号,将每个图映射为最小DFS code,再采用深度优先搜索策略挖掘频繁连接子图。与前人算法相比,该算法在生成候选子图时,冗余子图的产生量大大减少;在计算候选子图支持度时避免了大量重复扫描数据库,性能卓越。该文的贡献是将gSpan算法应用在挖掘与已知毒性化合物具有相同子结构的化合物研究工作中,进行未知化合物的毒性预测,对相关领域应用发展具有重要意义。 The graph-based substructure pattern mining algorithm called gSpan, which discovers frequent substructures without candidate generation, is introduced first, gSpan builds a new lexicographic order among graphs and maps each graph to a unique minimum DFS code as its canonical label. Based on this lexicographic order, gSpan adopts the depth-first search strategy to mine frequent con- nected subgraphs efficiently. When it is applied to the chemical compound dataset Chemical_340, gSpan can find the compound set with same substructure as a chemical compound with toxicity, and then the toxicity of unknown chemicals can be predicted. This study is important to the related fields.

作者谢莹吴建国李炜许荣斌

机构地区安徽大学计算智能与信号处理教育部重点实验室

出处《合肥工业大学学报（自然科学版）》 CAS CSCD 北大核心 2007年第10期1278-1280,共3页 Journal of Hefei University of Technology：Natural Science

关键词频繁子图毒性预测化合物 frequent subgraph toxicity prediction chemical compound

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献8

1Zaki M J. Efficiently mining frequent trees in a forest[C]// Proc 2002 Int'l Conf Knowledge Discovery and Data Mining Edmonton. Alberta, Canada, 2002 : 135- 139.
2Kuramochi M, Karypis G. Frequent subgraph discovery [C]//. Proc 2001 Int'l Conf IEEE International Conference on Data Mining. San Jose, USA, 2001:313-320.
3Agrawal R, Srikant R. Fast algorithms for mining association rules[C]//. Proc 1994 Int'l Conf Very Large Data Bases. Santiago,1994:487 499.
4Cormen T H, Leiserson C E. Introduction to Algorithms [M]. 2nd ed. Massachusettes: MIT Press, 2001 : 12- 14.
5Yan Xifeng, Han Jiawei. gSpan:graph-based substructure pattern mining, Technical Report IUCDCS-R-2002-2296 [R]. Illinois, 2002 : 721 - 722.
6Pei J, Han J. PrefixSpan: Mining sequential patterns efficiently by prefix-projected pattern growth[C]//Proc 2001 Int'l Conf International Conference on Data Engineering. Heidelberg,2001 : 215-224.
7Asai T, Abe K. Efficient substructure discovery from large semistructured data[C]//Proc 2002 Int'l Conf SIAM International Conference on Data Mining. Washington, 2002:225 -227.
8Sun L, Zhang X. Efficient frequent pattern mining on Web logs[C]//Proc 2004 Int'l Conf Asia Pacific Web Conference. Hangzhou, 2004: 533- 542.

同被引文献36

1庄志雄.我国毒理学的发展历程和展望[J].中华预防医学杂志,2008(S01):9-15. 被引量：3
2程飞雄,沈杰,李卫华,Philip W.LEE,唐赟.有机化合物的陆地和水生环境毒性的计算机预测研究(英文)[J].农药学学报,2010,12(4):477-488. 被引量：3
3高大文,王鹏.松花江水中有机化学品的生物毒性预测[J].哈尔滨商业大学学报（自然科学版）,2004,20(5):549-551. 被引量：2
4方从兵,宛晓春,江昌俊.黄酮类化合物生物合成的研究进展(综述)[J].安徽农业大学学报,2005,32(4):498-504. 被引量：46
5王斌,余刚,张祖麟,胡洪营,王连生.烷基醇化合物的定量结构活性相关及联合毒性预测[J].科学通报,2006,51(13):1513-1518. 被引量：8
6KAVLOCK RJ, DIX DJ, HOUCK KA, et al. ToxCastTM: Developing predictive signatures for chemical toxicity [ C ]. Procedding of the 6th World Congress on Alternatives & Animal Use in the Life Sciences. Tokyo, Japanese Society for Alternatives to Animal Experiments ( JSAAE), 2007 : 623 - 627.
7MOHAN CG. Impact of computational structure-based predictive toxicology in drug discovery [ J ]. Comb Chem High Throughput Screen, 2011, 14(5) : 417 -426.
8NESTLER EJ. Molecular mechanisms of drug addiction [ J ]. Neuropharmacology, 2004, 47 ( Suppl 1 ) : 24 - 32.
9WOLFGANG M, BREIDENBACH A, FISCHER H, et al. Conlputational toxicology in drug development [ J 1. Drug Discov To- day, 2008, 13(7 -8) : 303 -310.
10DIVITA G, TAMANNA G, GOPI MC. Exploring QSTR and toxicophore of hERG K ^+ channel blockers using GFA and hypogen techniques [ J ]. J Mol Graph Model, 2008, 26 (6) : 966 - 976.

引证文献4

1朱永亮,叶祖光.计算毒理学与中药毒性预测的研究进展[J].中国新药杂志,2011,20(24):2424-2429. 被引量：20
2姜允申.理论毒理学研究进展[J].生态毒理学报,2014,9(6):1239-1242. 被引量：3
3覃遵颖,孙雨,李国栋,齐怀睿,陶敬.大规模网络图中4节点子图数量快速估计算法[J].西安交通大学学报,2018,52(12):57-62.
4魏若冰,何家峰,邱晓芳,刘旗.基于SGCN的化合物致癌性预测模型[J].电子技术应用,2022,48(6):33-35.

二级引证文献23

1Xin-yu Li,Xin Jin,Ya-zhuo Li,Dan-dan Gao,Rui Liu,Chang-xiao Liu.Network toxicology and LC-MS-based metabolomics:New approaches for mechanism of action of toxic components in traditional Chinese medicines[J].Chinese Herbal Medicines,2019,11(4):357-363. 被引量：9
2冯斐斐,李春阳,徐玉宝,陈小玉,张巧.对毒理学专业研究生教育的思考[J].中国现代医生,2014,52(5):104-106. 被引量：2
3王新洲,朱永亮,金若敏,刘敬阁,钱向平,姚广涛,叶祖光.基于数学模型的药物成分肾毒性预测[J].中国新药杂志,2014,23(13):1565-1568. 被引量：8
4张照研,王宇光,黄小燕,汪美汐,杨亮,马增春,汤响林,高月.何首乌6种成分对人孕烷X受体介导的CYP3A4的调控作用[J].中国中药杂志,2018,43(20):4104-4110. 被引量：3
5叶立,王新洲,朱永亮,金若敏,叶祖光,姚广涛,刘敬阁,钱向平.利用树模型预测中药成分的肝毒性[J].中国药学杂志,2014,49(18):1583-1588. 被引量：7
6姜允申.理论毒理学研究进展[J].生态毒理学报,2014,9(6):1239-1242. 被引量：3
7雷蕾,王新洲,张黎,杨策,亢力,朱永亮,钱向平,叶祖光.中药化学成分对大鼠急性毒性的定量构效关系研究[J].中国中医药信息杂志,2016,23(1):43-46. 被引量：4
8高雅,姚碧云,周宗灿.中草药重要成分的QSAR预测毒性数据库的建立[J].毒理学杂志,2015,29(6):399-401. 被引量：12
9唐才明,金佳滨,彭先芝.环境污染物计算毒理学分析及环境行为模拟研究进展[J].环境监控与预警,2016,8(2):1-8. 被引量：6
10沈敏,严慧,施妍,向平.系统毒理学--法医毒物学发展的机遇与挑战[J].中国司法鉴定,2016(5):57-65. 被引量：2

1许荣斌,谢莹,吴建国.基于化合物库测试的gSpan算法[J].计算机技术与发展,2007,17(10):58-60.
2陈雅菲,钟儒刚.QSAR建模方法及其应用于化学物质毒性预测的研究进展[J].轻工科技,2017,33(2):29-31. 被引量：6
3郭玉林,刘勇.频繁子图挖掘算法gSpan的设计与实现[J].智能计算机与应用,2011,1(3):55-57.
4张焕生,刘春玲,李轶华.基于图的频繁子结构挖掘算法[J].内江科技,2007,28(7):81-81.
5郭凌星,张德同,陈莉,李华.基于gSpan的数据筛选算法研究与应用[J].计算机应用研究,2011,28(6):2070-2072. 被引量：3
6朱莹莹,王宇嘉.基于偏好粒子群算法的移动机器人路径规划[J].上海工程技术大学学报,2014,28(4):337-341.
7邹兆年,高宏,李建中,张硕.演变图上的连接子图演变模式挖掘[J].软件学报,2010,21(5):1007-1019. 被引量：5
8邹晓红,郑超.基于标准编码的频繁子图挖掘算法[J].小型微型计算机系统,2012,33(1):78-82.
9刘荣辉,郑建国,王翔.采用最小DFS的Deep Web结构化数据抽取[J].图书情报工作,2010,54(14):126-130.
10周溜溜,业宁.基于对gSpan改进的有向频繁子图挖掘算法[J].南京大学学报（自然科学版）,2011,47(5):532-543. 被引量：2

合肥工业大学学报（自然科学版）

2007年第10期

浏览历史

内容加载中请稍等...

基于gSpan算法的未知化合物毒性预测被引量：4

参考文献8

同被引文献36

引证文献4

二级引证文献23

相关作者

相关机构

相关主题

浏览历史

基于gSpan算法的未知化合物毒性预测 被引量：4

参考文献8

同被引文献36

引证文献4

二级引证文献23

相关作者

相关机构

相关主题

浏览历史

基于gSpan算法的未知化合物毒性预测被引量：4