逻辑模型树算法性能分析与改进研究被引量：6

The research on analysis and improvement of logistic model tree

下载PDF

导出

摘要逻辑模型树(LMT)算法是基于树归纳和逻辑回归的一种分类算法。为验证LMT算法的优势,利用3个UCI标准数据集建模,将LMT算法与其他决策树方法进行对比分析。针对LMT算法在建立逻辑回归模型时会导致较高的计算复杂性的问题,研究利用赤池信息量准则改进LMT算法,提升算法时间性能,避免模型过度拟合。在UCI标准数据集和烟叶综合质量评价数据中应用改进的LMT算法进行建模验证,结果表明,该改进方法在模型精度和召回率方面基本优于其他决策树方法,时间性能比改进前提升50%左右,能较好地评价烟叶综合质量。 Logistic Model Trees （LMT） algorithm is a classification algorithm which is based on tree induction and logistic regression. To verify the advantage of LMT, compare and analyze LMT with other decision tree methods on three UCI data sets. Because in logistic model trees, logistic regression models can lead to the high computational complexity. This issue can be addressed by using the AIC criterion to improve LMT. It can improve time performance of algorithm and prevent over fitting models. The modification of LMT is used on UCI data sets and tobacco comprehensive quality evaluation data. And the result demonstrates that this method is superior to other decision tree methods in model precision and recall rate and time performance is about 50% faster than the unimproved. It can evaluate tobacco comprehensive quality well.

作者张艺梅丁香乾贺英王丽丽徐硕

机构地区中国海洋大学信息科学与工程学院中国海洋大学信息工程中心青岛大学自动化工程学院山东临沂烟草有限公司

出处《微型机与应用》 2014年第23期25-28,共4页 Microcomputer & Its Applications

基金青岛市科技计划项目(12-4-1-9-JX) 国家科技支撑计划项目(013BAH17F01)

关键词逻辑模型树 UCI标准数据集烟叶综合质量评价数据赤池信息量准则模型精度召回率 logistic model tree UCI data sets tobacco comprehensive quality evaluation data Akaike information criterion model precision recall rate

分类号 TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献11

1田苗苗.数据挖掘之决策树方法概述[J].长春大学学报,2004,14(6):48-51. 被引量：42
2PERLICH C,PROVOST F,SIMONOFF J S.Tree induction vs.logistic regression:a learning-curve analysis[J].The Journal of Machine Learning Research,2003,(4):211-255.
3LANDWEHR N,HALL M,FRANK E.Logistic model trees[J].Machine Learning,2005,59(1/2):161-205.
4FRIEDMAN J,HASTIE T,TIBSHIRANI R.Special invited paper.additive logistic regression:A statistical view of boosting[J].Annals of statistics,2000,28(2):337-374.
5BREIMAN L,FRIEDMAN H,OLSHEN J A.Classification and Regression Trees[M].New York:Wadsworth,1984.
6SUMNER M,FRANK E,HALL M.Speeding up logistic model tree induction[M].Knowledge Discovery in Databases:PKDD 2005,Springer Berlin Heidelberg,2005.
7富春枫,荀鹏程,赵杨,陈峰.logitboost及其在判别分析中的应用[J].中国卫生统计,2006,23(2):98-100. 被引量：11
8季桂树,陈沛玲,宋航.决策树分类算法研究综述[J].科技广场,2007(1):9-12. 被引量：38
9AKAIKE H.Information theory and an extension of the maximum likelihood principle[M].Breakthroughs in statistics,Springer New York,1992.
10De Ridder F,PINTELON R,SCHOUKENS J,et al.Modified AIC and MDL model selection criteria for short data records[J].Instrumentation and Measurement,IEEE Transactions on,2005,54(1):144-150.

二级参考文献14

1迟庆云.决策树分类算法及其应用[J].枣庄学院学报,2005,22(5):29-32. 被引量：9
2乔向杰,陈功平.数据挖掘中分类算法的可扩展性研究[J].信阳师范学院学报（自然科学版）,2006,19(2):239-242. 被引量：6
3Schapire RE.The Boosting Approach to Machine Learning An Overview.MSRI Workshop on Nonlinear Estimation and Classification,2002.
4Schapire RE.The strength of weak learnability.Machine Learning,1990,5(2):197-227.
5Freund Y,Schapire RE.A decision-theoretic generalization of on-line learning and an application to boosting.Journal of Computer and System Sciences,1997,55(1):119-139.
6Friedman JH,Trevor,Robert Tibshirani.Additive logistic regression:A statistical view of boosting.The Annals of Statistics,2000,38(2):337-374.
7King RD.The Stalog databases.fttp.strath.ac.uk(130.159.248.24).
8Quinlan JR.C4.5:Programs for Machine Learning.Morgan Kaufmann,1993.
9Drucker H,Schapire R,Simard P.Boosting performance in neural networks.International Journal of Pattern Recognition and Artificial Intelligence,1993,7(4):705-719.
10Dietterich TG.An experimental comparison of three methods for constructing ensembles of decision trees:Bagging,boosting,and randomization.Machine Learning,2000,40(2):139-158.

共引文献88

1文小燕,杜海若.数据挖掘的发展和应用综述[J].电脑知识与技术（过刊）,2007(18). 被引量：2
2张自宾,武文波,金卓.基于决策规则的遥感影像土地利用信息提取[J].测绘科学,2008,33(S1):200-202. 被引量：5
3胡智喜,唐学忠.基于信息增益法的决策树构造方法[J].计算机与现代化,2006(3):28-30. 被引量：10
4李冬梅,程成.基于决策树法的电力企业经营者年薪制的应用研究[J].华北电力大学学报（社会科学版）,2006(3):53-56.
5刘希宋,王辉坡.设备管理组织方式的决策树优化实证研究[J].科技进步与对策,2006,23(9):105-107. 被引量：2
6陈广,王强,陈景武.数据挖掘及其在医学上的应用[J].数理医药学杂志,2007,20(4):587-588. 被引量：2
7王强,陈广,陈景武.Logitboost法与累积比数Logit模型在判别分析中的应用分析[J].数理医药学杂志,2007,20(5):592-594.
8王静,夏结来,叶冬青.判别分析方法在医学应用中的进展[J].数理统计与管理,2008,27(2):369-376. 被引量：11
9田苗苗.基于决策树的文本分类研究[J].吉林师范大学学报（自然科学版）,2008,29(1):54-56. 被引量：9
10徐晓桃,韩涛,颉耀文.基于单时相MODIS数据的土地覆盖三种分类方法对比研究[J].干旱地区农业研究,2008,26(3):253-258. 被引量：9

同被引文献49

1何强,陆纪元,谈炎欢.多层螺旋CT扫描对B3型纵隔胸腺瘤诊断及术后复查的应用价值分析[J].中国CT和MRI杂志,2020,18(1):69-71. 被引量：11
2陈伏兵,陈秀宏,王文胜,杨静宇.人脸识别中PCA方法的推广[J].计算机工程与应用,2005,41(34):34-38. 被引量：9
3蒋盛益,李霞,郑琪.一种近似等频离散化方法[J].暨南大学学报（自然科学与医学版）,2009,30(1):31-34. 被引量：3
4廖振涛,曹显波,于永军.胸腺瘤合并重症肌无力的治疗[J].罕少疾病杂志,2010,17(6):28-29. 被引量：3
5刘勘,朱怀萍,刘秀芹.基于支持向量机的网络伪舆情识别研究[J].现代图书情报技术,2013(11):75-80. 被引量：12
6冯江平,张月,赵舒贞,陈虹.网络舆情评价指标体系的构建与应用[J].云南师范大学学报（哲学社会科学版）,2014,46(2):75-84. 被引量：20
7刘建伟,刘媛,罗雄麟.深度学习研究进展[J].计算机应用研究,2014,31(7):1921-1930. 被引量：287
8杨永军.社会舆情监测与预警的指标体系研究[J].现代传播（中国传媒大学学报）,2014,36(9):63-71. 被引量：9
9孙玲芳,周加波,林伟健,候志鲁,许锋.基于BP神经网络和遗传算法的网络舆情危机预警研究[J].情报杂志,2014,33(11):18-24. 被引量：59
10齐会娇,王英华,丁军,刘宏伟.基于多信息字典学习及稀疏表示的SAR目标识别[J].系统工程与电子技术,2015,37(6):1280-1287. 被引量：21

引证文献6

1彭健,阳小华.一种逻辑模型树算法在网络舆情中的谣言检测[J].南华大学学报（自然科学版）,2018,32(3):43-48. 被引量：2
2Long SUN,Tao WU,Guangcai SUN,Dazheng FENG,Lieshu TONG,Mengdao XING.Object Detection Research of SAR Image Using Improved Faster Region-Based Convolutional Neural Network[J].Journal of Geodesy and Geoinformation Science,2020,3(3):18-28. 被引量：13
3沈洪洲,史俊鹏,马巧慧.社会化问答社区回答内容质量影响特征研究--以“知乎”为例[J].情报杂志,2020,39(10):169-175. 被引量：9
4沈洪洲,居玥.社交媒体中应急救援信息分类的影响特征研究[J].智能计算机与应用,2023,13(7):19-26.
5马宽,邓超.考虑车辆交互信息的换道风格辨识[J].农业装备与车辆工程,2023,61(9):7-10.
6陈杰,洪悦,王艳.基于CT平扫影像组学特征在预测胸腺上皮性肿瘤WHO简化病理分型中的价值[J].中国CT和MRI杂志,2024,22(1):71-73.

二级引证文献24

1丁楠,曹玮倬,相甍甍.基于SBM-Malmquist的技术问答社区知识交流效率测度研究[J].知识管理论坛,2022(2):101-115.
2贾硕,张宁,沈洪洲.网络谣言传播与消解的研究进展[J].信息资源管理学报,2019,9(3):62-72. 被引量：13
3袁红,李佳.行动者网络视角下突发公共事件的谣言协同治理机制研究[J].现代情报,2019,39(12):109-120. 被引量：29
4汤寓麟,金绍华,边刚,张永厚,李凡.侧扫声呐识别沉船影像的迁移学习卷积神经网络法[J].测绘学报,2021,50(2):260-269. 被引量：5
5陈龙,刘坤华,周宝定,李清泉.多智能体协同高精地图构建关键技术研究[J].测绘学报,2021,50(11):1447-1456. 被引量：12
6邓晨,李宏伟,张斌,许智宾,肖志远.基于深度学习的语义SLAM关键帧图像处理[J].测绘学报,2021,50(11):1605-1616. 被引量：8
7Kexian WANG,Shunyi ZHENG,Rui LI,Li GUI.A Deep Double-Channel Dense Network for Hyperspectral Image Classifica-tion[J].Journal of Geodesy and Geoinformation Science,2021,4(4):46-62. 被引量：14
8王松,杨洋,刘新民.基于图注意力网络的开放式创新社区用户创意潜在价值发现研究[J].数据分析与知识发现,2021,5(11):89-101. 被引量：5
9张玉鑫,颜青松,邓非.高分辨率遥感影像建筑物提取多路径RSU网络法[J].测绘学报,2022,51(1):135-144. 被引量：8
10葛小三,陈曦,赵文智,李瑞祥.基于生成对抗网络的建筑物损毁检测[J].测绘学报,2022,51(2):238-247. 被引量：3

1敬朝阳,杨晓梅,王郗雨.基于稀疏与低秩的核磁共振图像重构算法[J].计算机应用研究,2015,32(3):942-945. 被引量：2
2蔡暐,李俊峰.基于MA模型的移动Ad Hoc网络路径长度预测[J].内蒙古师范大学学报（自然科学汉文版）,2015,44(4):533-537. 被引量：2
3王巧立,陈铁军.基于QPSO组合优化的发酵过程LS-SVM建模[J].计算机工程与设计,2011,32(1):285-288. 被引量：1
4秦宣云,卜英勇,夏毅敏.基于AIC准则优化的径向神经网络微地形曲面重构[J].中南大学学报（自然科学版）,2004,35(5):815-819. 被引量：13
5万波.基于混合核SVM的加速度传感器非线性动态建模[J].自动化与仪器仪表,2015(9):232-233 236.
6易云飞,盛康.基于时间序列分析的水位短期预测模型仿真[J].计算机工程与设计,2016,37(5):1331-1334. 被引量：6
7全卉,马利庄.基于生物电阻抗的人体内脏脂肪预测方法[J].浙江大学学报（工学版）,2011,45(2):301-305. 被引量：5
8张媛,邢宗义,高强,秦勇,贾利民.基于递阶遗传神经网络的某扫雷犁电液伺服系统建模研究[J].中国机械工程,2010,21(1):89-93. 被引量：1
9李剑,涂晓东.基于优先级的包插入队列调度算法仿真研究[J].现代电子技术,2008,31(2):107-109.
10杨福芹,冯海宽,李振海,高林,杨贵军,戴华阳.基于赤池信息量准则的冬小麦叶面积指数高光谱估测[J].农业工程学报,2016,32(3):163-168. 被引量：20

微型机与应用

2014年第23期

浏览历史

内容加载中请稍等...

逻辑模型树算法性能分析与改进研究被引量：6

参考文献11

二级参考文献14

共引文献88

同被引文献49

引证文献6

二级引证文献24

相关作者

相关机构

相关主题

浏览历史

逻辑模型树算法性能分析与改进研究 被引量：6

参考文献11

二级参考文献14

共引文献88

同被引文献49

引证文献6

二级引证文献24

相关作者

相关机构

相关主题

浏览历史

逻辑模型树算法性能分析与改进研究被引量：6