一种基于SQL语句的ID3改进算法

An Improved ID3 Algorithm Based on SQL Statement

下载PDF

导出

摘要 ID3算法沿用的是机器学习算法,与数据库集成性差。提出一种基于SQL语句的ID3改进算法。通过SQL语句直接对保存在数据库中的数据表进行分组查询,计算测试属性的条件熵,并给出深度优先和广度优先生成子树的递归算法。实验证明,改进的ID3算法充分利用了SQL的高效性和C++语言的灵活性,降低了算法实现难度,高效实现大量数据的分类。 ID3 algorithm was inherited from machine learning, and has a poor integration with database. A new implementation of ID3 algorithm based on SQL was given, calculation of the test attribute condition entropy by send- ing SQL statements directly to the data table saved in the database for grouping query. And the depth-first and breadth-first spanning tree recursive algorithm were also given. Experiments show that the improved ID3 algorithm makes full use of the high efficiency of SQL and C ＋＋ language＇ s flexibility, reduces the difficulty of the algorithm＇ s implementation, classifies the large amounts of data efficiently.

作者赵卫绩刘井莲

机构地区绥化学院计算机学院

出处《科学技术与工程》北大核心 2012年第34期9370-9373,共4页 Science Technology and Engineering

基金绥化学院科学技术项目(KQ1201003)资助

关键词 ID3 决策树信息熵 SQL语句 ID3 decision tree information entropySQL statement

分类号 TP181 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献5

1王英,刘维亭.决策树算法在电网报警信息处理中的应用[J].科学技术与工程,2011,11(30):7375-7378. 被引量：3
2宋晖,张良均.C4.5决策树法在空气质量评价中的应用[J].科学技术与工程,2011,11(20):4848-4850. 被引量：6
3丁胜祥,董增川,张莉.基于决策树算法的洪水预报模型[J].水力发电,2011,37(7):8-11. 被引量：6
4杨一展,李小平,段霞霞.一种基于数据库查询的改进的决策树算法[J].计算机工程与应用,2008,44(15):148-150. 被引量：4
5[2]史忠植.知识发现[M].北京:清华大学出版社,2005.

二级参考文献17

1乔梅,韩文秀.基于Rough集和数据库技术的属性约简算法[J].计算机工程,2005,31(6):18-19. 被引量：9
2赵华,宋顺林.改进的决策树算法在潜在客户获取中的应用[J].计算机工程与应用,2005,41(11):196-198. 被引量：3
3Han Jiawei,Kamber M.Data mining:concepts and techniques[M]. USA : Morgan Kaufmann Publishers, 2000.
4Quirdan J R.Induction of decision trees[J].Machine Learning, 1986, (4):81-106.
5UCI Machine Learning[EB/OL].(2007).http://mlearn.ics.uci.edu/ML- Repository.html.
6Wu Sen,Wu Ling-yu,Long Yu,et al.Improved classification algorithm by minsup and minconf based on ID3[C]//International Conference on Management Science and Engineering,ICMSE'06,2006:135-139.
7Jearanaitanakij K.Classifying continuous data set by ID3 algorithm[C]// Proc of Fifth International Conference on Information,Communications and Signal,2005:1048-1051.
8Han J W, Kamber M. Data mining: concepts and techniques [M]. San Francisco: Morgan Kaufmann Publishers, 2001.
9Solomatine D P. Applications of data-driven modeling and machine learning in control of water resources [J ]. Computational intelligence in control, 2002: 197-217.
10The machine learning laboratory of university of Massachusetts Am- herst, http ://www. cs. umass, edu/- lm/iti/dtree-hackgrouad, html.

共引文献15

1王乐乐.决策树在网上销售中的挖掘研究[J].长春大学学报,2009,19(4):33-35. 被引量：1
2谢妞妞,刘於勋.决策树属性选择标准的改进[J].计算机工程与应用,2010,46(34):115-118. 被引量：12
3马伟杰.C4.5决策树法在高校奖学金评定中的应用[J].河南工程学院学报（自然科学版）,2012,24(2):57-60. 被引量：10
4马伟杰.C4.5决策树法在网络课程知识点个性化设计中的应用[J].河南广播电视大学学报,2012,25(3):108-110.
5王文宜.数据库检索算法研究[J].计算机光盘软件与应用,2013,16(14):304-304.
6王力,张冰洁.基于改进粗糙集的机场智能电网报警处理方法[J].中国民航大学学报,2015,33(1):36-40.
7梁琨,丁冬,彭增起,沈明霞,林盛业,曹辉.基于决策树雪花牛肉大理石花纹分级模型[J].食品科学,2015,36(17):65-70. 被引量：3
8张晗,马建红.基于图像处理的空气污染程度判断模型仿真[J].计算机仿真,2016,33(2):452-455. 被引量：2
9徐旭冉,涂娟娟.基于决策树算法的空气质量预测系统[J].电子设计工程,2019,27(9):39-42. 被引量：12
10石庆安,李意,罗天文,王茂洋,赵朝彬,张健源.平寨水库年最大洪峰流量预报模型研究[J].水力发电,2021,47(11):1-3. 被引量：1

1王艳兵,赵锐,姚青.基于可变精度的ID3改进算法[J].计算机工程与设计,2006,27(14):2683-2685. 被引量：9
2叶福兰.ID3改进算法的研究[J].廊坊师范学院学报（自然科学版）,2011,11(3):23-25. 被引量：1
3刘琴.基于计算机取证的ID3改进算法[J].通信技术,2008,41(8):57-59. 被引量：4
4邹永贵,范程华.基于属性重要度的ID3改进算法[J].计算机应用,2008,28(B06):144-145. 被引量：11
5喻金平,黄细妹,李康顺.基于一种新的属性选择标准的ID3改进算法[J].计算机应用研究,2012,29(8):2895-2898. 被引量：11
6肖海蓉.SQL中分组查询的设计与应用[J].计算机与数字工程,2009,37(5):85-87. 被引量：2
7陶荣,张永胜,杜宏保.基于粗集论中属性依赖度的ID3改进算法[J].河南科技大学学报（自然科学版）,2010,31(1):42-45. 被引量：7
8董跃华,刘力.基于权衡因子的决策树优化算法[J].江西理工大学学报,2015,36(5):90-97.
9胡美春,田大钢.基于修正参数简化标准的ID3改进算法[J].计算机与数字工程,2015,43(7):1182-1186. 被引量：2
10王书海,刘明生,马银华,李金英.基于多表连接的分组查询语句的性能分析与优化[J].计算机工程,2000,26(7):185-187. 被引量：8

科学技术与工程

2012年第34期

浏览历史

内容加载中请稍等...

一种基于SQL语句的ID3改进算法

参考文献5

二级参考文献17

共引文献15

相关作者

相关机构

相关主题

浏览历史