引入宽度优先扩展概念的多样性数据分类过程

Introduction of Breadth-First Extension of the Concept of Diversity Data Classification Process

下载PDF

导出

摘要随着信息技术的迅猛发展,大型数据库中的数据正在呈几何级数增长,冗余分类技术已经成为信息组织的重要手段。在总结归纳已有的冗余分类算法弊端的基础上,参考决策树算法提出了一种新的基于数据库抽样的海量数据冗余分类算法。算法引入宽度优先扩展思路,并给出了算法的基本思想和具体实现过程,探讨了并行环境下进行计算的优化步骤。在与SPRINT算法的比较实验中,新算法展现了良好的性能和分类效率。 With the rapid development of information technology, large-scale data in the database is growing exponentially. Redundancy classification technology has become an important means of information organization. In summarizing the four existing redundant classification algorithm based on the reference paper proposes a new decision tree algorithm based on sampling of massive database data redundancy classification algorithms, and describes the basic idea of the algorithm and implementation steps to explore parallel computing environment optimized. SPRINT algorithm with the comparative experiments, the new algorithm is to show a good performance and classification efficiency.

作者何一辉向俊

机构地区广西广播电视大学

出处《科技通报》北大核心 2013年第10期168-170,共3页 Bulletin of Science and Technology

基金广西教育厅科研项目(201106LX864)

关键词大型数据库海量数据冗余分类分类方法抽样 large database massive data redundant classification classification calculations

分类号 TP123 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献4

1林淑玲,李存.硬盘数据恢复的研究[J].科技通报,2012,28(10):85-87. 被引量：6
2蒋望东,林士敏.基于贝叶斯网络工具箱的贝叶斯学习和推理[J].信息技术,2007,31(2):5-8. 被引量：24
3周牒岚,陈琳,向华.数据挖掘算法研究[J].现代电子技术,2011,34(20):75-78. 被引量：8
4刘红岩,陆宏钧.利用数据库技术实现可扩展分类算法[J].软坤学报,2002(6) :55-59.

二级参考文献18

1程泽凯,林士敏,陆玉昌,蒋望东,陆小艺.基于Matlab的贝叶斯分类器实验平台MBNC[J].复旦学报（自然科学版）,2004,43(5):729-732. 被引量：27
2魏红宁.决策树剪枝方法的比较[J].西南交通大学学报,2005,40(1):44-48. 被引量：42
3叶进,林士敏.基于贝叶斯网络的推理在移动客户流失分析中的应用[J].计算机应用,2005,25(3):673-675. 被引量：12
4毕建欣,张岐山.关联规则挖掘算法综述[J].中国工程科学,2005,7(4):88-94. 被引量：51
5宋英姿,李庆武,王晓玲,倪雪.球坐标系下小波收缩去噪方法的改进[J].河海大学常州分校学报,2007,21(1):1-3. 被引量：14
6TAN Pang-ning, STEINBACH M, KUMAR V. Introduc- tionto Data Mining [ M ]. [ S. l.]: Posts &Telecom Press,2006.
7MAULIK U, BANDYOPADHYAY S. Genetic algorithm- based clustering technique[J]. Pattern Recognition, 1997, 30(7) : 50-60.
8BNT软件包[EB／OL]．http：／／bnt．sourceforge．net／
9Friedman N,Goldszmidt M.Building classifiers using Bayesian Network[C]//Proceedings AAAI-96,Thirteenth National Conference on Artificial Intelligence,1996:1227-1284.
10Friedman N.Bayesian network classifiers[J].Machine Learning,1997(29):131-163.

共引文献35

1张跃宏,刘平,张琴,王磊,孙继佳,严广乐,苏式兵.基于粗糙集与广义关联度系数的贝叶斯中医证候分类模型[J].统计与决策,2008,24(12):159-161. 被引量：9
2许建盈.Google关键词广告竞价的收益率预测[J].科学技术与工程,2008,8(14):3868-3871. 被引量：4
3周海刚,沈怀荣.基于知识的贝叶斯诊断网络模型建造方法[J].飞机设计,2009,29(2):41-45.
4卢文喜,罗建男,龚磊,辛欣.基于贝叶斯网络的地下水环境系统决策管理研究[J].地学前缘,2010,17(6):247-254. 被引量：2
5卢文喜,罗建男,鲍新华.贝叶斯网络在水资源管理中的应用[J].吉林大学学报（地球科学版）,2011,41(1):153-158. 被引量：11
6陈尤莺,郑之,孔祥增,张胜元.基于贝叶斯分类器的结肠癌数据分类[J].广西师范大学学报（自然科学版）,2011,29(3):187-191. 被引量：2
7马祖军,谢自莉.基于贝叶斯网络的城市地震次生灾害演化机理分析[J].灾害学,2012,27(4):1-5. 被引量：19
8邵必林,王颖,林森.基于贝叶斯网络的工期隐性成本影响因素研究[J].会计之友,2013(4):34-37. 被引量：2
9许燕.数据挖掘技术在信息安全证据处理中的应用[J].物联网技术,2013,3(2):46-48.
10刘洋洋.硬盘数据恢复技术探究[J].信息网络安全,2013(2):70-72. 被引量：5

1党杨阳.XML信息检索技术综述[J].甘肃科技,2011,27(19):40-42.
2李灵杰,黄正东,王光华.搭建高速网络系统平台加速医院数字化建设步伐[J].医疗设备信息,2004,19(5):23-25. 被引量：12
3柳春锋,王仲杰,张雁平.基于EWB的电子线路优化设计[J].齐齐哈尔大学学报（自然科学版）,2003,19(2):59-61. 被引量：1
4请叫我达文西.随心所欲操控显卡[J].计算机应用文摘,2007(04S):98-98.
5熊妍,罗泽,苏锦河,阎保平.生物多样性数据的Web可视化[J].科研信息化技术与应用,2015,6(3):35-42. 被引量：3
6寿能,赵逢禹.基于NRefactory的冗余检测与缺陷研究[J].小型微型计算机系统,2015,36(9):1973-1976. 被引量：3
7赵雪,陈龙飞.基于MapReduce的ROCK聚类算法[J].河北科技师范学院学报,2014,28(1):26-32. 被引量：1
8刘宁静,李月龙,武继刚.最短路径段优先扩展的容错重构算法[J].小型微型计算机系统,2017,38(3):540-547. 被引量：1
9徐超,张东站,郑艳红,饶丽丽.基于查询集空间分布的聚合最近邻查询算法[J].计算机应用,2011,31(9):2402-2404. 被引量：2
10乔维德.改进遗传算法及模糊神经网络在交流伺服系统中的应用研究[J].电气传动自动化,2008,30(2):27-30. 被引量：2

科技通报

2013年第10期

浏览历史

内容加载中请稍等...

引入宽度优先扩展概念的多样性数据分类过程

参考文献4

二级参考文献18

共引文献35

相关作者

相关机构

相关主题

浏览历史