裁剪和元分类器在分布式数据挖掘中的应用被引量：1

APPLYING PRUNING AND META-CLASSIFIER IN DISTRIBUTED DATA MINING

下载PDF

导出

摘要数据经常分布在不同的地方,需要的机器资源也随着数据量的增长按比例增长,但数据的增长往往快于机器资源和机器学习上的改进。描述了元学习的基本过程和几种组合元分类器的度量尺度。元学习能够改进可观测性和精度,但同时过度强大的元学习技术也会导致冗余,低效甚至不精确的元分类器层次。分析这些方法的局限性并且提出了基于相异性的裁剪算法,证实了元学习和相关的裁剪方法的组合能取得相似的甚至更好的表现。 Along with the data expansion, machine resources required are increased in proportion due to the distribution of the data always in everywhere, but the amounts of data will likely grow in size faster than available improvements in machine resources and in machine learning. In this paper it describes the fundamental procedure of the recta-learning and the measurement scales of some component recta-classifiers. Observability and accuracy can be improved by meta- learning, but brute force meta-learuing techniques can result in large,redundant,inefficient and inaccurate meta-classifier hierarchies. A pruning ＇algorithm on dissimilarity basis is presented after analyzing the limitation of these methods,and the combination of pruning algorithm and recta-classifiers demonstrate that they could obtain similar or even better performance.

作者王士根谢康林

机构地区上海交通大学计算机科学与工程系

出处《计算机应用与软件》 CSCD 北大核心 2008年第8期138-140,共3页 Computer Applications and Software

关键词机器学习元学习基础学习者裁剪算法 Machine learning Meta learning Base learner Pruning algorithm

分类号 TP391.41 [自动化与计算机技术—计算机应用技术] TP311.13 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献5

1Elkan C. Boosting and naive Bayesian learning. [ http://www. cse. ucsd. edu/-elkan/papers/bnb. ps ]. Dep/ of Computer Science, Univ. of California, San Diego, CA. 2001.
2S Stolfo, W Lee, W Fan. JAM : Java agents for meta-learning over distributed database. 2003 : 74 - 81.
3S Stolfo, W Lee.W Fan. Credit Card fraud detection using meta-learning : Issues and initial results ,2001.
4TEMA :The Evolutionary. Meta-learning Agent. [ http ://www. it. usyd. edu. au/- netsys/research/current_tema.htm ]. 2004.
5JW Han,M Kamber.数据挖掘概念和技术[M].北京:机械工业出版社,2001.

同被引文献2

1王伟辉,耿国华,陈莉.数据挖掘技术在保险业务中的应用[J].计算机应用与软件,2008,25(3):123-125. 被引量：13
2吉根林,孙志挥.基于数据挖掘技术的保险业务风险分析[J].计算机工程,2002,28(2):239-240. 被引量：16

引证文献1

1李瑶.数据挖掘技术在交通事故分析中的应用[J].电子设计工程,2009,17(2):77-78. 被引量：3

二级引证文献3

1劳飞.数据挖掘技术在交通事故分析中的应用[J].山东交通科技,2010(5):73-74.
2贾熹滨,叶颖婕,陈军成.基于关联规则的交通事故影响因素的挖掘[J].计算机科学,2018,45(B06):447-452. 被引量：17
3马庚华,郑长江,邓评心,李锐.关联规则挖掘在道路交通事故分析中的应用[J].西华大学学报（自然科学版）,2019,38(3):93-97. 被引量：6

1王春花,黄厚宽.利用抽样技术分布式开采可变精度的关联规则[J].计算机研究与发展,2000,37(9):1101-1106. 被引量：12
2张继福,郑链,史虹,姚淑萍.基于元学习技术的分布式采掘关联规则研究[J].系统仿真学报,2004,16(4):696-699. 被引量：3
3琚春华,倪栋君.基于元学习的分布式挖掘频繁闭合模式算法研究[J].计算机应用研究,2009,26(1):41-43. 被引量：1
4赵博,檀晓红.基于语音识别技术的英语口语教学系统[J].计算机应用,2009,29(3):761-763. 被引量：10
5Taghi M.Khoshgoftaar,Pierre Rebours.Improving Software Quality Prediction by Noise Filtering Techniques[J].Journal of Computer Science & Technology,2007,22(3):387-396. 被引量：2
6Ling YU Tiejun WU.Boosting the partial least square algorithm for regression modelling[J].控制理论与应用（英文版）,2006,4(3):257-260.
7杨小虎,李珏峰.多网络环境下基于爬山聚类算法的SOA性能优化[J].浙江大学学报（工学版）,2010,44(4):738-742. 被引量：2
8吴宇,习勇,雍婷.一种高吞吐量的IEEE 802．11 Mesh网AP选择算法[J].计算机科学,2007,34(9):23-26.
9卢向澄,郑磊,刘椿年.分布式并行约束归纳逻辑程序设计研究[J].计算机应用研究,2005,22(9):34-36. 被引量：1
10Albert H.Segars,张云军.信息系统研究中的尺度设计——一个实现一维性评价的范例[J].中国教育信息化（高教职教）,1995,0(2):2-10.

计算机应用与软件

2008年第8期

浏览历史

内容加载中请稍等...

裁剪和元分类器在分布式数据挖掘中的应用被引量：1

参考文献5

同被引文献2

引证文献1

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

裁剪和元分类器在分布式数据挖掘中的应用 被引量：1

参考文献5

同被引文献2

引证文献1

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

裁剪和元分类器在分布式数据挖掘中的应用被引量：1