基于连续属性分类规则挖掘的新算法研究被引量：1

New Algorithms of Mining Classification Rules in the Database on Continuous Valued Attributes

下载PDF

导出

摘要分析了针对连续属性样本进行数据挖掘的缺陷,提出一种直接对连续属性样本进行分类规则挖掘的算法。它基于样本属性值分割点对实例样本进行分类,把分割点对实例样本的分类能力作为分割点选择的依据,将所有相容样本划分为分类属性值相同的子集作为停机条件,实现连续属性样本分类规则挖掘的完全自动化。它考虑到数据挖掘的目标和要求,充分利用属性与类间的依赖性、属性间的互补性,达到样本分割点数少、分类规则简单和属性约减的目的。最后通过实例进行了验证,并与C4.5算法进行了比较。 The paper analyses the shortcoming in new classification rules mining about continuous valued attributes, and proposes a new algorithms dealing with continuous valued attributes mining. It mines classification rules, by the way of judging the splitting point in classifying, selecting the best one to classify, when the class label of all subclass in consistent samples are sameness, then end. The algorithm considers the aim and demand of data mining, makes the most of the interdependence between class labels and attributes, among the attributes, in the interest of minimizing the number of splitting point, simplifying classification rules, reducing the number of features. Finally, the algorithm is validated by an example, compared with C4.5.

作者厍向阳薛惠锋

机构地区西北工业大学自动化学院

出处《计算机工程》 EI CAS CSCD 北大核心 2005年第18期28-30,共3页 Computer Engineering

基金陕西省自然科学基金资助项目(200104-G15)

关键词连续属性数据挖掘分类规则新算法 Continuous valued attributes Data mining Classification rules New algorithms

分类号 TP393 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献5

1HanJiawei MichelineKambe.数据挖掘概念与技术[M].北京：机械工业出版社,2001..
2Tay F E F, Shen Lixiang. A Modified Chi2 Algorithm for Disc-retization[J].IEEETransactions on Knowledge and Data Engineer-ing, 2002, 14(3)
3Kohavi R, Sahanu M. Error-based and Entropy-based Discretization of Continuous Features[C]. In: Proc. of the 2^nd International Conference on Knowledge Discovery and Data Mining, Portland, Oregon: AAAI Press, 1996-08: 114-119
4Kontkanen P, Myllymaki P, Silander T, et al. A Bayesian App-roach to Discrimination[C].In: Proceedings of the European Sym-posium on Intelligent Techniques, Bari, Italy, 1997: 265
5Quinlan T R. C4.5: Programs for Machine Learning[M]. San Mateo: Morgan Kaufamann, 1993

共引文献148

1马建红,王万森.基于数据仓库的保险管理系统的设计与实现[J].微机发展,2004,14(7):55-58. 被引量：9
2赵欢,谭华.Apriori算法在语音合成应用中的一种改进[J].湖南大学学报（自然科学版）,2004,31(5):94-98. 被引量：2
3罗可,林睦纲,郗东妹.数据挖掘中分类算法综述[J].计算机工程,2005,31(1):3-5. 被引量：62
4彭佳红,贺志勇,林雪梅.一种基于数据挖掘的混合生产过程质量控制方法[J].计算机工程与设计,2004,25(10):1692-1694. 被引量：2
5耿焕同,陈少军.一种基于传统VSM和词共现概念的中文文本聚类的研究[J].安徽师范大学学报（自然科学版）,2005,28(1):27-30. 被引量：2
6李林,崔志明.用户Web日志序列模式挖掘研究[J].微机发展,2005,15(5):119-121. 被引量：4
7李瑞,邱玉辉.基于离散点的蚁群聚类算法的研究[J].计算机科学,2005,32(6):111-113. 被引量：4
8常志玲,周庆敏,杨清莲.基于粗糙集理论的决策树构造算法[J].南京工业大学学报（自然科学版）,2005,27(4):80-83. 被引量：9
9桂现才,彭宏.原关联规则及其应用[J].微机发展,2005,15(10):35-38.
10厍向阳,薛惠锋,高新波.基于障碍物约束的遗传-中心点聚类算法研究[J].系统工程与电子技术,2005,27(10):1803-1806. 被引量：2

同被引文献6

1周强,欧阳一鸣,胡学钢,王浩.数据挖掘中应用偏最小二乘法发现异常值[J].微电子学与计算机,2005,22(1):25-27. 被引量：17
2于冰,阎保平.关于粗糙集属性约简的进化算法研究和应用[J].微电子学与计算机,2005,22(3):189-194. 被引量：12
3潘笑,万敏.基于模糊神经网络的数据挖掘方法研究[J].微电子学与计算机,2005,22(12):48-50. 被引量：5
4谢娟英,刘芳,冯德民.基于GA与RST的分类规则挖掘算法[J].计算机科学,2006,33(11):149-150. 被引量：3
5Zdzis?aw Pawlak. Rough sets[J] 1982,International Journal of Computer & Information Sciences(5):341～356
6何亚群,胡寿松.粗糙集中连续属性离散化的一种新方法[J].南京航空航天大学学报,2003,35(2):212-215. 被引量：21

引证文献1

1谢竹诚,周永权.一种基于AFSA与RST分类规则挖掘算法[J].微电子学与计算机,2009,26(3):182-184. 被引量：2

二级引证文献2

1李军民,李立博.人工鱼群和蒙特卡罗混合算法的应用[J].西安科技大学学报,2014,34(2):224-227. 被引量：1
2冯国明,郭承军,叶晶晶.基于万有引力搜索算法改进的人工鱼群算法[J].数学学习与研究,2016,0(1):144-146. 被引量：1

1谌德荣,宫久路,陈乾,曹旭平.基于样本分割的快速高光谱图像异常检测支持向量数据描述方法[J].兵工学报,2008,29(9):1049-1053. 被引量：6
2毛盾,邢昌风,黎铁冰,黄傲林.基于图的半监督目标跟踪[J].系统工程与电子技术,2016,38(2):450-456. 被引量：1
3周爱民,曹宏庆,康立山,黄玉珍.用遗传程序设计实现复杂函数的自动建模[J].系统仿真学报,2003,15(6):797-799. 被引量：31
4李丽芳,周鸣争.一种基于构造性核覆盖的聚类算法[J].计算机技术与发展,2009,19(1):88-91. 被引量：1
5吴亮,王智灵,陈宗海,罗杨宇,李成荣.一种新的基于椭圆模型的鲁棒估计方法[J].数据采集与处理,2010,25(3):407-412. 被引量：1
6许少华,宋美玲,许辰,朱新宁.一种基于混合误差梯度下降算法的过程神经网络训练[J].东北石油大学学报,2014,38(4):92-96. 被引量：10
7王元珍,王健,李晨阳.一种改进的模糊聚类算法[J].华中科技大学学报（自然科学版）,2005,33(2):92-94. 被引量：18
8霍玉丹,谷琼,蔡之华,袁磊.基于遗传算法改进的少数类样本合成过采样技术的非平衡数据集分类算法[J].计算机应用,2015,35(1):121-124. 被引量：17
9周頔,孙俊,盛歆漪.使用新混合模糊聚类算法的模糊系统建模方法[J].计算机工程与应用,2014,50(12):16-20.
10李昕,颜学峰.基于SOM-PCA-RVM的过程建模及其应用[J].石油化工高等学校学报,2009,22(4):89-94. 被引量：1

计算机工程

2005年第18期

浏览历史

内容加载中请稍等...

基于连续属性分类规则挖掘的新算法研究被引量：1

参考文献5

共引文献148

同被引文献6

引证文献1

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

基于连续属性分类规则挖掘的新算法研究 被引量：1

参考文献5

共引文献148

同被引文献6

引证文献1

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

基于连续属性分类规则挖掘的新算法研究被引量：1