基于粗集理论的数据离散化新算法被引量：27

New Algorithms for Data Discretization Based on Rough Set Theory

下载PDF

导出

摘要连续属性值的离散化一直是机器学习领域中殛待解决的关键问题之一 ,他对于提高后继学习算法的运行速度、降低算法的实际空间要求和时间消耗、提高学习结果的聚类能力等都具有极其重要的意义。本文首先分析了基于粗集模型的数据离散化方法的特点和基本思路 ,研究了候选断点重要性的衡量方式 ,在此基础上提出两种新的从候选集合中最终确定离散化断点的启发式算法。这两种算法考虑并体现了粗集理论的基本特点和优点 ,选择的断点都能够保证信息系统的分辨关系 ,并能够取得较理想的离散化结果。 The discretization of real values is always one of the key problems to be solved in the domain of machine learning for its great contribution to speeding up the followed learning algorithms, cutting down the real demand of algorithms on running space and time, and improving the clustering capability of the ultimate learning results. The basic characteristics and framework of discretization approaches based on rough set model are analyzed at first, then the different measurements of the importance of candidate cuts are discussed and researched. Two new heuristic algorithms are put forward to finally select the useful cuts from a candidate set. The selected cuts of the two algorithms will adequately maintain the discernible relation of information systems for their full considering the specialty of rough set, which perfectly embodies the advantages of this theory. Moreover, excellent discretization results may be expected through these heuristic algorithms.

作者赵军王国胤吴中福李华

机构地区重庆大学计算机学院重庆邮电学院计算机科学与技术研究所重庆邮电学院计算机科学与技术研究所

出处《重庆大学学报（自然科学版）》 EI CAS CSCD 北大核心 2002年第3期18-21,共4页 Journal of Chongqing University

基金国家自然科学基金 (6980 3 0 14 ) 攀登特别支持费重庆市科委攻关基金资助

关键词粗集理论数据离散化算法分辨关系断点数据挖掘决策系统 rough set discernible relationship discretization, cut

分类号 TP18 [自动化与计算机技术—控制理论与控制工程] C934 [经济管理—管理学]

引文网络
相关文献

参考文献3

1黄黄麟.粗集理论及其应用--关于数据推理的新方法（修订版）[M].重庆:重庆大学出版社,1998..
2权光日,刘文远,叶风,陈晓鹏.连续属性空间上的规则学习算法[J].软件学报,1999,10(11):1225-1232. 被引量：6
3侯利娟,王国胤,聂能,吴渝.粗糙集理论中的离散化问题[J].计算机科学,2000,27(12):89-94. 被引量：104

二级参考文献14

1赵美德,李星原,洪家荣,陈彬.示例学习的广义扩张矩阵算法及其实现[J].计算机学报,1994,17(9):703-707. 被引量：11
2陈彬,洪家荣.示例学习的最大复合问题及算法[J].计算机学报,1997,20(2):139-144. 被引量：9
3曾黄麟.粗集理论及其应用－关于数据推理的新方法（修订版）[M].重庆:重庆大学出版社,1998.83-87.
4权光日.基于规划学习的神经网络研究（博士学位论文）[M].哈尔滨工业大学,1998..
5极光自，软件学报，1998年，9卷，2期，156页
6权光日，博士学位论文，1998年
7Chen Bin，J Comput Sci Technol，1997年，12卷，2期，123页
8杨叔子，基于知识的诊断推理，1993年，120页
9Wu X D，Sci China A，1992年，35卷，3期，363页
10洪家荣，计算机学报，1991年，14卷，6期，37页

共引文献106

1高赟,侯媛彬.改进贪心算法的完善与应用[J].仪器仪表学报,2004,25(z1):727-729. 被引量：3
2唐勇,王益群,姜万录.建造液压伺服系统故障诊断的粗糙集神经网络知识库[J].中国工程机械学报,2004,2(2):221-224.
3刘娟,唐玄.基于粗糙集的计算机文化基础课程成绩分析[J].商丘师范学院学报,2013,29(12):72-74.
4张绍杰,胡寿松,刘春生.基于粗糙集的多层容错神经网络故障诊断[J].计算机测量与控制,2004,12(6):507-509.
5巩建闽,王国胜,萧蓓蕾.保持分类能力不变的一种连续属性离散化方法[J].曲阜师范大学学报（自然科学版）,2005,31(1):95-99. 被引量：2
6钱峰,张蕾,赵姝.基于粗糙集的交叉覆盖算法[J].铜陵学院学报,2004,3(4):70-71.
7徐久成,沈钧毅,安秋生,李乃乾.基于信息粒度与粗糙集的决策细化研究[J].西安交通大学学报,2005,39(4):335-338. 被引量：3
8袁兵,江丽,朱宏辉.基于粗糙集理论的模糊控制规则的获取方法[J].武汉理工大学学报（交通科学与工程版）,2005,29(3):453-455. 被引量：10
9谢宏,程浩忠,牛东晓.基于信息熵的粗糙集连续属性离散化算法[J].计算机学报,2005,28(9):1570-1574. 被引量：134
10黄海,王国胤,吴渝.一种不完备信息系统的直接约简方法[J].小型微型计算机系统,2005,26(10):1761-1765. 被引量：23

同被引文献160

1赖积保,王慧强,朱亮.网络安全态势感知模型研究[J].计算机研究与发展,2006,43(z2):456-460. 被引量：12
2高赟,侯媛彬.改进贪心算法的完善与应用[J].仪器仪表学报,2004,25(z1):727-729. 被引量：3
3曾婧,李训铭.基于神经网络的油田故障诊断优化[J].控制工程,2009,16(S3):111-113. 被引量：8
4吴山产,毛锋,王文渊,卓晴.基于粗糙集的两种离散化算法的研究[J].计算机工程与应用,2004,40(26):68-69. 被引量：12
5唐南奇,潭明军.基于人工神经网络的农用地分等研究 Ⅱ.前置数据优化处理[J].福建农林大学学报（自然科学版）,2004,33(4):512-516. 被引量：4
6贺跃,郑建军,朱蕾.一种基于熵的连续属性离散化算法[J].计算机应用,2005,25(3):637-638. 被引量：15
7徐如燕,鲁汉榕,郭齐胜.基于信息论的连续属性离散化[J].空军雷达学院学报,2001,15(2):20-23. 被引量：2
8张葛祥,金炜东,胡来招.粗集理论中连续属性的广义离散化[J].控制与决策,2005,20(4):372-376. 被引量：6
9雷鹏,顾冲时.基于粗集推理的大坝安全监测预报模型研究[J].河海大学学报（自然科学版）,2005,33(4):391-394. 被引量：4
10林仁炳,王基一.连续属性离散化算法的时间复杂性分析[J].计算机与现代化,2005(9):40-42. 被引量：3

引证文献27

1周海淞,朱茵,陆化普.支撑交通管理综合信息平台的信息挖掘模型[J].交通运输工程与信息学报,2005,3(2):27-33. 被引量：2
2黎东英,王应明.基于精集理论的决策系统简化方法[J].计算机测量与控制,2005,13(7):707-709. 被引量：4
3林仁炳,王基一.连续属性离散化算法的时间复杂性分析[J].计算机与现代化,2005(9):40-42. 被引量：3
4Zarar Siddiqi.使用JMX和J2SE5.0安全管理Web应用程序[J].程序员,2006(1):111-114.
5曾建武,张建明,王树青.基于人工鱼群算法的离散化方法[J].模式识别与人工智能,2006,19(5):611-616. 被引量：7
6赵军,张显跃.基于粗集理论的数据离散化技术研究[J].重庆邮电学院学报（自然科学版）,2006,18(6):752-757. 被引量：14
7刘业政,焦宁,姜元春.连续属性离散化算法比较研究[J].计算机应用研究,2007,24(9):28-30. 被引量：20
8刘凌霞.基于粗糙集理论属性重要性的离散化算法[J].广西轻工业,2007,23(10):75-76. 被引量：9
9梁燕飞,何汉武,郑德涛,陈新.基于可变精度粗糙集的驾驶员多源信息融合研究[J].计算机工程与应用,2008,44(10):192-194. 被引量：3
10秦川,黄欢,施化吉,李星毅.基于区分矩阵的数据离散化算法[J].计算机工程与应用,2008,44(35):148-150. 被引量：3

二级引证文献125

1SHI YuZhi & ZHOU HuiCheng Faculty of Infrastructure Engineering,Dalian University of Technology,Dalian 116024,China.Research on monthly flow uncertain reasoning model based on cloud theory[J].Science China(Technological Sciences),2010,53(9):2408-2413. 被引量：8
2张建一,徐颖,陈飞.基于粗集理论的工业制冷装置运行参数分析[J].化工学报,2008,59(S2):176-180. 被引量：2
3鄂旭,高学东,谢霖铨,贺海钧.粗糙集中一种连续属性预处理方法[J].辽宁工程技术大学学报（自然科学版）,2005,24(3):400-403. 被引量：3
4于锟,刘知贵,黄正良.粗糙集理论应用中的离散化方法综述[J].西南科技大学学报,2005,20(4):32-36. 被引量：19
5朱小飞,卓丽霞,彭建华.一种基于分布特征的连续属性离散化方法[J].西南师范大学学报（自然科学版）,2006,31(2):107-110. 被引量：1
6林毓宁,冼太生,桂现才.基于条件信息量的决策表连续属性离散化算法[J].洛阳师范学院学报,2006,25(2):14-16.
7石红.一种基于粗糙集的离散化算法[J].模式识别与人工智能,2006,19(3):412-416. 被引量：3
8王璿,高社生,赵霞.基于粗糙集理论的模糊神经网络构造方法[J].计算机测量与控制,2006,14(6):782-784. 被引量：6
9鄂旭,高学东,邵良杉,叶柏青.一种不完备信息表的预处理方法[J].北京科技大学学报,2006,28(9):902-906. 被引量：3
10赵军,张显跃.基于粗集理论的数据离散化技术研究[J].重庆邮电学院学报（自然科学版）,2006,18(6):752-757. 被引量：14

1刘军.基于分辨关系的决策树构建算法[J].微电子学与计算机,2012,29(1):109-112.
2彭佳文,覃纪武.改进的启发式离散化算法[J].计算机工程与设计,2008,29(15):4003-4005.
3陈果.基于遗传算法的决策表连续属性离散化方法[J].仪器仪表学报,2007,28(9):1700-1705. 被引量：9
4陈鑫影,黄明,李瑞.基于评价指数的属性约简算法[J].大连铁道学院学报,2006,27(2):51-54. 被引量：1
5陈鑫影,邱占芝.基于可分辨关系的知识约简[J].计算机工程,2010,36(4):53-55. 被引量：5
6彭佳文.一种改进的启发式离散化算法及应用[J].计算机与现代化,2008(9):51-53. 被引量：1
7何群.基于粒极值的最简规则提取算法[J].计算机工程,2010,36(19):102-103.
8张静,王建民,何华灿.基于聚类的连续属性动态离散化算法[J].制造业自动化,2006,28(7):19-22.
9陈鑫影,邱占芝.基于可分辨重要度的属性约简算法[J].大连交通大学学报,2008,29(4):83-86. 被引量：1
10陈鑫影,李冠宇,刘彦含.基于决策依赖度的粗糙集约简模型研究[J].系统工程理论与实践,2016,36(2):505-516. 被引量：9

重庆大学学报（自然科学版）

2002年第3期

浏览历史

内容加载中请稍等...

基于粗集理论的数据离散化新算法被引量：27

参考文献3

二级参考文献14

共引文献106

同被引文献160

引证文献27

二级引证文献125

相关作者

相关机构

相关主题

浏览历史

基于粗集理论的数据离散化新算法 被引量：27

参考文献3

二级参考文献14

共引文献106

同被引文献160

引证文献27

二级引证文献125

相关作者

相关机构

相关主题

浏览历史

基于粗集理论的数据离散化新算法被引量：27