基于分布式计算模式的两种属性约简算法被引量：2

Two Attribute Reduction Algorithms with Distributed Computing Pattern

下载PDF

导出

摘要粗糙集是一种处理不确定、不完全理论的经典理论,属性约简是粗糙集理论的核心知识之一。为适应大数据的发展,对广泛应用于数据不确定性、不完备性处理的属性约简算法相应改进,提出两种适应分布式处理的属性约简算法。首先提出基于MapReduce框架和正域的属性约简算法;并借鉴Hadoop分布式处理机制,针对差别矩阵all-to-all比较特性,提出一种新型分布式处理机制,基于该机制提出了一种适应分布式数据处理机制的新型数据分割及分布规则,基于该规则探讨了基于差别矩阵的属性约简算法在新型分布式处理机制下的具体实现方法。仿真算例表明了这两种算法处理大数据集的有效性。 Rough set is a classical theory of processing uncertain and incomplete theory, and attribute reduction is one of the core knowledge of rough set theory. In order to adapt to the development of big data, the attribute reduction algorithm should be improved accordingly with abroad application in data uncertainty and incomplete processing. In this context, we propose two kinds of attribute reduction algorithm. First, an attribute reduction algorithm based on the MapReduce framework and the positive domain is presented. Then, a new distributed processing mechanism is proposed for the all-to-all comparison feature of the difference matrix by means of Hadoop distributed processing mechanism, based on which, a new data segmentation and distribution rules of the data processing mechanism are discussed. On the basis of this rule, the attribute reduction algorithm based on the difference matrix is discussed in the new distributed processing mechanism. A simulation example shows the effectiveness of the two algorithms in dealing with large data sets.

作者喻瑛杨峥王伟杰

机构地区上海大学机电工程与自动化学院

出处《计算机技术与发展》 2018年第1期28-32,共5页 Computer Technology and Development

基金上海市2015年度"科技创新行动计划"高新技术领域项目(15511109700)

关键词属性约简分布式大数据正域 all—to—all比较 attribute reduction distributed computing big data positive domain all-to-all comparison

分类号 TP301.6 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献10

1王宇,杨志荣,杨习贝.决策粗糙集属性约简:一种局部视角方法[J].南京理工大学学报,2016,40(4):444-449. 被引量：17
2黄国顺.保正域的决策粗糙集属性约简[J].计算机工程与应用,2016,52(2):165-169. 被引量：8
3刘涛涛,马福民,张腾飞.基于正区域和差别元素的增量式属性约简算法[J].计算机工程,2016,42(8):183-187. 被引量：5
4刘城霞,何华灿.基于信息熵的属性约简算法研究与实现[J].北京信息科技大学学报（自然科学版）,2015,30(4):56-60. 被引量：4
5李少年,吴良刚.基于邻域信息熵度量数值属性快速约简算法[J].计算机工程与科学,2016,38(2):350-355. 被引量：7
6王治和,崔晓慧.改进的差别矩阵启发式属性约简算法[J].计算机工程与设计,2016,37(4):1032-1036. 被引量：8
7朱继,喻瑛,王辰炜,饶珺.基于粗糙集和自适应遗传算法的电力变压器故障诊断[J].电测与仪表,2012,49(6):47-51. 被引量：12
8钱程,穆文平,王康,武雄.基于主成分分析的地下水水质模糊综合评价[J].水电能源科学,2016,34(11):31-35. 被引量：30
9马宗杰,刘华文.基于奇异值分解—偏最小二乘回归的多标签分类算法[J].计算机应用,2014,34(7):2058-2060. 被引量：5
10韩玉,李美聪,郭新辰.基于粗糙集理论的文本分类属性约简算法[J].东北电力大学学报,2016,36(5):92-96. 被引量：8

二级参考文献107

1项新建.基于粗糙集理论的变压器故障诊断专家系统研究[J].仪器仪表学报,2005,26(1):93-96. 被引量：10
2马翼敏.油中溶解气体的色谱分析在变压器故障诊断中的应用[J].变压器,2005,42(8). 被引量：4
3朱世英,周爱东,陈志国,李宏宇,李长海.气相色谱在油浸变压器故障分析中的应用[J].变压器,2005,42(11):43-45. 被引量：5
4徐章艳,刘作鹏,杨炳儒,宋威.一个复杂度为max（O（｜C｜｜U｜），O（｜C^2｜U／C｜））的快速属性约简算法[J].计算机学报,2006,29(3):391-399. 被引量：234
5胡彧,李智玲,李春伟.一种基于区分矩阵的属性约简算法[J].计算机工程与应用,2007,43(9):178-180. 被引量：16
6杨明.一种基于改进差别矩阵的属性约简增量式更新算法[J].计算机学报,2007,30(5):815-822. 被引量：112
7官礼和.一种分布式的决策表核属性计算方法[J].计算机工程与应用,2007,43(17):164-166. 被引量：1
8胡峰,王国胤.属性序下的快速约简算法[J].计算机学报,2007,30(8):1429-1435. 被引量：49
9J.H.Nasiri and M.Mashinchi.Rough Set and Data Analysis in Decision Tables[J],Journal of Uncertain Systems,3(3):232 -240, 2009.
10Ji Zhu and Ying Yu. Application of Rough Set and Genetic Algorithm to Transformer Fault Diagnosis [C]. Fourth International Workshop on Advanced Computational Intelligence,2011:1-6.

共引文献89

1杨芳,杨盼,卢路,李建.基于主成分分析法的洞庭湖水质评价[J].人民长江,2019,0(S02):42-45. 被引量：18
2栾先春,杨春旺.浅谈企业长期投资决策[J].农场经济管理,2000(3):47-48. 被引量：1
3孙晓翔.基于粗糙集的电力设备故障诊断[J].电脑编程技巧与维护,2012(22):111-112. 被引量：1
4路光辉,姬波,龚东武,郑坤,郭宏燕.变压器故障诊断的可视化模型[J].计算机工程与设计,2013,34(5):1841-1845. 被引量：5
5李育恒,赵峰.基于RFE-SA-SVM的变压器故障诊断[J].电测与仪表,2014,51(12):50-55. 被引量：2
6李志斌,李启本.基于信息融合技术的变压器多层次故障诊断[J].电测与仪表,2014,51(16):37-40. 被引量：2
7杨志超,张成龙,吴奕,安薇薇,朱海兵,龚灯才.基于粗糙集和RBF神经网络的变压器故障诊断方法研究[J].电测与仪表,2014,51(21):34-39. 被引量：31
8高明磊,张钟江,姬波.基于特征变换的DGA诊断范例推理方法[J].计算机科学,2015,42(10):251-255. 被引量：2
9黄伟,赵寅邦.粗糙集和MPGA在变压器故障诊断中的应用[J].自动化仪表,2016,37(4):27-30.
10刘宇,杨志萍,王春明,杜倩,戈勤.基于优化钻石模型的产业竞争力评估方法——以我国机械工业为例[J].现代情报,2016,36(4):62-69. 被引量：8

同被引文献20

1陈鑫影.粗糙集在企业信息系统中的应用[J].商场现代化,2007(04Z):36-36. 被引量：1
2张文东,李明壮,石小艳.基于粗糙集理论的属性约简算法[J].计算机工程与设计,2008,29(22):5795-5797. 被引量：18
3丁桂兰,周艳华.高校贫困生认定的现实困境与对策思考[J].教育与职业,2010(26):33-35. 被引量：27
4杨沛,袁莎,周卫红.一种改进的基于依赖度的属性约简算法[J].云南民族大学学报（自然科学版）,2011,20(6):504-507. 被引量：4
5申静,王华彪.高校贫困生认定的困境与对策[J].学校党建与思想教育（下）,2012(3):50-51. 被引量：12
6周玲元,段隆振.改进的Apriori算法在高校图书推荐服务中的应用研究[J].图书馆学研究,2013(2):89-91. 被引量：6
7曹路舟.Apriori算法在高职院校贫困生认定工作中的应用[J].池州学院学报,2012,26(6):9-11. 被引量：3
8白华,徐英.高校贫困生资助绩效评价指标体系设计[J].黑龙江高教研究,2016,34(6):116-120. 被引量：15
9许学添,邹同浩.基于弱关联挖掘的网络取证数据采集系统设计与实现[J].计算机测量与控制,2017,25(1):123-126. 被引量：10
10李斌,张海超,白雪峰,侯英俊.大数据技术对风电场发电量提升的研究及应用[J].电力大数据,2017,20(8):30-35. 被引量：3

引证文献2

1樊伟,刘红,匡亚茹.基于粗糙集改进Apriori算法在高校贫困生认定中的应用[J].电脑知识与技术,2019,15(7X):3-6. 被引量：2
2郑筠.基于MapReduce框架的电力大数据增量式属性约简方法可行性分析[J].电子设计工程,2021,29(3):66-69. 被引量：3

二级引证文献5

1吴乐乐,朱亚辉.基于深度神经网络的高校贫困生认定模型[J].电子测试,2020,31(1):88-89. 被引量：1
2徐军委,刘长胜.基于人工智能和深度数据分析技术的考评系统设计[J].电子设计工程,2021,29(6):179-183. 被引量：3
3朱丽.犹豫模糊信息约简方法在高校贫困生认定中的应用[J].昆明冶金高等专科学校学报,2021,37(5):94-99. 被引量：2
4裴康鹭.基于邻域相似性的多源异构大数据属性约减方法[J].信息与电脑,2023,35(3):19-21.
5李波,赵瑞锋,卢建刚,黎皓彬,陈志伟,李世明.基于聚类算法的电力大数据信息分析系统研究[J].自动化仪表,2023,44(8):84-90. 被引量：1

1刘思雨,牛万彬.甲状腺癌中彩色多普勒超声诊断价值探析[J].蛇志,2017,29(3):305-306. 被引量：2
2张少青.“宏微”素养下核心知识与关键能力的教学策略[J].中小学教学研究,2017,18(12):7-8.
3贾金伟,吴旭鹏,李启本,戴人杰.基于并行计算的大数据挖掘在电网中的应用[J].电力与能源,2017,38(6):724-729. 被引量：3
4温礼,张荣慧,苏伟,王伟.我国光伏用地遥感监测分类体系和解译标志建立方法研究[J].国土资源信息化,2017(4):32-36. 被引量：1
5刘洪萍,阚京波.机车变流器检修与改造技术研究[J].铁道机车与动车,2017(12):41-43.
6梁剑波,梁丽香.大数据环境下特征数据优化提取仿真[J].计算机仿真,2017,34(12):345-348. 被引量：4
7姚晟,汪杰,徐风,陈菊.不完备邻域粗糙集的不确定性度量和属性约简[J].计算机应用,2018,38(1):97-103. 被引量：16
8魏秀瑛,张同文,李文.基于粗糙集的高层建筑施工安全评价研究[J].中国建材科技,2017,26(6):3-3.
9王鹏,宋艳红,李松江,杨华民,邱宁佳.针对行为特征的社交网络异常用户检测方法[J].计算机应用,2017,37(A02):219-224. 被引量：7
10李叶贤.2017年高考物理全国Ⅰ卷第23题的分析与教学建议[J].物理教学探讨（中学教学教研版）,2018,0(1):48-50.

计算机技术与发展

2018年第1期

浏览历史

内容加载中请稍等...

基于分布式计算模式的两种属性约简算法被引量：2

参考文献10

二级参考文献107

共引文献89

同被引文献20

引证文献2

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

基于分布式计算模式的两种属性约简算法 被引量：2

参考文献10

二级参考文献107

共引文献89

同被引文献20

引证文献2

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

基于分布式计算模式的两种属性约简算法被引量：2