云计算环境下知识约简算法被引量：42

Knowledge Reduction Algorithms in Cloud Computing

下载PDF

导出

摘要知识约简是粗糙集理论的重要研究内容之一.经典的知识约简算法是假设所有数据一次性装入内存中,这显然不适合处理海量数据.为此,从属性(集)的可辨识性和不可辨识性出发,给出了可辨识和不可辨识对象对的概念及其性质,并阐述了它们与差别矩阵的关系.利用MapReduce设计了并行计算等价类的方法,提出了面向大规模数据的数据并行知识约简算法,讨论并实现了3种并行策略.最后,通过实验表明了云计算环境下知识约简算法是有效可行的,具有较好的可扩展性. Knowledge reduction is one of the important research issues in rough set theory.Classical knowledge reduction algorithms assume all the datasets can be loaded into the main memory,which are infeasible for large-scale datasets.Massive data with high dimensions makes attribute reduction a challenging task.To this end,the concepts and properties of discernibility and indiscernibility object pairs are given in terms of the discernibility and indiscernibility of the attribute（s）.The relationship between discernibility matrix and them is illustrated in detail.Then,an algorithm of computing equivalence classes is designed for large-scale data in data parallel,and the corresponding knowledge reduction algorithms are proposed in cloud computing.Finally,three parallelism strategies are implemented and discussed.The experimental results demonstrate that knowledge reduction algorithms in cloud computing can scale well and efficiently process massive datasets on commodity computers.

作者钱进苗夺谦张泽华

机构地区同济大学计算机科学与技术系江苏技术师范学院计算机工程学院同济大学嵌入式系统与服务计算教育部重点实验室

出处《计算机学报》 EI CSCD 北大核心 2011年第12期2332-2343,共12页 Chinese Journal of Computers

基金国家自然科学基金(60970061 61075056 61103067) 中央高校基本科研业务费专项资金江苏省属高校自然科学资金项目(09KJD520004)资助~~

关键词云计算粗糙集知识约简数据并行 MAPREDUCE cloud computing rough set knowledge reduction data parallel MapReduce

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献10

1杨明.一种基于改进差别矩阵的属性约简增量式更新算法[J].计算机学报,2007,30(5):815-822. 被引量：112
2胡峰,王国胤.属性序下的快速约简算法[J].计算机学报,2007,30(8):1429-1435. 被引量：49
3王立宏,吴耿锋.基于并行协同进化的属性约简[J].计算机学报,2003,26(5):630-635. 被引量：22
4刘少辉,盛秋戬,吴斌,史忠植,胡斐.Rough集高效算法的研究[J].计算机学报,2003,26(5):524-529. 被引量：271
5徐燕,怀进鹏,王兆其.基于区分能力大小的启发式约简算法及其应用[J].计算机学报,2003,26(1):97-103. 被引量：39
6刘勇,熊蓉,褚健.Hash快速属性约简算法[J].计算机学报,2009,32(8):1493-1499. 被引量：35
7徐章艳,刘作鹏,杨炳儒,宋威.一个复杂度为max（O（｜C｜｜U｜），O（｜C^2｜U／C｜））的快速属性约简算法[J].计算机学报,2006,29(3):391-399. 被引量：234
8王珏,王驹,等.Reduction Algorithms Based on Discernibility Matrix:The Ordered Attributes Method[J].Journal of Computer Science & Technology,2001,16(6):489-504. 被引量：130
9苗夺谦,胡桂荣.知识约简的一种启发式算法[J].计算机研究与发展,1999,36(6):681-684. 被引量：507
10王国胤,于洪,杨大春.基于条件信息熵的决策表约简[J].计算机学报,2002,25(7):759-766. 被引量：594

二级参考文献54

1叶东毅,陈昭炯.一个新的二进制可辨识矩阵及其核的计算[J].小型微型计算机系统,2004,25(6):965-967. 被引量：49
2Su-QingHan JueWang.Reduct and Attribute Order[J].Journal of Computer Science & Technology,2004,19(4):429-449. 被引量：24
3李订芳,李贵斌,章文.基于U/{a}划分的最小约简构造[J].武汉大学学报（理学版）,2005,51(3):269-272. 被引量：7
4徐章艳,刘作鹏,杨炳儒,宋威.一个复杂度为max（O（｜C｜｜U｜），O（｜C^2｜U／C｜））的快速属性约简算法[J].计算机学报,2006,29(3):391-399. 被引量：234
5杨明.一种基于改进差别矩阵的核增量式更新算法[J].计算机学报,2006,29(3):407-413. 被引量：76
6王珏,苗夺谦,周育健.关于Rough Set理论与应用的综述[J].模式识别与人工智能,1996,9(4):337-344. 被引量：264
7胡峰,王国胤.二维表快速排序的复杂度分析[J].计算机学报,2007,30(6):963-968. 被引量：17
8苗夺谦.Rough Set理论及其在机器学习中的应用研究[博士学位论文].北京:中国科学院自动化研究所,1997..
9王国胤.Rough集理论和知识获取[M].西安:西安交通大学出版社,2001..
10[5]Starzyk J, Nelson D E, Sturtz K. Reducts. A mathematical foundation for improved reduct generation in information systems. Journal of Knowledge and Information Systems, 2000, 2(2):131～146

共引文献1374

1马捷,葛岩,蒲泓宇.属性约简方法研究综述[J].数据分析与知识发现,2020,4(1):40-50. 被引量：10
2景运革,景罗希,王宝丽,程妮.属性值和属性变化的增量属性约简算法[J].山东大学学报（理学版）,2020,55(1):62-68. 被引量：6
3包沙如拉,孙鹏.海云协同媒体服务的副本分发管理子系统设计[J].网络新媒体技术,2020(3):56-60. 被引量：1
4王思.应用属性约简算法实现运动员伤病影响因素评估的研究[J].电子测量技术,2020,43(11):10-15.
5唐鹏飞.基于近似条件熵的集值决策表属性约简算法[J].智能计算机与应用,2021,11(10):20-25. 被引量：1
6刘城霞,朱敏玲,刘玮琪.基于互信息的属性约简算法研究与实现[J].北京信息科技大学学报（自然科学版）,2020,35(1):38-42. 被引量：7
7廖毅强.基于严格划分的信息系统属性约简的完备算法[J].湛江师范学院学报,2007,28(6):60-64.
8唐洪浪.基于决策强度的一种属性约简算法[J].湛江师范学院学报,2007,28(6):65-69.
9崔巍,李凡,徐章艳.基于正区域的快速求核算法[J].华中科技大学学报（自然科学版）,2007,35(12):20-23. 被引量：6
10宋岚,黄兆华,王洪.基于Rough熵的决策表约简算法研究[J].华东交通大学学报,2006,23(4):93-95. 被引量：1

同被引文献484

1朱有产,熊伟,静永文,高亚彬.基于Rough Set理论的综合分类器设计与实现[J].通信学报,2006,27(z1):63-67. 被引量：6
2颜艳,杨慧中.一种基于互信息的粗糙集知识约简算法[J].清华大学学报（自然科学版）,2007,47(z2):1903-1906. 被引量：16
3曹阳,高志远,杨胜春,姚建国,梁云,孙云枫.云计算模式在电力调度系统中的应用[J].中国电力,2012,45(6):14-17. 被引量：37
4卿斯汉,蒋建春,马恒太,文伟平,刘雪飞.入侵检测技术研究综述[J].通信学报,2004,25(7):19-29. 被引量：232
5仇国芳,马建敏,杨宏志,张文修.概念粒计算系统的数学模型[J].中国科学（F辑:信息科学）,2009,39(12):1239-1247. 被引量：19
6彭成,王树鹏,贾志凯.基于纠删码的数据消冗存储系统可靠性增强研究[J].计算机研究与发展,2011,48(S1):1-6. 被引量：3
7贾志凯,王树鹏,陈光达,彭成.一种并行层次化的重复数据删除技术[J].计算机研究与发展,2011,48(S1):100-104. 被引量：3
8胡洪华,黄廷辉,艾卫国,吴涛.大型火电机组运行优化目标值的研究和确定[J].中国电力,2004,37(9):22-25. 被引量：29
9梁可心,李涛,刘勇,陈桓.一种基于人工免疫理论的新型入侵检测模型[J].计算机工程与应用,2005,41(2):129-132. 被引量：13
10李珩,朱靖波,姚天顺.基于Stacking算法的组合分类器及其应用于中文组块分析[J].计算机研究与发展,2005,42(5):844-848. 被引量：18

引证文献42

1危前进,魏继鹏,古天龙,常亮,文益民.粗糙集多目标并行属性约简算法[J].软件学报,2022,33(7):2599-2617. 被引量：2
2琚春华,邹江波,张芮,魏建良.基于MapReduce技术的并行集成分类算法[J].电信科学,2012,28(7):40-47. 被引量：4
3钱进,苗夺谦,张泽华,张志飞.MapReduce框架下并行知识约简算法模型研究[J].计算机科学与探索,2013,7(1):35-45. 被引量：17
4戴大蒙,慕德俊.非完备信息系统的启发式特征选择遗传算法[J].电子学报,2013,41(3):451-455. 被引量：6
5范大鹏,李丹,张雅君,祝轶欧,孙成发.云计算的应用对高校实验教学的影响[J].菏泽学院学报,2013,35(2):98-101. 被引量：2
6叶明全,胡学钢,胡东辉,吴信东.基于属性值分类的多层次粗糙集模型[J].模式识别与人工智能,2013,26(5):481-491. 被引量：9
7蒋鸿玲,邵秀丽,李耀芳.基于MapReduce的僵尸网络在线检测算法[J].电子与信息学报,2013,35(7):1732-1738. 被引量：10
8张玲,白中英,罗守山,谢康,崔冠宁,孙茂华.基于粗糙集和人工免疫的集成入侵检测模型[J].通信学报,2013,34(9):166-176. 被引量：40
9于为.大数据技术应用研究[J].电脑知识与技术,2013,9(8):5002-5003. 被引量：1
10徐雪松.基于免疫记忆共享机制的工业数据约简方法[J].计算机集成制造系统,2013,19(11):2864-2870. 被引量：2

二级引证文献573

1刘晓宁.基于大数据的电力企业物资管理模式优化探讨[J].中外企业家,2019,0(35):24-24. 被引量：2
2马捷,葛岩,蒲泓宇.属性约简方法研究综述[J].数据分析与知识发现,2020,4(1):40-50. 被引量：10
3危前进,魏继鹏,古天龙,常亮,文益民.粗糙集多目标并行属性约简算法[J].软件学报,2022,33(7):2599-2617. 被引量：2
4庞景安.大数据时代:思维变革、产业转型与数据科学兴起[J].情报学进展,2016(1):186-218.
5汪生,金志刚.基于模糊SVM模型的入侵检测分类算法[J].计算机应用研究,2020,37(2):501-504. 被引量：8
6黄茹萍.大数据时代下个人信息安全保护研究[J].法制与社会（旬刊）,2020,0(8):245-246. 被引量：2
7钱卓昊.数据驱动的属性值分类法及其在属性泛化中的应用[J].智能计算机与应用,2021,11(4):77-81.
8周琴.基于科技成果转化报告管理系统的研究与应用[J].新一代信息技术,2022,5(5):86-88.
9陶磊.'大数据热'背景下高职应用写作课程教学的'冷思考'[J].中国校外教育,2017,0(A01):156-157. 被引量：1
10邢文杰.优化企业集团联合舰队[J].中外管理导报,2000(3):37-38.

1钱进,苗夺谦,张泽华.云计算环境下差别矩阵知识约简算法研究[J].计算机科学,2011,38(8):193-196. 被引量：5
2李晓梅.高性能并行计算基础理论与软件[J].装备指挥技术学院学报,2003,14(1):61-61.
3齐丽红,余隶.数据并行Fortran[J].电子计算机,1994(2):1-10. 被引量：1
4傅忠良.单片机与微机间数据并行传输方法[J].计算机应用,1997,17(2):45-46. 被引量：5
5刘德才,王鼎兴,沈美明,郑纬民.数据并行的性能分析[J].软件学报,1994,5(5):8-15. 被引量：4
6常玉慧,吕萍,钱进.云计算下保持边界域划分的知识约简算法研究[J].计算机工程与应用,2015,51(24):159-164. 被引量：1
7张冠松,李晓明.数据并行中的流水同步[J].科学通报,1996,41(2):181-186.
8陈国顺,李铄,蔡金明.并行程序设计方式[J].工业技术经济,1997(4):71-80.
9张发存,赵晓红,王忠,沈绪榜.区域生长法图像分割的数据并行方法研究[J].计算机工程,2004,30(17):14-16. 被引量：7
10李然,吕永江,林和,李永礼.基于数据库系统的知识约简算法[J].南京理工大学学报（社会科学版）,2005,18(S1):201-204.

计算机学报

2011年第12期

浏览历史

内容加载中请稍等...

云计算环境下知识约简算法被引量：42

参考文献10

二级参考文献54

共引文献1374

同被引文献484

引证文献42

二级引证文献573

相关作者

相关机构

相关主题

浏览历史

云计算环境下知识约简算法 被引量：42

参考文献10

二级参考文献54

共引文献1374

同被引文献484

引证文献42

二级引证文献573

相关作者

相关机构

相关主题

浏览历史

云计算环境下知识约简算法被引量：42