分布式网络多层次数据挖掘改进方法研究被引量：5

Research on Improved Method of Hierarchical Data Mining in Distributed Network

下载PDF

导出

摘要传统数据挖掘方法对数据挖掘时必须为高速通信网络,而且还导致系统响应时间延长,对数据安全性产生威胁。文中以分布式环境为背景,提出基于熵值思想的聚类挖掘改进方法,实现网络多层次数据挖掘。设定网络多层次数据聚类参数,计算产生新聚类数,将该数据值作为聚类搜索范围的上限值kmax,选取合适的有效性Silhouette指标,结合最大最小距离理论设置的聚类中心,获得最佳聚类数目;运用熵值理论及动态规划思想形成改进聚类挖掘方法,运用熵值理论判定数据属性权重值,并获取多层次数据对象与邻近数据间的权重关系,将欧氏距离当作数据相似度衡量依据;利用动态规划思想计算获得最大k个数据对象,确定多层次数据挖掘聚类中心。实验证明,利用文中改进数据挖掘方法可有效挖掘网络多层次数据中的有价值信息。 Traditional data mining methods must be high-speed communication networks for data mining,but also lead to longer response time and threat to data security. Based on the distributed environment,this paper proposes an improved clustering mining method based on entropy value to realize multi-level data mining. According to the network data of multi level clustering parameters set in advance,produce new clustering number by calculating the data value as clustering the search range of the upper limit of kmax,select the appropriate indicators of the effectiveness of Silhouette,with the maximum and minimum distance clustering center set theory,obtain the optimal number of clusters; using the entropy theory and dynamic programming form improvement clustering mining method,determine the data value of attribute weight by entropy theory,and obtain the weight hierarchy data object and the adjacent data between the Euclidean distance as a similarity measure based on the maximum data; k data object is calculated by using the dynamic programming to determine the multi-level data mining clustering center. Experimental results show that the improved data mining method can effectively mine valuable information in multi-level data.

作者孙艳

机构地区西安翻译学院

出处《科技通报》 2018年第5期208-211,共4页 Bulletin of Science and Technology

基金 2017年西安市社科规划基金项目(项目编号:17Z61)

关键词分布式网络数据挖掘多层次数据有价值信息 distributed network data mining multilevel data valuable information

分类号 TP311.13 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献8

1邓芳.大型物联网电子设备的海量数据高效挖掘方法研究[J].现代电子技术,2016,39(4):159-162. 被引量：18
2孔翔宇,毕秀春,张曙光.财经新闻与股市预测——基于数据挖掘技术的实证分析[J].数理统计与管理,2016,35(2):215-224. 被引量：30
3刘应波,王锋,季凯帆,邓辉,戴伟,梁波.基于压缩-字对齐位图的天文海量数据实时索引[J].计算机工程与应用,2016,52(1):37-41. 被引量：1
4滕翠,梁川,梁碧珍.海量数据环境下大型ISP网络流量卸载方法研究[J].科学技术与工程,2017,17(13):44-48. 被引量：2
5李远宁,刘森,张诗军,陈丰,王志英.分布式数据质量管理系统在电力企业的实践和应用[J].电信科学,2016,32(4):169-174. 被引量：9
6逄琳,刘方爱.基于层次划分的密度优化聚类算法[J].计算机应用,2016,36(6):1634-1638. 被引量：7
7韩萌,王志海,丁剑.一种频繁模式决策树处理可变数据流[J].计算机学报,2016,39(8):1541-1554. 被引量：11
8张春生.大数据环境下相容数据集的关联规则数据挖掘[J].微电子学与计算机,2016,33(8):34-39. 被引量：5

二级参考文献91

1胡金林,梅士员.基于元数据扩展的空间数据质量管理方法[J].现代测绘,2004,27(3):21-24. 被引量：7
2翁敬农.译.数据挖掘教程[M].北京:清华大学出版社,2003.
3孙吉贵,刘杰,赵连宇.聚类算法研究[J].软件学报,2008(1):48-61. 被引量：1076
4陈黎飞,姜青山,王声瑞.基于层次划分的最佳聚类数确定方法[J].软件学报,2008,19(1):62-72. 被引量：82
5Wu K,Otoo E J,Shoshani A,et al.Notes on design and implementation of compressed bit vectors,Technical Report LBNL/PUB-3161[R].Lawrence Berkeley National Laboratory,Berkeley,CA,2001.
6Wu K.Fast Bit:An efficient indexing technology for accelerating data-intensive science[J].Journal of Physics:Conference Series,2005,16(1):556-560.
7Chou J,Wu K.Design of Fast Query:How to generalize indexing and querying system for scientific data[D].University of California,2012.
8Chou J,Wu K,Prabhat P.Fast Query:A parallel indexing system for scientific data[C]//Proceedings of IEEE International Conference on Cluster Computing,2011:455-464.
9Gosink L J,Wu K,Bethel E W,et al.Data parallel binbased indexing for answering queries on multi-core architectures[M]//Scientific and Statistical Database Management.Berlin Heidelberg:Springer,2009:110-129.
10Chou J,Wu K,Rubel O,et al.Parallel index and query for large scale data analysis[C]//Proceedings of International Conference on High Performance Computing,Networking,Storage and Analysis,2011:1-11.

共引文献75

1徐维军,付志能,李茂昌,张卫国.基于新闻文本挖掘的股指期货高频预测研究[J].系统科学与数学,2021,41(7):1856-1875. 被引量：2
2田金方,王冬冬,孔雪.投资者关注与概念股异质特征:影响机制与多维测度——基于行为大数据的匹配检验[J].数理统计与管理,2020,39(2):354-367. 被引量：11
3柳青.如何做好财经类新闻采编专业人才培养[J].采写编,2018,0(3):86-87.
4孟雪井,杨亚飞,赵新泉.财经新闻与股市投资策略研究——基于财经网站的文本挖掘[J].投资研究,2016,35(8):29-37. 被引量：7
5陈云松,严飞.网络舆情是否影响股市行情? 基于新浪微博大数据的ARDL模型边限分析[J].社会,2017,37(2):51-73. 被引量：25
6徐聪,黄文准,黄世奇.基于自组织映射的遗传聚类算法[J].计算机与现代化,2017(4):38-43. 被引量：2
7杨呈永.物联网虚假数据特征自适应检测方法仿真[J].计算机仿真,2017,34(4):276-279. 被引量：4
8胡臻.电力施工企业办公室行政管理精细化的思路与措施[J].低碳世界,2017,7(12):95-96. 被引量：10
9杨宋华.基于数据挖掘的排球运动员身体素质评价模型[J].现代电子技术,2017,40(11):119-122. 被引量：3
10洪亮,李雪思,周莉娜.领域跨越:数据挖掘的应用和发展趋势[J].图书情报知识,2017,34(4):22-32. 被引量：18

同被引文献62

1任众,侯宏旭,武静,王洪彬,李金廷,樊文婷,申志鹏.基于统计和神经网络的蒙汉机器翻译研究[J].中文信息学报,2018,32(11):1-7. 被引量：6
2张胜,施荣华,赵颖.基于多元异构网络安全数据可视化融合分析方法[J].计算机应用,2015,35(5):1379-1384. 被引量：21
3钱潮恺,黄德才.基于维度频率相异度和强连通融合的混合数据聚类算法[J].模式识别与人工智能,2016,29(1):82-89. 被引量：5
4郭祖华,蔡鹏飞,张晓.数据挖掘在光纤网络入侵检测中的应用[J].激光杂志,2016,37(3):99-102. 被引量：9
5周立军,张杰,吕海燕.基于数据挖掘技术的网络入侵检测技术研究[J].现代电子技术,2016,39(6):10-13. 被引量：27
6余钧,郭岩,张凯,刘林,刘悦,俞晓明,程学旗.FPC:大规模网页的快速增量聚类[J].中文信息学报,2016,30(2):182-188. 被引量：3
7康俊涛,刘洋.桥梁施工安全性评价的贝叶斯网络方法研究[J].中国安全科学学报,2016,26(7):157-162. 被引量：23
8文志诚,陈志刚,唐军.基于聚类分析的网络安全态势评估方法[J].上海交通大学学报,2016,50(9):1407-1414. 被引量：18
9石陆魁,周浩,刘文浩.基于流形学习的路面破损图像多特征融合与可视化[J].公路交通科技,2016,33(11):26-33. 被引量：3
10许学添,邹同浩.网络数据库中隐蔽数据快速挖掘方法研究[J].电子设计工程,2016,24(24):15-18. 被引量：11

引证文献5

1赵露.基于聚类分析的网络安全数据特征可视化融合研究[J].长春工程学院学报（自然科学版）,2020(2):94-97. 被引量：3
2徐良.大型差异数据库中高伪装入侵数据挖掘方法[J].电子设计工程,2020,28(5):112-115. 被引量：2
3姚兰.基于改进短语翻译模型的计算机智能化校对系统研究[J].电子设计工程,2020,28(18):52-55. 被引量：10
4王成玥.基于视觉信息传达的网页广告智能推送系统设计[J].现代电子技术,2020,43(20):160-163. 被引量：3
5祝和明,蔡榕,周长江,王存超,郭晏.基于融合指标的电力专利可信数据挖掘方法研究[J].自动化技术与应用,2024,43(3):139-142.

二级引证文献18

1黄戌霞,陈明磊,苏锋.翻转课堂的H5数字资源平台的设计与实现——以“CSS+DIV网页设计”课程为例[J].现代信息科技,2020,4(18):172-175.
2刘艳茹.智能化计算机网络监控系统设计[J].技术与教育,2020,34(3):24-26.
3肖华英.基于视觉传达的嵌瓷视频图像自动定位系统设计[J].自动化与仪器仪表,2021(9):138-142. 被引量：1
4王小迁.基于计算机智能的英语译文语境化自动校准系统[J].微型电脑应用,2021,37(11):158-160. 被引量：2
5刘张榕.基于大数据集的动态数据库关联挖掘研究[J].微型电脑应用,2021,37(12):60-62. 被引量：4
6赵石楠,杜文.基于改进短语翻译模型的外语数据库智能校对系统[J].自动化与仪器仪表,2022(2):90-93. 被引量：5
7王惠.基于短语译文组合的智能化自动翻译设计研究[J].自动化与仪器仪表,2022(2):163-166. 被引量：1
8李静.基于人工智能技术的计算机辅助翻译软件设计[J].信息技术与信息化,2022(3):70-73. 被引量：5
9陈虹,赵有俊.云计算下小样本数据库间差异消除方法研究[J].计算机仿真,2022,39(3):315-318. 被引量：1
10梁栋.基于互联网数据的公共英语自动翻译系统设计[J].信息技术,2022,46(6):139-144.

1孙吉君,黄晓静,史伟云,王婷.保留角膜上皮瓣的角膜胶原交联术治疗较薄型圆锥角膜的临床研究[J].中华眼科杂志,2018,54(6):421-425. 被引量：5
2王金亮,宋丽.角膜胶原交联治疗圆锥角膜的效果探讨[J].中外医疗,2018,37(7):68-70. 被引量：1
3陈思霖.从此告别“人体描边大师” HandJoy绝地枪神K1来临[J].微型计算机,2018,38(12):70-72.
4李国庆,杜扬,齐圣,王世茂,张培理,韦世豪,李蒙.障碍物位置和油气浓度对油气泄压爆炸特性影响[J].化工学报,2018,69(5):2327-2336. 被引量：5

科技通报

2018年第5期

浏览历史

内容加载中请稍等...

分布式网络多层次数据挖掘改进方法研究被引量：5

参考文献8

二级参考文献91

共引文献75

同被引文献62

引证文献5

二级引证文献18

相关作者

相关机构

相关主题

浏览历史

分布式网络多层次数据挖掘改进方法研究 被引量：5

参考文献8

二级参考文献91

共引文献75

同被引文献62

引证文献5

二级引证文献18

相关作者

相关机构

相关主题

浏览历史

分布式网络多层次数据挖掘改进方法研究被引量：5