高维大数据流时间维度特征提取方法仿真被引量：4

Simulation of Time Dimension Feature Extraction Method for High Dimension and Large Data Stream

下载PDF

导出

摘要传统大数据流时间维度特征存在提取率低、数据异常值筛选实时性差的问题,提出高维大数据流时间维度特征提取方法。利用反向k近邻技术筛选实时数据的异常值,结合熵值法与多层增量特征提取方法,完成高维数据的初次提取,确定样本类型,将数据纳入大数据信息流时间性算法,实现时间维度下数据分析及二次提取。仿真结果显示,上述方法在提高大数据特征提取率、增强数据提取能力方面具有明显优势,同时能够显著实时更新数据特征,实用性较强。 When the traditional method is to extract time dimension features of the big data stream, the extraction rate is low and real-time data outlier screening performance is poor. A method to extract the time dimension features of the high-dimensional big data stream was proposed. First, the inverse k-nearest neighbor technology was used to screen outliers of real-time data. By using the entropy method combined with the multi-layer incremental feature extraction method, the initial extraction of high-dimensional data was completed and the sample type was determined. Moreover, the data were incorporated into the timeliness algorithm of big data information flow. Finally, data analysis and secondary extraction in the time dimension were realized. Simulation results show that the proposed method has obvious advantages in improving the extraction rate of big data features and enhancing data extraction ability. Meanwhile, this method can update data features in real-time, so its practicability is strong.

作者华涛 HUA Tao(Liaocheng University,Shandong Liaocheng 252059,China)

机构地区聊城大学

出处《计算机仿真》北大核心 2021年第4期356-360,共5页 Computer Simulation

基金赛尔网络下一代互联网技术创新项目(NGII20170604)。

关键词高维数据特征提取时间维度大数据时代提取效率 High-dimensional data Feature extraction Time dimension Big data Era Extraction efficiency

分类号 TP318.2 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献8

1张智,刘泽萌,杨堤,吴黎军.基于降维技术的住院费用多因素分析与方法研究[J].中国卫生统计,2018,35(1):126-128. 被引量：1
2李华亮,钱志鸿,田洪亮.基于核函数特征提取的室内定位算法研究[J].通信学报,2017,38(1):158-167. 被引量：47
3秦楚雄,张连海.基于DNN的低资源语音识别特征提取技术[J].自动化学报,2017,43(7):1208-1219. 被引量：25
4李杰,李欢.基于深度学习的短文本评论产品特征提取及情感分类研究[J].情报理论与实践,2018,41(2):143-148. 被引量：53
5石俊杰,李昊,路轶,翟明玉,向博,季学纯.基于应用与时间维度的电网模型多版本构建与管理技术[J].电力系统自动化,2017,41(10):106-111. 被引量：1
6张九龙,张镇东,杨夙,高阳,肖照林.基于时间维度局部特征的人体行为识别[J].西安理工大学学报,2017,33(2):169-174. 被引量：3
7何兴高,李蝉娟,王瑞锦,邓伏虎,刘行.基于信息熵的高维稀疏大数据降维算法研究[J].电子科技大学学报,2018,47(2):235-241. 被引量：19
8王春义,牟宏,顾洁,曹颖爽,薛万磊,路宽.基于大数据高维分析理论的用户用电模式分析[J].水电能源科学,2017,35(10):203-206. 被引量：11

二级参考文献41

1黄海峰,曹阳,宋鑫,李亚平.适应于智能调度的电网模型管理系统设计[J].中国电机工程学报,2009,29(S1):7-10. 被引量：11
2张鹭鹭,陈洁.单病种成本核算与补偿方式的探讨[J].中华医院管理杂志,1993,9(9):544-546. 被引量：6
3陈伏兵,高秀梅,张生亮,杨静宇.基于分块PCA的人脸识别方法[J].小型微型计算机系统,2006,27(10):1943-1947. 被引量：10
4林峰,胡牧,蒋元晨,倪斌.电力调度综合数据平台体系结构及相关技术[J].电力系统自动化,2007,31(1):61-64. 被引量：87
5陈伏兵,杨静宇.分块PCA及其在人脸识别中的应用[J].计算机工程与设计,2007,28(8):1889-1892. 被引量：26
6徐长妍,于双成,迟宝荣.单病种限额付费挑战医院管理模式[J].中国医院管理,2007,27(7):5-7. 被引量：20
7尹飞,冯大政.基于PCA算法的人脸识别[J].计算机技术与发展,2008,18(10):31-33. 被引量：42
8李实,叶强,李一军,RobLaw.中文网络客户评论的产品特征挖掘方法研究[J].管理科学学报,2009,12(2):142-152. 被引量：130
9姚建国,严胜,杨胜春,杨志宏,高宗和.中国特色智能调度的实践与展望[J].电力系统自动化,2009,33(17):16-20. 被引量：175
10张伯明,孙宏斌,吴文传,郭庆来.智能电网控制中心技术的未来发展[J].电力系统自动化,2009,33(17):21-28. 被引量：155

共引文献152

1庞良健,李晗,王庆林,徐新胜.融合多层次语义的网络评价方面抽取方法研究[J].科技通报,2021,37(10):59-65.
2张会云.语音情感识别研究综述[J].信息通信,2019,0(11):58-60. 被引量：2
3王晓军,张文强,刘思远.地铁站内外一体化导航系统关键技术研究及实现[J].都市快轨交通,2022,35(3):48-53. 被引量：3
4袁松范.中国进入世贸组织的前景[J].中国医药情报,2000,6(1):34-37. 被引量：3
5郭晓慧.基于LDA主题模型的文本语料情感分类改进方法[J].延边大学学报（自然科学版）,2018,44(3):266-273. 被引量：3
6毕京学,汪云甲,曹鸿基,王永康.全向指纹和Wi-Fi感知概率的WKNN定位方法[J].测绘科学,2019,44(2):77-82. 被引量：6
7王康.基于改进传播环境参数的室内定位方法[J].电脑知识与技术,2018,14(12):219-221.
8李亚文,王博.改进型Mean-Shift算法在行人目标跟踪中的应用[J].商洛学院学报,2017,31(4):10-14. 被引量：3
9付思源,王华东.和声搜索算法优化神经网络的无线网络室内定位[J].南京理工大学学报,2017,41(4):428-433. 被引量：11
10王恩良,王玫,孟志斌,徐湘寓.一种基于WiFi指纹特征匹配的加权K近邻室内定位算法[J].桂林电子科技大学学报,2017,37(4):276-281. 被引量：6

同被引文献47

1姚树春,刘正,张强.基于混合遗传算法与互信息分析的高维小样本特征选择[J].计算机应用与软件,2020,37(1):247-255. 被引量：6
2田浩楠,周晖.基于BSO-OS算法的两阶高维数据特征选择[J].计算机工程与设计,2020,41(3):695-700. 被引量：4
3曾海亮,林耀进,唐莉,王晨曦.利用特征扰动的高维小样本数据子空间学习[J].江苏科技大学学报（自然科学版）,2020,34(1):62-68. 被引量：2
4陈旺虎,田真,张礼智,梁小燕,高雅琼.基于插值的高维稀疏数据离群点检测方法[J].计算机工程与科学,2020,42(6):966-972. 被引量：8
5张忠林,曹婷婷.基于重采样与特征选择的不均衡数据分类算法[J].小型微型计算机系统,2020,41(6):1327-1333. 被引量：16
6曾海亮,林耀进,王晨曦,陈祥焰.利用一致性分析的高维类别不平衡数据特征选择[J].小型微型计算机系统,2020,41(9):1946-1951. 被引量：4
7冉亚鑫,韩红旗,张运良,翁梦娟,高雄,彭柯芸.基于Stacking集成学习的大规模文本层次分类方法[J].情报理论与实践,2020,43(10):171-176. 被引量：15
8赵宁杰,李雪飞.基于bagging思想的决策树分类算法研究[J].北京服装学院学报（自然科学版）,2020,40(3):43-48. 被引量：4
9胡玉琦,李雪,曲越奇.基于项目评分行为序列的群组攻击检测算法[J].燕山大学学报,2021,45(1):87-94. 被引量：2
10邹承明,陈德.高维大数据分析的无监督异常检测方法[J].计算机科学,2021,48(2):121-127. 被引量：9

引证文献4

1徐成桂,徐广顺.基于模糊数学理论的高维小样本数据特征分类系统[J].现代电子技术,2022,45(23):166-170. 被引量：1
2张德发.融合GA算法与特征自表示方法的高维大数据特征快速提取方法研究[J].自动化与仪器仪表,2024(1):26-29. 被引量：1
3刘洋,聂苒.基于因子分析的铁路多源异构大数据特征筛选[J].电子设计工程,2024,32(11):42-45.
4杨志飞,张佳,李泽阳.基于增量式学习的复杂网络节点攻击检测算法[J].吉林大学学报（工学版）,2024,54(10):2963-2968.

二级引证文献2

1杨知玲.基于随机平衡采样的不确定大数据流在线分类算法[J].现代电子技术,2023,46(19):125-128.
2张悦,黄继宁,陆南昌,柯俊生,易卓锋.AHP与GRA集成方法在机房能效评价中的应用与创新[J].通讯世界,2024,31(11):154-156.

1杨志勇.浅析大数据时代档案管理发展的思考[J].东西南北（教育）,2021(5):45-45. 被引量：2
2张镇.课程思政背景下视觉传达设计教育路径研究与实践[J].鞋类工艺与设计,2021(6):56-58. 被引量：1
3张代明,邓治国.云南瑞丽翡翠网络直播营销的思考[J].中国宝石,2021(2):54-59.
4周志清,褚欣.普陀区城市城市建成区色彩规划与治理--以上海市普陀区为例[J].上海土地,2021(2):28-32.
5李磊,万俊峰,马生奎.氧化锌中稀散元素赋存状态的超声逐级化学提取研究[J].化工矿物与加工,2021,50(5):9-11. 被引量：1
6陈倩.水调自动化系统应用功能设计及效益分析[J].价值工程,2021,40(11):205-206.
7李国泽,邵亚林,常玮,丁勇.3种兜兰属植物叶片总RNA提取方法的研究[J].西南农业学报,2021,34(4):827-833. 被引量：2
8韦扬,陈成伟.基于Data Vault的交通行业数据仓库设计[J].西部交通科技,2021(4):189-192.
9伍阳,王丽妍,胡春霞,程亮.可变半径Alpha Shapes提取机载LiDAR点云建筑物轮廓[J].中国图象图形学报,2021,26(4):910-923. 被引量：13
10许珂,马媛,王超,张健,李谷涵.基于事件驱动的太湖流域会商与决策系统设计与实现[J].中国农村水利水电,2021(5):165-169. 被引量：4

计算机仿真

2021年第4期

浏览历史

内容加载中请稍等...

高维大数据流时间维度特征提取方法仿真被引量：4

参考文献8

二级参考文献41

共引文献152

同被引文献47

引证文献4

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

高维大数据流时间维度特征提取方法仿真 被引量：4

参考文献8

二级参考文献41

共引文献152

同被引文献47

引证文献4

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

高维大数据流时间维度特征提取方法仿真被引量：4