基于多视角聚类模型的微博文本数据挖掘算法研究被引量：2

Data Mining Algorithm Based on Multi-view Clustering Model

下载PDF

导出

摘要本文提出了一种能够同时考虑关键词和发生时间的新型算法。该算法首先对数据预处理后,建立微博事件集合的LDA模型,生成主题词集合作为事件的描述标志,通过DTW算法对事件关键词间的语义、时序相似度进行计算,得到对应的相似度矩阵,最后采用协同训练普聚类方法,迭代生成最终的特征向量并完成事件选取。仿真实验结果表明,本文提出的算法同以往算法相比具有准确率高以及效率高的特点。 This paper proposes a new algorithm can simultaneously consider keywords and time, the algorithm firstly after data preprocessing, weibo event collection of LDA model, generates keywords set as the symbol, the description of the event by DTW algorithm for event keyword semantic, sequence similarity calculation, get the corresponding similarity matrix, finally USES the clustering method, the joint training where the iteration to produce the final feature vector and complete the event selection. The simulation results show that the proposed algorithm has high accuracy and efficiency compared with previous algorithms.

作者陈兰兰胡细玲

机构地区江西财经职业学院信息工程学院

出处《科技通报》北大核心 2017年第11期129-132,共4页 Bulletin of Science and Technology

关键词微博文本文本数据挖掘多视角相似矩阵 micro-blog text data mining multiple points of view similar matrix

分类号 TP301.6 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献1

1方加娟.基于多特征融合的Web图像聚类算法[J].科技通报,2013,29(8):97-99. 被引量：4

二级参考文献4

1S Gordon,H Greenspan and J Goldberger.Applying theinformation bottleneck principle to unsupervised cluster-ing of discrete and continuous image representations[C]//.In proc.of IEEE ICCV,2003.
2A K Jain,M N Murty and P J Flynn.Data clustering:a re-view[J].ACM Comput.Surv,1999,31(3):264-323.
3G.Qiu.Image and feature co-clustering[C]//.In proc.ofIEEE ICPR,2004.
4乌岚.基于多样约束模型的远程教育数据库优化查询算法[J].科技通报,2013,29(1):154-156. 被引量：35

共引文献3

1乔木,王天顺,裴洪文.一种基于约束蚁群反馈算法钢坯图像分割技术[J].科技通报,2014,30(2):173-175.
2何玉新.增广链修复下大数据并行搜索聚类算法[J].科技通报,2016,32(3):109-113. 被引量：5
3尚淑玲,马妮娜,周祎.Map任务对分片网络资源调度的弊端与改进[J].科技通报,2016,32(4):130-133. 被引量：2

同被引文献20

1邓芳.大型物联网电子设备的海量数据高效挖掘方法研究[J].现代电子技术,2016,39(4):159-162. 被引量：18
2钱冬梅,范春树.通信网络大数据挖掘智能加速算法研究[J].激光杂志,2016,37(3):132-135. 被引量：4
3荣盘祥,曾凡永,黄金杰.数据挖掘中特征选择算法研究[J].哈尔滨理工大学学报,2016,21(1):106-109. 被引量：14
4黄潮.云计算环境下的海量光纤通信故障数据挖掘算法研究[J].激光杂志,2017,38(1):96-100. 被引量：37
5张新文,王佳.基于可逆矩阵加密技术的保密通信数学模型[J].西南师范大学学报（自然科学版）,2017,42(2):166-170. 被引量：10
6辛焦丽.强噪声海量物联网数据处理中节点选择算法研究[J].科学技术与工程,2017,17(17):283-287. 被引量：3
7杨晓波.基于投影模式支持集的数据挖掘算法研究[J].计算机应用与软件,2017,34(7):273-276. 被引量：3
8李晓峰.基于视频大数据的道路交通数据信息价值挖掘模型的研究[J].微型电脑应用,2017,33(12):18-21. 被引量：4
9周坚,石永革,何美斌.基于A-D模型的K-means算法在通话异常客户挖掘中的应用[J].电信科学,2018,34(4):81-89. 被引量：4
10王艳,王慧.基于快速Spark人工智能架构的大数据挖掘算法[J].黑龙江工业学院学报（综合版）,2018,18(5):85-89. 被引量：7

引证文献2

1刘静瑞,潘东阳.基于数学模型的通信数据智能挖掘加速算法[J].数字通信世界,2019,0(9):131-131. 被引量：1
2刘锐,梁奎宁,黄骏.海量非结构化物联网数据深度挖掘算法研究[J].电子设计工程,2020,28(16):26-29. 被引量：3

二级引证文献4

1韩志峰,白雪冰,蒋龙泉,黄云刚,冯瑞.音视频大数据样本库入库规范[J].微型电脑应用,2021,37(7):27-30. 被引量：1
2赵娜,段志霞.基于数学模型算法预测计量标准稳定性策略研究[J].电子测试,2022,36(14):36-38.
3周小明,郭晶,王磊,李广翱.基于深度挖掘的多维动态数据权限管控系统[J].电子设计工程,2022,30(18):16-19.
4董昕伟,冉从勇.国际贸易标准化声音图像数据在海关监管中的应用探索[J].中国口岸科学技术,2024,6(7):18-23.

1廖志勇.多兵种协同训练[J].兵器知识,2017,0(11).
2王日升,谢红薇,安建成.基于分类精度和相关性的随机森林算法改进[J].科学技术与工程,2017,17(20):67-72. 被引量：14
3孙正国.专家点评亮分[J].语文教学与研究（教研天地）,2017,0(10):37-37.
4赵磊,周亦敏.一种基于改进DTW-IMP算法的手势识别[J].软件导刊,2017,16(11):12-15. 被引量：2
5李慧慧.基于共词分析法的我国产业结构研究热点解析[J].湖北经济学院学报,2017,15(6):42-47.
6曹戈利.加强幼儿园课程游戏化教学的策略初探[J].考试周刊,2017,0(49):176-176. 被引量：6
7吴问足,乔颖,鲁宗相,汪宁渤,周强.风电功率概率预测方法及展望[J].电力系统自动化,2017,41(18):167-175. 被引量：65
8赵剑,吴小俊,董文华.局部约束加强的最小二乘回归子空间聚类[J].模式识别与人工智能,2017,30(10):943-951. 被引量：2
9李秀霞,宋凯,赵思喆,周娜.国内外教育大数据研究现状对比分析[J].现代情报,2017,37(11):125-129. 被引量：10
10朱卫星,徐伟光,何红悦,李雯.文本数据主题挖掘与关联搜索研究[J].计算机科学,2017,44(B11):411-413. 被引量：6

科技通报

2017年第11期

浏览历史

内容加载中请稍等...

基于多视角聚类模型的微博文本数据挖掘算法研究被引量：2

参考文献1

二级参考文献4

共引文献3

同被引文献20

引证文献2

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

基于多视角聚类模型的微博文本数据挖掘算法研究 被引量：2

参考文献1

二级参考文献4

共引文献3

同被引文献20

引证文献2

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

基于多视角聚类模型的微博文本数据挖掘算法研究被引量：2