期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
基于Spark的旅游舆情热点发现方法研究
下载PDF
职称材料
导出
摘要
传统的基于BTM的话题发现方法未考虑大数据条件下,海量短文本中热点话题发现存在的时效性限制问题。基于Spark计算框架、BTM模型和K-means算法,提出了并行旅游舆情热点话题发现算法,通过对旅游评论、微博短文本集的词对生成、文档-话题分布矩阵、文档相似度计算及聚类过程进行基于Spark框架的并行化,缩短了热点话题的发现时间,提高了实时性。实验结果显示本算法加速比和扩展性相比单一BTM模型能进一步提升,适用于旅游舆情热点话题发现的应用需求。
作者
黄凌子
机构地区
三峡大学计算机与信息学院
出处
《信息系统工程》
2023年第1期14-17,共4页
关键词
并行计算
话题模型
短文本
聚类
NLP
分类号
F592 [经济管理—旅游管理]
TP391.1 [自动化与计算机技术—计算机应用技术]
引文网络
相关文献
节点文献
二级参考文献
29
参考文献
4
共引文献
49
同被引文献
0
引证文献
0
二级引证文献
0
参考文献
4
1
李卫疆,王真真,余正涛.
基于BTM和K-means的微博话题检测[J]
.计算机科学,2017,44(2):257-261.
被引量:13
2
王亚民,胡悦.
基于BTM的微博舆情热点发现[J]
.情报杂志,2016,35(11):119-124.
被引量:27
3
王舒漫,李爱萍,段利国,付佳,陈永乐.
基于BTM的物联网服务发现方法[J]
.计算机应用,2020,40(2):459-464.
被引量:2
4
王全民,胡德程.
基于Spark的K-means快速聚类算法的优化[J]
.计算机仿真,2022,39(3):344-349.
被引量:15
二级参考文献
29
1
黄承慧,印鉴,侯昉.
一种结合词项语义信息和TF-IDF方法的文本相似度量方法[J]
.计算机学报,2011,34(5):856-864.
被引量:222
2
陈光平,王文鹏,黄俊.
一种改进初始聚类中心选择的K-means算法[J]
.小型微型计算机系统,2012,33(6):1320-1323.
被引量:40
3
路荣,项亮,刘明荣,杨青.
基于隐主题分析和文本聚类的微博客中新闻话题的发现[J]
.模式识别与人工智能,2012,25(3):382-387.
被引量:67
4
路永和,李焰锋.
改进TF-IDF算法的文本特征项权值计算方法[J]
.图书情报工作,2013,57(3):90-95.
被引量:54
5
唐晓波,王洪艳.
基于潜在狄利克雷分配模型的微博主题演化分析[J]
.情报学报,2013,32(3):281-287.
被引量:27
6
柏建普,田芳.
基于语义分析的微博热点话题发现技术研究[J]
.内蒙古科技大学学报,2013,32(3):283-286.
被引量:3
7
王振振,何明,杜永萍.
基于LDA主题模型的文本相似度计算[J]
.计算机科学,2013,40(12):229-232.
被引量:97
8
熊祖涛.
基于稀疏特征的中文微博短文本聚类方法研究[J]
.软件导刊,2014,13(1):133-135.
被引量:4
9
周鹏,蔡淑琴,石双元,王伟.
基于关键词抽取的微博舆情事件内容聚合[J]
.情报杂志,2014,33(1):91-96.
被引量:17
10
阮光册.
基于LDA的网络评论主题发现研究[J]
.情报杂志,2014,33(3):161-164.
被引量:41
共引文献
49
1
徐建民,张丽青,王苗.
基于贝叶斯网络的静态话题追踪模型[J]
.数据分析与知识发现,2020,4(2):200-206.
被引量:2
2
姜耀明,李桓.
工业建筑设计应在限制中求发展[J]
.工业建筑,2000,30(4):24-26.
3
李少华,李卫疆,余正涛.
基于GV-LDA的微博话题检测研究[J]
.软件导刊,2018,17(2):131-135.
被引量:3
4
贾隆嘉,张邦佐.
高校网络舆情安全中主题分类方法研究——以新浪微博数据为例[J]
.数据分析与知识发现,2018,2(7):55-62.
被引量:5
5
纪雪梅,徐新然.
结合用户位置信息的社交媒体话题空间分布研究[J]
.情报资料工作,2018,39(5):41-49.
6
黄晓辉,王成,何雄,曾辉.
基于演化聚类的社交媒体舆情分析方法综述[J]
.科学技术与工程,2018,18(29):154-161.
被引量:5
7
徐建国,韩青君,李青.
K-means聚类算法及其在网络舆情中的应用[J]
.软件导刊,2018,17(11):65-67.
被引量:1
8
曹彦波.
基于新浪微博的2018年云南通海5.0级地震舆情时空特征分析[J]
.地震研究,2018,41(4):525-533.
被引量:16
9
黄畅,郭文忠,郭昆.
面向微博热点话题发现的改进BBTM模型研究[J]
.计算机科学与探索,2019,13(7):1102-1113.
被引量:4
10
陈凤,蒙祖强.
基于BTM和加权K-Means的微博话题发现[J]
.广西师范大学学报(自然科学版),2019,37(3):71-78.
被引量:2
1
李蒙,郭明成,邱勇,张书,张泽军,陈闯,高谦.
学生结核病传播特点:一项12年的全人群前瞻性分子流行病学研究[J]
.中华结核和呼吸杂志,2023,46(1):19-26.
被引量:1
2
尚晓燕.
基于话题标签的微博舆情热点挖掘系统设计[J]
.现代电子技术,2023,46(2):70-74.
3
娄艳雪,余奇敏.
新媒体语境下“媛”被污名化传播之反思[J]
.新闻前哨,2023(1):66-68.
4
蔡宇翔,王佳斌,郑天华.
基于知识图谱的医疗问答系统设计及算法并行化[J]
.科技与创新,2023(5):22-24.
5
小幽默4则[J]
.领导文萃,2021(3):106-106.
6
张亚娟,孙如浩,张汝峰,滕岳,张喜英.
基于Python的新浪微博舆情监控系统设计[J]
.计算机应用文摘,2023,39(2):45-48.
7
如何检索引用《中国矫形外科杂志》及文献格式[J]
.中国矫形外科杂志,2023,31(1):77-77.
8
林水杰,郭银枞,傅木海,沈祈远.
探讨预防性肠造口在低位直肠癌保肛手术中的临床意义[J]
.中文科技期刊数据库(引文版)医药卫生,2022(5):110-115.
9
颜嫦嫦,聂亮,王晨诚,李亦奇,袁晓月,彭少杰.
现制现售即食食品安全问题及监管对策研究[J]
.食品工业,2022,43(12):323-326.
被引量:3
10
朱开.
基于改进YOLOv5的交通标志识别模型[J]
.信息技术与信息化,2023(2):30-33.
被引量:3
信息系统工程
2023年 第1期
职称评审材料打包下载
相关作者
内容加载中请稍等...
相关机构
内容加载中请稍等...
相关主题
内容加载中请稍等...
浏览历史
内容加载中请稍等...
;
用户登录
登录
IP登录
使用帮助
返回顶部