基于热度联合排序的微博热点话题发现被引量：6

Micro-Blog Hot Topic Detection Based on Heat Co-ranking

下载PDF

导出

摘要微博热点话题发现对于舆情分析和观点挖掘具有重要作用,提出了一种基于热度联合排序的微博热点话题发现方法,并构建统一的模型框架将微博文本和热点主题词之间的各种关系进行了有机融合;考虑微博用户的权威性以及主题词的时间段相关特性,对微博文本和主题词的热度进行了联合排序并互相增强;使用主题词组合支持度作为阈值对热度序列中的主题词进行聚类以表征热点话题。实验表明,所提方法对于热点主题词的抽取以及热点话题发现具有较高准确性,可以及时有效地发现特定时间段内的微博热点话题。 Micro-blog hot topic detection plays an important role in public opinion analysis and opinion mining. In order to reduce the impact of data sparsity on topic detection, this paper proposes an approach for micro- blog hot topic detection based on heat co-ranking, builds a unified model framework to organically integrate all relationships between micro-blog texts and topic keywords. The authority of micro-blog user and the time-related characteristics of topic keywords are simultaneously considered, and the heat of micro-blog texts and topic keywords gets mutual reinforcement and co-ranking. Topic keywords in hot sequence are clustered by using the combination support confidence as a threshold. The experimental results show that the proposed method has high accuracy for hot keywords extraction and hot topic detection, can effectively discover micro-blog hot topics in a specific period.

作者刘培玉侯秀艳朱振方刘芳蔡肖红

机构地区山东师范大学信息科学与工程学院山东省分布式计算机软件新技术重点实验室山东交通学院信息科学与电气工程学院

出处《计算机科学与探索》 CSCD 北大核心 2016年第4期573-581,共9页 Journal of Frontiers of Computer Science and Technology

基金国家自然科学基金No.61373148 国家社科基金No.12BXW040 山东省优秀中青年科学家奖励基金No.BS2013DX033 山东省自然科学基金No.ZR2012FM038 教育部人文社科基金No.14YJC860042 山东省社科规划项目No.12BXWJ01~~

关键词微博文本联合排序热度序列 micro-blog text co-ranking heat sequence

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献6

1丁兆云,贾焰,周斌.微博数据挖掘研究综述[J].计算机研究与发展,2014,51(4):691-706. 被引量：122
2李劲,张华,吴浩雄,向军.基于特定领域的中文微博热点话题挖掘系统BTopicMiner[J].计算机应用,2012,32(8):2346-2349. 被引量：26
3薛素芝,鲁燃,任圆圆.基于速度增长的微博热点话题发现[J].计算机应用研究,2013,30(9):2598-2601. 被引量：17
4郑斐然,苗夺谦,张志飞,高灿.一种中文微博新闻话题检测的方法[J].计算机科学,2012,39(1):138-141. 被引量：84
5杨亮,林原,林鸿飞.基于情感分布的微博热点事件发现[J].中文信息学报,2012,26(1):84-90. 被引量：64
6吴琼,谭松波,许洪波,段洣毅,程学旗.基于随机游走模型的跨领域倾向性分析研究[J].计算机研究与发展,2010,47(12):2123-2131. 被引量：11

二级参考文献177

1Pang B,Lee L,Vaithyanathan S.Thumbs up? Sentiment classification using machine learning techniques[C]//Proc of EMNLP 2002.Morristown,NJ,USA:ACL,2002:79-86.
2Ku L,Liang Y,Chen H.Opinion extraction,summarization and tracking in news and blog corpora[C]//Proc of AAAI 2006.Boston,Massachusetts:ACL,2006.
3赵军,许洪波,黄萱菁,等.中文倾向性分析评测技术报告[R].北京:中文信息学会,2008.
4Aue A,Gamon M.Customizing sentiment classifiers to new domains:A case study[C]//Proc of RANLP 2005.Borovets,Bulgaria:RANLP,2005.
5Blitzer J,Dredze M,Pereira F.Biographies,bollywood,boom-boxes and blenders:Domain adaptation for sentiment classification[C]//Proc of ACL 2007.Prague,Czech Republic:ACL,2007:440-447.
6Tan S,Wang Y,Wu G,et al.Using unlabeled data to handle domain-transfer problem of semantic detection[C]//Proc of SAC 2008.New York:ACM,2008:896-903.
7Tan S,Cheng X,Wang Y,et al.Adapting nave Bayes to domain adaptation for sentiment analysis[C]//Proc of ECIR 2009.Berlin:Springer,2009:337-349.
8Gamon M,Aue A.Automatic identification of sentiment vocabulary:Exploiting low association with known sentiment terms[C]//Proc of the ACL Workshop on Feature Engineering for Machine Learning in NLP.Ann Arbor,Michigan:ACL,2005:57-64.
9Brin S,Page L,Motwami R,et al.The PageRank citation ranking:Bringing order to the Web[R].Stanford,CA:Computer Science Department,Stanford University,1999.
10Erkan G,Radev D.LexRank:Graph-based centrality as salience in text summarization[J].Journal of Artificial Intelligence Research,2004,22(1):457-479.

共引文献294

1张辉,何庆勇,惠小珊,但文超,孟培培.蒲辅周先生治疗湿证用药规律的数据挖掘研究[J].世界科学技术-中医药现代化,2021,23(9):3195-3201. 被引量：1
2张东霞.基于高校学生微博的舆情热点分析与发现[J].东南传播,2013(6):87-89. 被引量：7
3原福永,冯静,符茜茜.微博用户的影响力指数模型[J].现代图书情报技术,2012(6):60-64. 被引量：72
4赵文清,侯小可.基于词共现图的中文微博新闻话题识别[J].智能系统学报,2012,7(5):444-449. 被引量：31
5林政,谭松波,程学旗.基于情感关键句抽取的情感分类研究[J].计算机研究与发展,2012,49(11):2376-2382. 被引量：27
6文坤梅,徐帅,李瑞轩,辜希武,李玉华.微博及中文微博信息处理研究综述[J].中文信息学报,2012,26(6):27-37. 被引量：37
7唐晓波,王洪艳.基于潜在语义分析的微博主题挖掘模型研究[J].图书情报工作,2012,56(24):114-119. 被引量：31
8王君泽,马静,杜洪涛.微博舆情分析平台的框架与支撑技术研究[J].电子政务,2013(1):8-14. 被引量：2
9潘大庆.基于层次聚类的微博敏感话题检测算法研究[J].广西民族大学学报（自然科学版）,2012,18(4):56-59. 被引量：5
10程亮,邱云飞,孙鲁.微博谣言检测方法研究[J].计算机应用与软件,2013,30(2):226-228. 被引量：23

同被引文献66

1姜晓伟,王建民,丁贵广.基于主题模型的微博重要话题发现与排序方法[J].计算机研究与发展,2013,50(S1):179-185. 被引量：12
2贺敏,王丽宏,杜攀,张瑾,程学旗.基于有意义串聚类的微博热点话题发现方法[J].通信学报,2013,34(S1):256-262. 被引量：12
3洪宇,张宇,刘挺,李生.话题检测与跟踪的评测及研究综述[J].中文信息学报,2007,21(6):71-87. 被引量：153
4陈仕吉,王小梅.基于C-value与TF-IDF的文献簇主题识别研究[J].情报学报,2009,28(6):821-826. 被引量：11
5肖可.h指数在学科研究热点分析中的应用——以图情学为例[J].情报杂志,2011,30(3):69-73. 被引量：15
6黄承慧,印鉴,侯昉.一种结合词项语义信息和TF-IDF方法的文本相似度量方法[J].计算机学报,2011,34(5):856-864. 被引量：222
7张晓林.颠覆数字图书馆的大趋势[J].中国图书馆学报,2011,37(5):4-12. 被引量：324
8张晨逸,孙建伶,丁轶群.基于MB-LDA模型的微博主题挖掘[J].计算机研究与发展,2011,48(10):1795-1802. 被引量：166
9郑斐然,苗夺谦,张志飞,高灿.一种中文微博新闻话题检测的方法[J].计算机科学,2012,39(1):138-141. 被引量：84
10杨亮,林原,林鸿飞.基于情感分布的微博热点事件发现[J].中文信息学报,2012,26(1):84-90. 被引量：64

引证文献6

1李慧,王丽婷.基于词项热度的微博热点话题发现研究[J].情报科学,2018,36(4):45-50. 被引量：17
2李爱军,常彤.微博热度研究现状及未来发展方向[J].山西科技,2018,33(2):8-11.
3何诺,马苗苗.一种改进的K均值微博热点话题发现方法[J].数据通信,2019(1):31-35. 被引量：4
4李秀霞,程结晶,韩霞.发文趋势与引文趋势融合的学科研究主题优先级排序——以我国情报学学科主题为例[J].图书情报工作,2019,63(11):88-95. 被引量：11
5闫俊伢,马尚才.基于文本聚类的网络微博舆情话题识别与追踪技术研究[J].重庆理工大学学报（自然科学）,2019,33(9):176-181. 被引量：7
6王哲,刘贵容,彭润亚.基于大数据分析方法的微博热点建模与预测[J].现代电子技术,2019,42(21):73-76.

二级引证文献39

1任中杰,张鹏,李思成,兰月新,夏一雪,崔彦琛.基于微博数据挖掘的突发事件情感态势演化分析——以天津8·12事故为例[J].情报杂志,2019,38(2):140-148. 被引量：53
2余本功,陈杨楠,杨颖.基于nBD-SVM模型的投诉短文本分类[J].数据分析与知识发现,2019,3(5):77-85. 被引量：13
3聂黎生.基于KPCA-粒子群随机森林算法的舆情趋势预测研究[J].现代电子技术,2019,42(15):79-82. 被引量：9
4李海明.基于SSDKmeans算法的微博热点话题发现研究[J].软件导刊,2019,18(9):173-175. 被引量：1
5应毅,黄慧,刘定一.基于PageRank的热点发现混合算法研究[J].计算机技术与发展,2019,29(9):81-85. 被引量：3
6周炜翔,张仰森,张良.面向微博热点事件的话题检测及表述方法研究[J].计算机应用研究,2019,36(12):3565-3569. 被引量：15
7李鹏飞.基于K-means聚类算法的高校图书馆用户分类及价值评价[J].电子元器件与信息技术,2019,3(9):73-76. 被引量：7
8邵作运,李秀霞.引文分析法与内容分析法结合的文献知识发现方法综述[J].情报理论与实践,2020,43(3):153-159. 被引量：29
9王楠,马千淳.基于文献计量和主题探测方法的学科评价比较研究——以中、美、英、澳四国教育学学科为例[J].情报学报,2020,39(9):1001-1010. 被引量：10
10席耀一,高鑫,王小明,云建飞.基于ETM模型的中亚国家“一带一路”网络舆情热点检测[J].情报杂志,2020,39(11):82-89. 被引量：3

1阮璐,肖冬荣,周杰,高风.利用组合支持度进行关联规则的挖掘[J].微计算机信息,2008,24(9):233-234. 被引量：3
2王永吉,杨慧中.基于K近邻的支持向量机多模型建模[J].江南大学学报（自然科学版）,2010,9(1):7-10. 被引量：4
3胡文亮.浅谈64位环境下的编程[J].黑客防线,2010(5):85-89.
4吕业,邓玉俊,杨慧中.基于类别特征提取的组合支持向量机模型[J].化工学报,2011,62(8):2164-2169. 被引量：6
5董陶,杨慧中.基于特征加权K-means聚类的多模型软测量建模[J].计算机与应用化学,2013,30(4):361-364. 被引量：3
619英寸系统的替代方案[J].流程工业,2011(18):54-55.
7红狮控制推出经ODVA认证的N-Tron系列管理型交换机以满足CIP规范要求——广泛的工业以太网产品组合帮助客户实现可靠、即插即用的CIP通信[J].国内外机电一体化技术,2016,0(5):10-10.
8混合多点内嵌式解决方案[J].今日电子,2017,0(1):94-94.
9红狮控制推出经ODVA认证的N－Tron系列管理型交换机[J].智慧工厂,2016,0(8):50-50.
10红狮控制推出经ODVA认证的N—Tron系列管理型交换机[J].流程工业,2016(17):50-50.

计算机科学与探索

2016年第4期

浏览历史

内容加载中请稍等...

基于热度联合排序的微博热点话题发现被引量：6

参考文献6

二级参考文献177

共引文献294

同被引文献66

引证文献6

二级引证文献39

相关作者

相关机构

相关主题

浏览历史

基于热度联合排序的微博热点话题发现 被引量：6

参考文献6

二级参考文献177

共引文献294

同被引文献66

引证文献6

二级引证文献39

相关作者

相关机构

相关主题

浏览历史

基于热度联合排序的微博热点话题发现被引量：6