-
题名基于用户影响力的热点话题检测方法研究
被引量:5
- 1
-
-
作者
裘江南
谷文静
翟劼
-
机构
大连理工大学管理与经济学部
-
出处
《情报杂志》
CSSCI
北大核心
2017年第4期156-161,共6页
-
基金
辽宁省社会科学规划基金重点项目"突发事件网络舆情的动态监测与预警策略研究"(编号:L15AGL017)
国家自然科学基金项目"在线知识社区中社会系统与知识系统协同序化机制和规律研究"(编号:71573030)的研究成果之一
-
文摘
[目的/意义]对微博消息进行热点话题挖掘,进而从海量微博文本中实时找出用户关注、讨论的热点事件,是进行舆情监测、应急管理的基础。然而,现有微博热点话题检测研究却大多忽略了不同影响力用户对话题产生及传播的作用,并且检测结果直观性较差。针对此问题,提出了基于用户影响力的热点话题检测方法。[方法/过程]首先识别用户特征要素,构建用户影响力模型,计算用户影响力;然后,综合考虑主题词影响力、影响力增长速度和增长斜率,提出基于用户影响力的微博热点话题主题词抽取方法,抽取主题词簇;之后,识别核心主题词并进行热点话题关键词抽取。最后,通过实验验证方法的有效性。[结果/结论]实验结果表明:基于用户影响力的热点话题检测方法能够有效识别并直观表达出检测时间窗口内的典型热点话题;该方法能有效提升实证性热点话题识别效率,减少娱乐性热点话题的识别;通过对不同时间窗口内同一话题的关键词抽取,可以实现对相应话题的热点跟踪。
-
关键词
抽取.最后
通过实验验证方法的有效性.[结果/结论]实验结果表明:基于用户影响力的热点话题检测方法能够有效识别并直观表达出检测时间窗口内的典型热点话题
该方法能有效提升实证性热点话题识别效率
减少娱乐性热点话题的识别
通过对不同时间窗口内同一话题的关键词抽取
可以实现对相应话题的热点跟踪.
-
Keywords
topic mining
user influence
Micro-blog
text mining
-
分类号
TP39
[自动化与计算机技术—计算机应用技术]
-
-
题名话题跟踪研究
被引量:2
- 2
-
-
作者
李树平
范书平
李胜东
司巧梅
曹英
-
机构
牡丹江师范学院计算机科学与技术系
廊坊燕京职业技术学院计算机工程系
-
出处
《微计算机信息》
2012年第10期273-274,267,共3页
-
基金
基金颁发部门:黑龙江省教育厅
项目名称:话题跟踪关键技术研究(2011.1-2012.12)
+1 种基金
基金项目编号:(12511580)
基金申请人:李树平
-
文摘
本文介绍了话题检测与跟踪评测方法,论述了话题跟踪的研究背景和国内外研究现状,分析了话题跟踪的相关基本概念,总结了话题/报道表示关键技术和话题跟踪关键技术常用的方法,并对比了这些方法的优缺点,发现话题跟踪具有广泛的应用价值和较高的学术价值,提出了未来的话题跟踪研究要关注话题本身的特性,比如小规模语料,时间特性。
-
关键词
话题
话题
报道模型
话题跟踪关键技术
话题检测与跟踪评测方法
-
Keywords
Topic
Topic / report model
Key technology for topic tracking
Topic detection and tracking evaluation methods
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名基于话题检测的自适应增量K-means算法
被引量:6
- 3
-
-
作者
李胜东
吕学强
施水才
孙军
-
机构
廊坊燕京职业技术学院计算机工程系
北京信息科技大学网络文化与数字传播北京市重点实验室
北华航天工业学院
-
出处
《中文信息学报》
CSCD
北大核心
2014年第6期190-193,共4页
-
基金
网络文化与数字传播北京市重点实验室开放课题(ICDD201105
ICDD201205
+3 种基金
ICDD201401)
国家自然科学基金项目(61271304)
北京市教委科技发展计划重点项目暨北京市自然科学基金B类重点项目(KZ201311232037)
2013年河北省高等学校科学技术研究自筹资金项目(Z2013162)
-
文摘
根据话题检测任务的定义和特点,本文分析了传统的增量聚类算法和K-means算法的优缺点,提出了基于话题检测的自适应增量K-means算法,设计了话题检测实验,实验结果证明了该算法提高了话题检测性能,具有良好的应用前景。
-
关键词
话题检测
增量聚类
K-MEANS算法
话题检测与跟踪评测
-
Keywords
topic detection
incremental clustering
K-means algorithm
topic detection and tracking evaluation method
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于缩略语分析的中文报道关系识别研究
- 4
-
-
作者
王凤玲
-
机构
菏泽学院计算机与信息工程系
-
出处
《计算机工程》
CAS
CSCD
北大核心
2011年第18期164-166,共3页
-
文摘
分析中文缩略语的构词方式,定义2个词之间的词形相似度,提出一种基于最长字符串匹配的相似度计算方法,探讨该方法在中文报道关系识别系统中的应用。实验结果表明,该相似度计算方法能够改善中文报道关系识别系统的性能,使系统的归一化检测开销降低12.96%,取得较好的识别效果。
-
关键词
报道关系识别
话题检测与跟踪
缩略语
归一化检测开销
相似度计算方法
-
Keywords
report link recognition
topic detection and tracking
abbreviation
normalized detection cost
similarity computation method
-
分类号
N945
[自然科学总论—系统科学]
-