-
题名基于熵值的网络论坛热点话题发现
被引量:10
- 1
-
-
作者
孙永利
李东
张玥
-
机构
哈尔滨工业大学计算机网络与信息安全技术研究中心
-
出处
《计算机工程》
CAS
CSCD
2014年第6期312-316,共5页
-
基金
国家"863"计划基金资助项目(2012AA012506
2011AA010705)
+2 种基金
国家自然科学基金资助项目(61173145)
国家"973"计划基金资助项目(2011CB302605)
国家科技支撑计划基金资助项目(2012BAH37B01)
-
文摘
针对网络论坛热点话题的识别、发现和舆情监测问题,提出一种基于热度熵值的热点话题发现方法。通过网络爬虫抓取网络论坛中的数据,在对数据进行预处理和分析热点话题属性特征的基础上,合理定义各属性的权重和话题的热度熵值,并以此对话题的热点信息进行分析、统计与评估,从而发现和追踪网络论坛中的热点话题。同时,对话题的热度进行细致划分和各种类型的定义,采用不同阈值策略计算不同类型的热度信息标注的准确率。实验结果表明,该方法合理、有效,相比于传统的话题语义分析方法具有较高的准确率,可作为互联网论坛舆情监测的依据。
-
关键词
网络论坛
话题发现
属性特征
热度熵值
热点话题追踪
舆情监测
-
Keywords
network forum
topic foundation
attribute characteristics
heat entropy
hot topics tracking
public opinion monitoring
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-