-
题名网络舆情信息提取技术研究与实现
被引量:4
- 1
-
-
作者
刘华春
王星捷
-
机构
成都理工大学工程技术学院
-
出处
《计算机技术与发展》
2016年第9期8-11,共4页
-
基金
四川省自然科学重点项目(A22012003)
四川省乐山市科技局重点项目(14GZD050)
-
文摘
网络舆情信息提取是舆情分析系统中最为关键的部分,是实现舆情分析、舆情统计的数据基础。为此,设计和实现了一个基于话题线索的舆情信息提取方案。该方案将舆情页面以话题为线索进行逻辑划分;采用基于DOM树的广度优先搜索方法,设计了舆情信息提取算法;通过设置最低重复话题阈值θ,用户定制提取格式,信息去重去噪措施,实现了舆情信息的有效提取。通过对多个论坛舆情信息的提取实验,结果表明,所设计的方案有很好的提取性能,召回率、正确率、F指数都较高,能够很好地提取出论坛、评论等舆情信息。
-
关键词
舆情信息
WEB信息提取
话题线索
doc树
-
Keywords
public opinion information
Web information extraction
topic clues
doc tree
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-