-
题名面向互联网舆情的热词分析技术
被引量:17
- 1
-
-
作者
李渝勤
孙丽华
-
机构
北京信息科技大学
北京拓尔思信息技术股份有限公司
-
出处
《中文信息学报》
CSCD
北大核心
2011年第1期48-53,59,共7页
-
基金
国家863计划重点资助项目(2006AA010105)
国家自然科学基金资助项目(60772081)
北京市教委科技发展计划资助项目(KM200910772022)
-
文摘
热词是一种网络词汇现象,反映了某一特定时空范围内人们普遍关注的问题。该文对热词分析的两项关键技术——热词发现和热词关联技术进行了深入的研究。在热词发现阶段,首先采用命名实体识别技术和高频串统计技术进行短语串的挖掘,继而采用基础权值和波动权值两项指标进行热度权值的计算。在热词关联阶段,按热词权值高低进行热词类的划分,通过同现率的原则确定热词类之间的关联计算。该文所采用的方法已经成功应用到TRS舆情监测系统的热点发现模块。
-
关键词
热词
命名实体识别
热度计算
波动权值
词群关系
-
Keywords
hot words
named entity identification
hot degree computing
weight fluctuations
words relationship
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于聚类的热词发现与关联分析
被引量:2
- 2
-
-
作者
罗旭
欧阳纯萍
刘志明
-
机构
南华大学计算机科学与技术学院
-
出处
《现代计算机(中旬刊)》
2016年第5期56-59,68,共5页
-
基金
湖南省哲学社会科学基金(No.14YBA335)
-
文摘
提出一种将话题聚类算法应用到计算热词关联度上的方法。在热词发现阶段,通过对新闻文本的特征提取,构建向量空间模型,采用初始聚类中心优化的K-means算法,获取热点簇;在关联分析阶段,先通过热点簇计算词类别距离,再和新闻同现率,热词同现率加权累加,得到热词关联度。该方法已成功应用到南华大学舆情监测系统中,并在实际运行中获得较好的效果。
-
关键词
K-MEANS
SVM
热词
词群关系
-
Keywords
K-means Algorithm
SVM
Hot Words
Words Relationship
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-