-
题名一种基于主题词集的自动文摘方法
被引量:6
- 1
-
-
作者
刘兴林
郑启伦
马千里
-
机构
华南理工大学计算机科学与工程学院
五邑大学计算机学院
-
出处
《计算机应用研究》
CSCD
北大核心
2011年第4期1322-1324,共3页
-
基金
广东省自然科学基金资助项目(9451064101003233)
华南理工大学中央高校基本科研业务费专项资金资助项目(2009ZM0125
+1 种基金
2009ZM0189
2009ZM0255)
-
文摘
提出一种基于主题词集的文本自动文摘方法,用于自动提取文档文摘。该方法根据提取到的主题词集,由主题词权重进行加权计算各主题词所在的句子权重,从而得出主题词集对应的每个句子的总权重,再根据自动文摘比例选取句子权重较大的几个句子,最后按原文顺序输出文摘。实验在哈工大信息检索研究室单文档自动文摘语料库上进行,使用内部评测自动评估方法对获得的文摘进行评价,总体F值达到了66.07%。实验结果表明,该方法所获得的文摘质量高,较接近于参考文摘,取得了良好的效果。
-
关键词
自动文摘
主题词集
句子权重
自然语言处理
-
Keywords
automatic summarization
thematic term set
sentence weight
NLP
-
分类号
TP301
[自动化与计算机技术—计算机系统结构]
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于词向量技术与主题词特征的微博立场检测
被引量:7
- 2
-
-
作者
郑海洋
高俊波
邱杰
焦凤
-
机构
上海海事大学信息工程学院
-
出处
《计算机系统应用》
2018年第9期118-123,共6页
-
文摘
微博话题随着移动互联网的发展变得火热起来,单个热门话题可能有数万条评论,微博话题的立场检测是针对某话题判断发言人对该话题的态度是支持的、反对的或中立的.本文一方面由Word2Vec训练语料库中每个词的词向量获取句子的语义信息,另一方面使用Text Rank构建主题集作为话题的立场特征,同时结合情感词典获取句子的情感信息,最后将特征选择后的词向量使用支持向量机对其训练和预测完成最终的立场检测模型.实验表明基于主题词及情感词相结合的立场特征可以获得不错的立场检测效果.
-
关键词
主题词集
立场检测
主题词特征
词向量
立场特征
-
Keywords
stance detection
thematic words feature
word embedding
stance feature
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-