-
题名基于高质量信息提取的微博自动摘要
被引量:7
- 1
-
-
作者
彭敏
高斌龙
黄济民
刘纪平
-
机构
武汉大学计算机学院
武汉大学深圳研究院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2015年第7期36-42,共7页
-
基金
国家自然科学基金资助项目(61070083)
2013年深圳知识创新计划基金资助项目
-
文摘
是获取微博平台关键信息的一种重要手段。现有面向微博的自动摘要方法较关注文本集合中句子或者关键词的提取,而在去除冗余信息、内容噪声方面缺乏有效手段,导致提取的微博内容质量不高。为解决该问题,以微博平台为研究对象,提出一种基于时频域转换的信息提取方法,获得与某话题相关度高、冗余度低且信息量大的高质量微博文本,将综合分值较高的微博作为生成摘要的样本集合,并对该样本集合中每条微博的句子进行权重打分,选取权值较高的句子组成微博摘要。实验结果表明,该方法能够有效过滤冗余信息和内容噪声,基于自动评测和人工评测的摘要结果均优于现有自动摘要方法。
-
关键词
微博自动摘要
冗余去除
信息提取
自动评测
人工评测
-
Keywords
microblog automatic summarization
redundancy removal
information extraction
automatic evaluation
manual evaluation
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-