-
题名基于超图的多文档新闻关键词抽取
- 1
-
-
作者
范泽泉
赖华
-
机构
昆明理工大学信息工程与自动化学院
昆明理工大学信息处理重点实验室
-
出处
《计算机与数字工程》
2017年第12期2474-2478,共5页
-
文摘
新闻作为网络信息传播的重要载体,其本质是一个以接近真相为目标的持续过程。随着时间的推进,针对同一新闻事件会出现大量详尽程度不同的网页。如何在这些网页中快速、准确地抽取出这一系列新闻的关键信息成了一个越来越重要的课题。关键词作为对文章内容的简要概括,可以使用户快速了解新闻事件,从而节省大量的时间,因此关键词抽取技术被认为是解决此类问题的关键。文章通过分析新闻网页的特点,提出一种新的基于超图模型的多文档关键词抽取方法,该方法以词作为节点,新闻网页作为超边,并结合网页信任度、新闻发布时间因素,建立了多新闻文档的超图模型,最后使用超图排序算法抽取出关键词。实验的结果验证了该方法的准确性。
-
关键词
多文档超图模型
超图排序
随机游走
关键词抽取
网页信任度
时间因素
-
Keywords
extraction
web-trust
time factor
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-