-
题名融合多信息句子图模型的多文档摘要抽取
被引量:2
- 1
-
-
作者
蒋亚芳
严馨
徐广义
周枫
邓忠莹
-
机构
昆明理工大学信息工程与自动化学院
昆明理工大学云南省人工智能重点实验室
云南南天电子信息产业股份有限公司
-
出处
《计算机工程与科学》
CSCD
北大核心
2020年第3期535-542,共8页
-
基金
国家自然科学基金(61462055,61562049)。
-
文摘
针对现有多文档抽取方法不能很好地利用句子主题信息和语义信息的问题,提出一种融合多信息句子图模型的多文档摘要抽取方法。首先,以句子为节点,构建句子图模型;然后,将基于句子的贝叶斯主题模型和词向量模型得到的句子主题概率分布和句子语义相似度相融合,得到句子最终的相关性,结合主题信息和语义信息作为句子图模型的边权重;最后,借助句子图最小支配集的摘要方法来描述多文档摘要。该方法通过融合多信息的句子图模型,将句子间的主题信息、语义信息和关系信息相结合。实验结果表明,该方法能够有效地改进抽取摘要的综合性能。
-
关键词
多文档摘要
句子贝叶斯主题模型
词向量
句子图模型
最小支配集
-
Keywords
multi-document summarization
sentence Bayesian theme model
word vector
sentence graph model
minimum dominating set
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名基于增量图聚类的动态多文档摘要算法
被引量:2
- 2
-
-
作者
郭海蓉
张晖
赵旭剑
李波
杨春明
-
机构
西南科技大学计算机科学与技术学院
-
出处
《计算机应用研究》
CSCD
北大核心
2016年第7期2034-2038,共5页
-
基金
四川省教育厅资助项目(14ZB0113)
西南科技大学博士基金资助项目(12zx7116)
-
文摘
目前的动态文摘方法几乎都基于文档批处理机制,无法适应实际应用中表现为不稳定数据流的文档数据,因此无法满足实时更新摘要的需求。针对上述问题,提出了一种基于K近邻句子图模型的动态文本摘要方法。根据K近邻规则构建一个双层句子图模型,用基于密度划分的增量图聚类方法对句子进行子主题划分,最后结合时间因素提高句子新颖度来抽取动态文摘。该方法能基于文档数据流增量式地抽取动态文摘,实现文摘内容的实时更新。在TAC2008和TAC2009的update summarization数据集上的实验结果显示了该方法在动态文摘抽取上的有效性。
-
关键词
动态文摘
K近邻
句子图模型
增量图聚类
-
Keywords
update summarization
K-nearest neighbors
sentence graph model
incremental graph clustering
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
TP301.6
[自动化与计算机技术—计算机系统结构]
-