-
题名动态多文档文摘模型
被引量:9
- 1
-
-
作者
刘美玲
郑德权
赵铁军
于洋
-
机构
教育部-微软语言语音重点实验室(哈尔滨工业大学)
东北林业大学信息与计算机工程学院
-
出处
《软件学报》
EI
CSCD
北大核心
2012年第2期289-298,共10页
-
基金
国家自然科学基金(60736014
60773069
+1 种基金
61073130)
国家高技术研究发展计划(863)(2006AA010108)
-
文摘
从网络信息的动态演化性出发,对同一话题不同时序阶段的文档集合进行识别和分析,在度量演化内容差异性的基础上实现动态性,给出了两种实现动态多文档文摘的模型,即基于矩阵子空间分析和基于文本相似度累加的动态多文档文摘模型.在此基础上,提出了高效的动态句子加权方法.TAC 2008的Update Summarization测试数据上的实验证明了所提出的动态多文档文摘模型的有效性.
-
关键词
多文档文摘
差异性分析
矩阵模型
相似度累加
动态演化
-
Keywords
multi-document summarization
otherness analysis
matrix model
similarity cumulative
dynamic evolvement
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于网络的动态多文档文摘系统框架
被引量:3
- 2
-
-
作者
刘美玲
任洪娥
于洋
郑德权
赵铁军
-
机构
东北林业大学信息与计算机工程学院
教育部-微软语言语音重点实验室(哈尔滨工业大学)
-
出处
《软件学报》
EI
CSCD
北大核心
2013年第5期1006-1021,共16页
-
基金
国家自然科学基金(60736014
60773069
+1 种基金
61073130)
国家林业行业专项(201204715)
-
文摘
在自然语言处理和计算语言学相关技术支撑下,研究基于网络的动态多文档文摘系统框架,重点描述动态多文档文摘系统框架的相关内容,介绍利用矩阵子空间方法进行动态演化建模,利用相似度和质心整体优选计算方法进行信息过滤,并利用动态流形排序方法进行句子加权的动态多文档文摘生成系统.按照多文档文摘生成步骤的划分,对3种创新的模型方法进行融合,综合起来从不同侧重点考虑,形成互补,提高系统性能.在网络环境下,此框架保证了动态演化的多文档文摘具有较高的信息新颖性和历史信息的演化性.
-
关键词
模型框架
矩阵子空间
整体优选
动态演化
-
Keywords
modeling framework
matrix subspace
integration selection
dynamic evolution
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-