-
题名基于条件熵和上下文邻近度的句子排序研究
被引量:2
- 1
-
-
作者
薛涛
王恒
-
机构
西安工程大学计算机科学学院
-
出处
《计算机应用研究》
CSCD
北大核心
2017年第9期2680-2684,共5页
-
文摘
句子排序是多文档摘要系统中重要的任务之一,排序的质量将直接影响摘要的连贯性与可读性。当前基于时间的句子排序算法过度依赖文档的时间标签,通用性较差;基于大型语料库的句子排序算法训练过于复杂,排序质量不高。对此,提出一种基于主题文档集合的排序算法,其目的是解决不含时间标签的摘要句子排序问题。算法利用条件熵和上下文邻近度算法从源文档集合中学习句子对的关联程度与承接关系,并利用最大权值删减排序算法形成最终的排序结果。该方法只依赖于摘要句子的源文档集合,具有较强的领域通用性。实验结果表明,在现有的句子排序策略中,此方法较优。
-
关键词
条件熵邻近度
上下文邻近度
最大权值删减排序
多文档摘要
-
Keywords
conditional entropy adjacent degree
context adjacent degree
maximum weight pruning ordering
multi-docu- ment summarization
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-