-
题名基于语句压缩的中文语义依存分析
被引量:2
- 1
-
-
作者
周亮俊
向阳
-
机构
同济大学计算机科学与技术系
-
出处
《计算机应用》
CSCD
北大核心
2017年第A01期266-269,共4页
-
基金
国家973计划项目(2014CB340404)
国家自然科学基金资助项目(71571136)
上海市科委基础研究项目(16JC1403000)
-
文摘
针对当前中文语义依存分析中耗时长、准确率低的问题,提出了一种基于语句压缩进行中文语义依存分析的方法。在此方案中,首先通过开源工具CRF++训练得到特定的序列化标签压缩模型,通过此模型得到任意输入句子的主干信息,并为下一步提供候选集;其次,选取原句和压缩后句子中的词性、上下文等特征,使用条件随机场对其中的语义依存关系进行识别;最后进行谓语消歧和句子回溯。实验以Co NLL 2009公开任务中的公有语料作为数据集,与传统的直接使用基于图的语义依存分析方法相比,本方案的处理时间缩短了80%,精确率提高了3.48%,综合指标提高了2.11%。
-
关键词
语义依存
语句压缩
条件随机场
中文信息处理
-
Keywords
semantic dependency
sentence compression
Conditional Random Field(CRF)
Chinese information processing
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-
-
题名基于结构化学习的语句压缩研究
- 2
-
-
作者
张永磊
王红玲
周国栋
-
机构
苏州大学自然语言处理实验室
苏州大学计算机科学与技术学院
-
出处
《中文信息学报》
CSCD
北大核心
2013年第2期10-16,64,共8页
-
基金
国家自然科学基金资助项目(60970056)
江苏省高校自然科学基金资助项目(10KJB520016)
-
文摘
近年来随着各类信息的日益增多,语句压缩作为自动摘要的重要部分也越来越引起研究者的关注。然而当前针对语句压缩的研究才刚刚展开,存在压缩效果不佳、没有统一的自动评测指标等问题。该文在简单的删除单词的方法框架下,采用基于特征权重的最大边缘训练的结构化学习方法实现语句压缩。同时该文还提出了两种新的自动评价指标(N-Gram和BLEU)来评价语句压缩的性能。实验结果表明,采用结构化学习方法能够在保持较好压缩率的情况下保留源语句的主要信息,并且新提出的两个评价指标能够有效反映语句压缩性能。
-
关键词
语句压缩
结构化学习
自动评测
-
Keywords
sentence compression
structured learning
automatic evaluation
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名融入显著性事件信息的标题生成方法
被引量:1
- 3
-
-
作者
杨冰
孙锐
姬东鸿
-
机构
武汉大学计算机学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2016年第24期236-240,266,共6页
-
基金
国家社科重大招标计划项目(No.11&ZD189)
国家自然科学基金面上项目(No.61373108)
-
文摘
标题生成任务中,现有方法多以语句或短语为基本处理单元,利用单语句压缩技术或语句合成技术来生成最终的标题。这些方法或因语句过于稀疏而缺失篇章主要信息,或因短语合成缺乏语法规则约束而导致标题可读性差。提出了一种融入显著性事件信息的标题生成模型。该模型首先利用互增强原则学习显著性事件,并指导生成候选语句,然后根据这些候选语句构造词图,再结合路径显著性、流畅度,以及覆盖度等因素,设计相应的排名策略生成最终的标题。在标准评测集上的实验结果表明,提出的模型相对于目前主流的方法,取得了更好的性能。
-
关键词
标题生成
显著性事件
多语句压缩
互增强原则
-
Keywords
headline generation
salient event
multi-sentence compression
mutual reinforcement principle
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名基于事件指导的多文档生成式摘要方法
被引量:6
- 4
-
-
作者
王振超
孙锐
姬东鸿
-
机构
武汉大学计算机学院
-
出处
《计算机应用研究》
CSCD
北大核心
2017年第2期343-346,356,共5页
-
基金
国家社科重大招标计划资助项目(11&ZD189)
国家自然科学基金面上项目(61373108)
-
文摘
建立在理解篇章语义基础之上的生成式摘要,在思想上相对于抽取式摘要更加合理,但在具体实现上却面临语义理解、自然语言生成等难题。提出了一种以事件作为基本语义单元的生成式摘要方法,通过对事件聚类反映篇章的主题分布,并利用事件指导多语句压缩生成自然语句构建摘要。通过在DUC标准数据集上进行评测,最终的ROUGE得分媲美目前主流的生成式方法,从而说明事件能够很好地承载篇章的主干信息,同时有效地指导多语句压缩过程中冗余信息的去除和自然语言的生成。
-
关键词
事件
生成式
组合语义
子主题
多语句压缩
多文档摘要
-
Keywords
event
abstractive
semantic combination
sub-topic
multi-sentence compression
multi-document summariza- tion
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-