期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
基于语句压缩的中文语义依存分析 被引量:2
1
作者 周亮俊 向阳 《计算机应用》 CSCD 北大核心 2017年第A01期266-269,共4页
针对当前中文语义依存分析中耗时长、准确率低的问题,提出了一种基于语句压缩进行中文语义依存分析的方法。在此方案中,首先通过开源工具CRF++训练得到特定的序列化标签压缩模型,通过此模型得到任意输入句子的主干信息,并为下一步提供... 针对当前中文语义依存分析中耗时长、准确率低的问题,提出了一种基于语句压缩进行中文语义依存分析的方法。在此方案中,首先通过开源工具CRF++训练得到特定的序列化标签压缩模型,通过此模型得到任意输入句子的主干信息,并为下一步提供候选集;其次,选取原句和压缩后句子中的词性、上下文等特征,使用条件随机场对其中的语义依存关系进行识别;最后进行谓语消歧和句子回溯。实验以Co NLL 2009公开任务中的公有语料作为数据集,与传统的直接使用基于图的语义依存分析方法相比,本方案的处理时间缩短了80%,精确率提高了3.48%,综合指标提高了2.11%。 展开更多
关键词 语义依存 语句压缩 条件随机场 中文信息处理
下载PDF
基于结构化学习的语句压缩研究
2
作者 张永磊 王红玲 周国栋 《中文信息学报》 CSCD 北大核心 2013年第2期10-16,64,共8页
近年来随着各类信息的日益增多,语句压缩作为自动摘要的重要部分也越来越引起研究者的关注。然而当前针对语句压缩的研究才刚刚展开,存在压缩效果不佳、没有统一的自动评测指标等问题。该文在简单的删除单词的方法框架下,采用基于特征... 近年来随着各类信息的日益增多,语句压缩作为自动摘要的重要部分也越来越引起研究者的关注。然而当前针对语句压缩的研究才刚刚展开,存在压缩效果不佳、没有统一的自动评测指标等问题。该文在简单的删除单词的方法框架下,采用基于特征权重的最大边缘训练的结构化学习方法实现语句压缩。同时该文还提出了两种新的自动评价指标(N-Gram和BLEU)来评价语句压缩的性能。实验结果表明,采用结构化学习方法能够在保持较好压缩率的情况下保留源语句的主要信息,并且新提出的两个评价指标能够有效反映语句压缩性能。 展开更多
关键词 语句压缩 结构化学习 自动评测
下载PDF
融入显著性事件信息的标题生成方法 被引量:1
3
作者 杨冰 孙锐 姬东鸿 《计算机工程与应用》 CSCD 北大核心 2016年第24期236-240,266,共6页
标题生成任务中,现有方法多以语句或短语为基本处理单元,利用单语句压缩技术或语句合成技术来生成最终的标题。这些方法或因语句过于稀疏而缺失篇章主要信息,或因短语合成缺乏语法规则约束而导致标题可读性差。提出了一种融入显著性事... 标题生成任务中,现有方法多以语句或短语为基本处理单元,利用单语句压缩技术或语句合成技术来生成最终的标题。这些方法或因语句过于稀疏而缺失篇章主要信息,或因短语合成缺乏语法规则约束而导致标题可读性差。提出了一种融入显著性事件信息的标题生成模型。该模型首先利用互增强原则学习显著性事件,并指导生成候选语句,然后根据这些候选语句构造词图,再结合路径显著性、流畅度,以及覆盖度等因素,设计相应的排名策略生成最终的标题。在标准评测集上的实验结果表明,提出的模型相对于目前主流的方法,取得了更好的性能。 展开更多
关键词 标题生成 显著性事件 语句压缩 互增强原则
下载PDF
基于事件指导的多文档生成式摘要方法 被引量:6
4
作者 王振超 孙锐 姬东鸿 《计算机应用研究》 CSCD 北大核心 2017年第2期343-346,356,共5页
建立在理解篇章语义基础之上的生成式摘要,在思想上相对于抽取式摘要更加合理,但在具体实现上却面临语义理解、自然语言生成等难题。提出了一种以事件作为基本语义单元的生成式摘要方法,通过对事件聚类反映篇章的主题分布,并利用事件指... 建立在理解篇章语义基础之上的生成式摘要,在思想上相对于抽取式摘要更加合理,但在具体实现上却面临语义理解、自然语言生成等难题。提出了一种以事件作为基本语义单元的生成式摘要方法,通过对事件聚类反映篇章的主题分布,并利用事件指导多语句压缩生成自然语句构建摘要。通过在DUC标准数据集上进行评测,最终的ROUGE得分媲美目前主流的生成式方法,从而说明事件能够很好地承载篇章的主干信息,同时有效地指导多语句压缩过程中冗余信息的去除和自然语言的生成。 展开更多
关键词 事件 生成式 组合语义 子主题 语句压缩 多文档摘要
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部