期刊文献+
共找到42篇文章
< 1 2 3 >
每页显示 20 50 100
抽取-生成式自动文本摘要技术研究综述 被引量:2
1
作者 刘迪 奚雪峰 +1 位作者 崔志明 盛胜利 《计算机技术与发展》 2023年第5期1-8,共8页
自动文本摘要技术是一项利用计算机按照某类应用自动地将文本或文本集合转换成简短摘要的信息压缩技术。在当前互联网的快速发展背景下,涌现出大量复杂的信息,导致人工无法精准捕捉有效的信息。为此,在本着更准确、更便捷、更高效地收... 自动文本摘要技术是一项利用计算机按照某类应用自动地将文本或文本集合转换成简短摘要的信息压缩技术。在当前互联网的快速发展背景下,涌现出大量复杂的信息,导致人工无法精准捕捉有效的信息。为此,在本着更准确、更便捷、更高效地收集信息为目的的前提下,利用自然语言处理中自动文本摘要技术处理复杂文本的优势将显得格外突出。随着抽取式摘要技术和生成式摘要技术的发展成熟,抽取-生成式摘要技术逐渐兴起。以技术分析为干线,对抽取-生成式摘要技术进行综述。首先,介绍了抽取-生成式摘要技术中的评价方法以及常用中英文数据集;其次,通过实例分析六类主流技术方法并对比其优缺点:基于强化学习的方法、基于信息论的方法、基于指针网络的方法、基于序列标注的方法、基于预训练的方法、基于联合注意力的方法;最后,总结了抽取-生成式摘要技术面临的挑战并展望了抽取-生成式摘要技术未来的发展方向。 展开更多
关键词 自然语言处理 自动文本摘要 抽取-生成式 评价方法 数据集
下载PDF
自动文本摘要方法 被引量:13
2
作者 江开忠 李子成 顾君忠 《计算机工程》 CAS CSCD 北大核心 2008年第1期221-223,共3页
自动文本是继信息检索之后信息或知识获取的一个重要步骤,对高质量的文档文摘十分重要。该文提出以句子为基本抽取单位,以位置和标题关键词为句子的加权特征,对句子基于潜语义聚类,提出语义结构的方法。同时给出了较为客观和有效的评价... 自动文本是继信息检索之后信息或知识获取的一个重要步骤,对高质量的文档文摘十分重要。该文提出以句子为基本抽取单位,以位置和标题关键词为句子的加权特征,对句子基于潜语义聚类,提出语义结构的方法。同时给出了较为客观和有效的评价方法。实验表明了该方法的有效性。 展开更多
关键词 自动文本摘要 语义结构 摘要评价
下载PDF
自动文本摘要研究综述 被引量:43
3
作者 李金鹏 张闯 +2 位作者 陈小军 胡玥 廖鹏程 《计算机研究与发展》 EI CSCD 北大核心 2021年第1期1-21,共21页
近年来,互联网技术的蓬勃发展极大地便利了人类的日常生活,不可避免的是互联网中的信息呈井喷式爆发,如何从中快速有效地获取所需信息显得极为重要.自动文本摘要技术的出现可以有效缓解该问题,其作为自然语言处理和人工智能领域的重要... 近年来,互联网技术的蓬勃发展极大地便利了人类的日常生活,不可避免的是互联网中的信息呈井喷式爆发,如何从中快速有效地获取所需信息显得极为重要.自动文本摘要技术的出现可以有效缓解该问题,其作为自然语言处理和人工智能领域的重要研究内容之一,利用计算机自动地从长文本或文本集合中提炼出一段能准确反映源文中心内容的简洁连贯的短文.探讨自动文本摘要任务的内涵,回顾和分析了自动文本摘要技术的发展,针对目前主要的2种摘要产生形式(抽取式和生成式)的具体工作进行了详细介绍,包括特征评分、分类算法、线性规划、次模函数、图排序、序列标注、启发式算法、深度学习等算法.并对自动文本摘要常用的数据集以及评价指标进行了分析,最后对其面临的挑战和未来的研究趋势、应用等进行了预测. 展开更多
关键词 自动文本摘要 抽取式方法 生成式方法 深度学习 ROUGE指标
下载PDF
基于自动文本摘要的中文移动简讯系统
4
作者 徐涛 《现代计算机》 2015年第20期3-5,共3页
设计一个基于自动文本摘要的中文移动简讯系统,采用自动文本分析的方式对互联网上的新闻信息进行加工提炼后生成摘要,然后推送到移动终端设备,可以有效地降低人工成本、提高新闻发布的时效。
关键词 移动简讯 移动短信 移动终端设备 自动文本摘要
下载PDF
基于领域概念图的航天新闻自动摘要模型
5
作者 黄浩宁 陈志敏 +1 位作者 徐聪 张晓燕 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2024年第1期317-327,共11页
互联网海量的航天新闻中隐含着大量航天情报信息,对其进行理解与压缩是提高后续情报分析效率的基础。然而通用的自动摘要算法往往会忽略很多航天领域关键信息,且有监督自动摘要算法需要对领域文本进行大量的数据标注,费时费力。因此,提... 互联网海量的航天新闻中隐含着大量航天情报信息,对其进行理解与压缩是提高后续情报分析效率的基础。然而通用的自动摘要算法往往会忽略很多航天领域关键信息,且有监督自动摘要算法需要对领域文本进行大量的数据标注,费时费力。因此,提出一种基于领域概念图的无监督自动摘要(DCG-TextRank)模型,利用领域术语辅助引导图排序,提高模型对领域文本的理解力。该模型分3个模块:领域概念图生成、图权重初始化、图排序及语义筛选。根据句向量相似度和领域术语库,将文本转换为包含句子节点和领域术语节点的领域概念图;根据航天新闻文本特征初始化领域概念图权值;采用TextRank模型对句子进行排序,并在语义筛选模块通过图节点聚类及设置摘要语义保留度的方法改进TextRank的输出,充分保留文本的多语义信息并降低冗余。所提模型具有领域可移植性,且实验结果表明:在航天新闻数据集中,所提模型相比传统TextRank模型性能提升了14.97%,相比有监督抽取式文本摘要模型BertSum和MatchSum性能提升了4.37%~12.97%。 展开更多
关键词 自动文本摘要 领域概念图 预训练语言模型 图排序算法 图节点聚类
下载PDF
基于深度学习的生成式文本摘要综述
6
作者 陈明轩 肖诗斌 王洪俊 《软件导刊》 2024年第5期212-220,共9页
随着互联网飞速发展,文本数据呈现指数级增长,为文档管理、文本分类、信息检索等文本处理任务带来了前所未有的挑战。研究人员虽然开发了各种基于深度学习(DL)的生成式摘要(ATS)模型,但大部分最先进的ATS模型均基于DL架构,基于DL的生成... 随着互联网飞速发展,文本数据呈现指数级增长,为文档管理、文本分类、信息检索等文本处理任务带来了前所未有的挑战。研究人员虽然开发了各种基于深度学习(DL)的生成式摘要(ATS)模型,但大部分最先进的ATS模型均基于DL架构,基于DL的生成式文本摘要领域仍缺乏全面的文献调查。为此,提供了一份基于DL的ATS的全面调查。首先概述了ATS的概念,然后总结了基于DL的ATS的典型模型及其面临的主要问题、处理方法,最后强调ATS任务中的一些开放性挑战,以及当下的热点、难点问题和未来研究趋势,以期帮助研究人员更好地了解该领域的最新进展。 展开更多
关键词 自动文本摘要 深度学习 生成式摘要 自然语言处理 自然语言生成
下载PDF
TP-AS:一种面向长文本的两阶段自动摘要方法 被引量:12
7
作者 王帅 赵翔 +2 位作者 李博 葛斌 汤大权 《中文信息学报》 CSCD 北大核心 2018年第6期71-79,共9页
随着互联网上信息的爆炸式增长,如何有效提高知识获取效率变得尤为重要。文本自动摘要技术通过对信息的压缩和精炼,为知识的快速获取提供了很好的辅助手段。现有的文本自动摘要方法在处理长文本的过程中,存在准确率低的问题,无法达到令... 随着互联网上信息的爆炸式增长,如何有效提高知识获取效率变得尤为重要。文本自动摘要技术通过对信息的压缩和精炼,为知识的快速获取提供了很好的辅助手段。现有的文本自动摘要方法在处理长文本的过程中,存在准确率低的问题,无法达到令用户满意的性能效果。为此,该文提出一种新的两阶段的长文本自动摘要方法TP-AS,首先利用基于图模型的混合文本相似度计算方法进行关键句抽取,然后结合指针机制和注意力机制构建一种基于循环神经网络的编码器—解码器模型进行摘要生成。通过基于真实大规模金融领域长文本数据上的实验,验证了TP-AS方法的有效性,其自动摘要的准确性在ROUGE-1的指标下分别达到了36.6%(词)和33.9%(字符),明显优于现有其他方法。 展开更多
关键词 自动文本摘要 自然语言处理 抽取和生成 循环神经网络
下载PDF
基于基本要素方法的中文自动文本摘要模型 被引量:2
8
作者 程倩倩 田大钢 《现代图书情报技术》 CSSCI 北大核心 2010年第2期74-78,共5页
提出一种基于基本要素方法的中文自动文本摘要模型(BESM)。该模型主要借鉴基本要素的思想进行建立,和单纯的基于词的自动文摘模型相比,它将语义信息作为评估句子重要程度的一部分,实现基本要素中提出的将语义信息和统计方法的结合。通... 提出一种基于基本要素方法的中文自动文本摘要模型(BESM)。该模型主要借鉴基本要素的思想进行建立,和单纯的基于词的自动文摘模型相比,它将语义信息作为评估句子重要程度的一部分,实现基本要素中提出的将语义信息和统计方法的结合。通过与普通方法的实例对比,突出基本要素方法的优越性和BESM模型的可行性。 展开更多
关键词 基本要素方法 BESM 中文自动文本摘要
原文传递
一种新的句子相似度度量及其在文本自动摘要中的应用 被引量:34
9
作者 张奇 黄萱菁 吴立德 《中文信息学报》 CSCD 北大核心 2005年第2期93-99,共7页
本文提出了一种新的句子相似度度量的方法并应用于文本自动摘要中。其创新处在于相似度计算不仅考虑句子中的uni gram ,还考虑了bi gram和tri gram ,通过回归方法将这几种相似度结果综合起来。实验证明这种相似度计算方法是有效的。同... 本文提出了一种新的句子相似度度量的方法并应用于文本自动摘要中。其创新处在于相似度计算不仅考虑句子中的uni gram ,还考虑了bi gram和tri gram ,通过回归方法将这几种相似度结果综合起来。实验证明这种相似度计算方法是有效的。同时本文还提出了一种新的 ,利用句子间相似度以及句子的权重的抽句式文摘算法 ,在抽取出句子的同时也去掉了冗余。DUC2 0 0 3、DUC2 0 0 4 (DocumentUnderstandingConference 2 0 0 3,2 0 0 4 )的评测结果征明了方法的有效性。我们的系统在DUC2 0 0 4的评测中列第二位。 展开更多
关键词 计算机应用 中文信息处理 文本自动摘要 向量模型 相似度计算
下载PDF
基于引文上下文的学术文本自动摘要技术研究 被引量:4
10
作者 陈海华 黄永 +1 位作者 张炯 陆伟 《数字图书馆论坛》 CSSCI 2016年第8期43-49,共7页
学术文本自动摘要是指对于给定学术文献,自动地抽取其核心内容,以提高用户撰写和阅读文献的效率。目前基于文本词频对句子重要性排序的自动摘要技术,无法从语义层面揭示学术文本的核心内容。本文在已有研究的基础上,引入引文上下文内容... 学术文本自动摘要是指对于给定学术文献,自动地抽取其核心内容,以提高用户撰写和阅读文献的效率。目前基于文本词频对句子重要性排序的自动摘要技术,无法从语义层面揭示学术文本的核心内容。本文在已有研究的基础上,引入引文上下文内容特征,并通过构建支持向量回归模型,综合考虑自动摘要系统中的各个特征对句子权重的影响,重新对句子重要性进行排序。基于WE-ROUGE的评测表明,相比于传统基于词频统计和图模型的方法,本文提出的算法能够有效提升自动摘要的准确度。 展开更多
关键词 文本自动摘要 引文上下文 支持向量回归 词向量
下载PDF
基于深度学习的文本自动摘要方案 被引量:10
11
作者 张克君 李伟男 +2 位作者 钱榕 史泰猛 焦萌 《计算机应用》 CSCD 北大核心 2019年第2期311-315,共5页
针对自然语言处理(NLP)生成式自动摘要领域的语义理解不充分、摘要语句不通顺和摘要准确度不够高的问题,提出了一种新的生成式自动摘要解决方案,包括一种改进的词向量生成技术和一个生成式自动摘要模型。改进的词向量生成技术以Skip-Gra... 针对自然语言处理(NLP)生成式自动摘要领域的语义理解不充分、摘要语句不通顺和摘要准确度不够高的问题,提出了一种新的生成式自动摘要解决方案,包括一种改进的词向量生成技术和一个生成式自动摘要模型。改进的词向量生成技术以Skip-Gram方法生成的词向量为基础,结合摘要的特点,引入词性、词频和逆文本频率三个词特征,有效地提高了词语的理解;而提出的Bi-MulRnn+生成式自动摘要模型以序列映射(seq2seq)与自编码器结构为基础,引入注意力机制、门控循环单元(GRU)结构、双向循环神经网络(BiRnn)、多层循环神经网络(MultiRnn)和集束搜索,提高了生成式摘要准确性与语句流畅度。基于大规模中文短文本摘要(LCSTS)数据集的实验结果表明,该方案能够有效地解决短文本生成式摘要问题,并在Rouge标准评价体系中表现良好,提高了摘要准确性与语句流畅度。 展开更多
关键词 自然语言处理 生成式文本自动摘要 序列映射 自编码器 词向量 循环神经网络
下载PDF
基于连续LexRank的多文本自动摘要优化算法研究 被引量:4
12
作者 曾哲军 《计算机应用与软件》 CSCD 北大核心 2013年第10期209-212,245,共5页
以挖掘性的自动摘要(TS)为研究对象,依赖于核心语句这一概念,在考虑现存相关研究成果的基础上,设计一种基于特征向量中心概念及连续LexRank、以图形表示的多文本自动摘要优化模型及算法。在此模型中,创建了一个基于内语句余弦相似度连... 以挖掘性的自动摘要(TS)为研究对象,依赖于核心语句这一概念,在考虑现存相关研究成果的基础上,设计一种基于特征向量中心概念及连续LexRank、以图形表示的多文本自动摘要优化模型及算法。在此模型中,创建了一个基于内语句余弦相似度连接矩阵以实现语句的图形表示形式对应的邻接矩阵。为了验证算法的可行性与效率,设计了相关实验方案,并通过与现存算法执行效果进行实时比对。实验结果表明,提出的带阈值及基于连续LexRank的算法具有较高的效率。 展开更多
关键词 LexRank 阈值 文本自动摘要 优化算法 数学模型
下载PDF
文本自动摘要的方法研究 被引量:1
13
作者 郭琳虹 张小松 《福建电脑》 2008年第6期50-51,共2页
文本自动摘要能够对文献进行提炼、浓缩,使人们快速准确的了解文献内容。本文介绍了文本自动摘要的原理和四种方法:基于统计的自动摘要、基于理解的自动摘要、基于信息抽取的自动摘要和基于结构的自动摘要。
关键词 文本自动摘要 统计 理解 信息抽取 结构
下载PDF
基于句子聚类的中文文本自动摘要算法的研究 被引量:1
14
作者 杨毅 《微型电脑应用》 2017年第8期54-56,共3页
在搜索引擎和新闻内容推荐等多个领域都有着非常广阔的应用。
关键词 句子聚类 主题词提取 词向量 文本自动摘要
下载PDF
自动文本摘要技术研究综述
15
作者 潘卫华 魏明月 吕青苗 《休闲》 2020年第35期0176-0176,共1页
近年来,互联网技术蓬勃发展,随之而来产生了大量数据,如何从海量数据中提取有用信息成为关键。自动文摘技术作为自然语言处理和人工智能领域的一项重要研究内容,可以有效的缓解这一问题。本文首先从文摘生成方式的角度对自动文摘的典型... 近年来,互联网技术蓬勃发展,随之而来产生了大量数据,如何从海量数据中提取有用信息成为关键。自动文摘技术作为自然语言处理和人工智能领域的一项重要研究内容,可以有效的缓解这一问题。本文首先从文摘生成方式的角度对自动文摘的典型算法进行了分析,其次简要总结了自动文摘的一些评价方法,最后指出了自动文摘目前存在的一些问题,以及对其未来的发展趋势进行了展望。 展开更多
关键词 自动文本摘要 自然语言处理 抽取式 生成式
下载PDF
基于人工免疫的Web文本自动摘要方法研究
16
作者 李士勇 《现代计算机》 2013年第10期25-28,共4页
模型,运用人工免疫算法使该模型具有较高的聚类精度和自发现能力,实验结果表明,该模型不仅能够有效对各类Web文本进行摘要,保持较低的错误肯定率和错误否定率,还具有很强的自适应性和更新能力,在算法复杂度上也具备一定优势。
关键词 人工免疫 Web文本自动摘要 克隆变异
下载PDF
一种新的基于段向量的文本自动摘要方法 被引量:4
17
作者 申强强 熊泽宇 熊岳山 《计算机工程与科学》 CSCD 北大核心 2019年第6期1064-1070,共7页
文本自动摘要技术在网页搜索和网页内容推荐等多个领域都有着非常广阔的应用前景。经典的文本摘要算法采用统计学的方法来提取文章关键字,进而提取主题句。这种方法在一定程度上忽略了文本的语义和语法信息。近年来,分布式词向量嵌入技... 文本自动摘要技术在网页搜索和网页内容推荐等多个领域都有着非常广阔的应用前景。经典的文本摘要算法采用统计学的方法来提取文章关键字,进而提取主题句。这种方法在一定程度上忽略了文本的语义和语法信息。近年来,分布式词向量嵌入技术已经应用到文本检索当中,基于该技术提出了一种词向量化的自动文本摘要方法,该方法主要分为4个步骤:词向量生成、基于词向量的段向量生成、关键词提取和主题句抽取,最终实现文本段落的自动摘要。实验结果表明,改进的文本自动摘要方法能够有效提取主题句。 展开更多
关键词 文本自动摘要 词向量 段向量 主题句
下载PDF
基于DSC的多文本自动摘要 被引量:2
18
作者 李成果 《计算机系统应用》 2014年第7期7-11,共5页
的目标是对给定的查询和多篇文本(文本集),创建一个简洁明了的摘要,要求该摘要能够表达这些文本的关键内容,同时和给定的查询相关.一个给定的文本集通常包含一些主题,而且每个主题由一类句子来表示,一个优秀的摘要应该要包含那些最重要... 的目标是对给定的查询和多篇文本(文本集),创建一个简洁明了的摘要,要求该摘要能够表达这些文本的关键内容,同时和给定的查询相关.一个给定的文本集通常包含一些主题,而且每个主题由一类句子来表示,一个优秀的摘要应该要包含那些最重要的主题.如今大部分的方法是建立一个模型来计算句子得分,然后选择得分最高的部分句子来生成摘要.不同于这些方法,我们更加关注文本的主题而不是句子,把如何生成摘要的问题看成一个主题的发现,排序和表示的问题.我们首次引入dominant sets cluster(DSC)来发现主题,然后建立一个模型来对主题的重要性进行评估,最后兼顾代表性和无重复性来从各个主题中选择句子组成摘要.我们在DUC2005、2006、2007三年的标准数据集上进行了实验,最后的实验结果证明了该方法的有效性. 展开更多
关键词 文本自动摘要
下载PDF
文本自动摘要研究进展
19
作者 韦福如 周青宇 +1 位作者 程骉 周明 《人工智能》 2018年第1期19-31,共13页
作为自然语言理解能力的重要一环,机器摘要技术一直为相关研究人员所重视。随着新闻聚合类APP、智能语音音箱和智能手机助手等产品的兴起,机器摘要技术也得到了越发广泛的应用。(Automatic Summarization)是利用计算机自动实现文本分析... 作为自然语言理解能力的重要一环,机器摘要技术一直为相关研究人员所重视。随着新闻聚合类APP、智能语音音箱和智能手机助手等产品的兴起,机器摘要技术也得到了越发广泛的应用。(Automatic Summarization)是利用计算机自动实现文本分析、内容归纳和摘要自动生成的技术。 展开更多
关键词 文本自动摘要 忠实度 摘要生成 生成式 序列到序列 注意力机制 编码器
下载PDF
基于文本类别的文本自动摘要模型 被引量:2
20
作者 谢鸣元 《电脑知识与技术》 2018年第1期206-208,共3页
目前大部分基于序列到序列生成模型的生成式摘要研究未充分考虑文本类别对于最终摘要结果的影响。然而往往同一类别的文本的摘要具有类似的格式与措辞。因此该文提出基于文本类别的文本自动摘要模型,先利用卷积神经网络对文本进行分类,... 目前大部分基于序列到序列生成模型的生成式摘要研究未充分考虑文本类别对于最终摘要结果的影响。然而往往同一类别的文本的摘要具有类似的格式与措辞。因此该文提出基于文本类别的文本自动摘要模型,先利用卷积神经网络对文本进行分类,然后在传统的序列到序列模型的基础上结合文本的类别特征进行摘要生成。实验结果表明,基于文本类别的文本自动摘要模型相对于传统的文本自动摘要模型取得了更好的ROUGE值。 展开更多
关键词 seq2seq 神经网络 文本自动摘要 文本分类
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部