期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
245
篇文章
<
1
2
…
13
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
计算机自动文摘方法的分类探讨
1
作者
孙秋月
焦伟婷
蔡宁
《办公自动化》
2023年第3期56-58,38,共4页
信息化时代,自动文摘是语言信息处理领域的重要研究课题。根据计算机判别语篇主题所采取的理论基础和方法的不同,本文将自动文摘技术分为三类:基于语篇表层特征的统计自动文摘法、基于语篇理解的自动文摘法、语篇表层特征和语篇理解相...
信息化时代,自动文摘是语言信息处理领域的重要研究课题。根据计算机判别语篇主题所采取的理论基础和方法的不同,本文将自动文摘技术分为三类:基于语篇表层特征的统计自动文摘法、基于语篇理解的自动文摘法、语篇表层特征和语篇理解相结合的自动文摘法,探讨了每种自动文摘方法的实施路径、特点和不足,提出基于语篇深层次理解的自动文摘的必要性。
展开更多
关键词
自动文摘
统计法
语篇表层特征
语篇理解
下载PDF
职称材料
面向冗余度控制的中文多文档自动文摘
被引量:
6
2
作者
王红玲
周国栋
朱巧明
《中文信息学报》
CSCD
北大核心
2012年第2期92-96,共5页
多文档自动文摘能够帮助人们自动、快速地获取信息,是目前的一个研究热点。相比于单文档自动文摘,多文档自动文摘需要更多考虑文档之间的相关性,以及文档信息之间的冗余性。因此如何控制信息冗余是多文档自动文摘的一个关键所在。该文...
多文档自动文摘能够帮助人们自动、快速地获取信息,是目前的一个研究热点。相比于单文档自动文摘,多文档自动文摘需要更多考虑文档之间的相关性,以及文档信息之间的冗余性。因此如何控制信息冗余是多文档自动文摘的一个关键所在。该文在考虑文摘特性的基础上提出了一个冗余度控制模型,该模型通过计算文本单元在主题概率分布之间的相似度来决定句子的选择,从而达到控制冗余的目的。实验结果表明,该方法能够有效降低冗余度,且总体性能优于现有的自动文摘系统。
展开更多
关键词
冗余度控制
多文档
自动文摘
中文
自动文摘
下载PDF
职称材料
主题模型LDA的多文档自动文摘
被引量:
23
3
作者
杨潇
马军
+2 位作者
杨同峰
杜言琦
邵海敏
《智能系统学报》
2010年第2期169-176,共8页
近年来使用概率主题模型表示多文档文摘问题受到研究者的关注.LDA(latent dirichlet allocation)是主题模型中具有代表性的概率生成性模型之一.提出了一种基于LDA的文摘方法,该方法以混乱度确定LDA模型的主题数目,以Gibbs抽样获得模型...
近年来使用概率主题模型表示多文档文摘问题受到研究者的关注.LDA(latent dirichlet allocation)是主题模型中具有代表性的概率生成性模型之一.提出了一种基于LDA的文摘方法,该方法以混乱度确定LDA模型的主题数目,以Gibbs抽样获得模型中句子的主题概率分布和主题的词汇概率分布,以句子中主题权重的加和确定各个主题的重要程度,并根据LDA模型中主题的概率分布和句子的概率分布提出了2种不同的句子权重计算模型.实验中使用ROUGE评测标准,与代表最新水平的SumBasic方法和其他2种基于LDA的多文档自动文摘方法在通用型多文档摘要测试集DUC2002上的评测数据进行比较,结果表明提出的基于LDA的多文档自动文摘方法在ROUGE的各个评测标准上均优于SumBasic方法,与其他基于LDA模型的文摘相比也具有优势.
展开更多
关键词
多文档
自动文摘
句子分值计算
主题模型
LDA
主题数目
下载PDF
职称材料
基于主题词权重和句子特征的自动文摘
被引量:
17
4
作者
蒋昌金
彭宏
+1 位作者
陈建超
马千里
《华南理工大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2010年第7期50-55,共6页
为获得高质量的自动文摘,在组合词识别算法的基础上,充分考虑词的频率、词性、词的位置、词长等因素,构建了一个词语权重计算公式,该公式能使表达主题的词和短语具有较高的权重.对句子权重的计算,则考虑了句子的内容、位置以及线索词的...
为获得高质量的自动文摘,在组合词识别算法的基础上,充分考虑词的频率、词性、词的位置、词长等因素,构建了一个词语权重计算公式,该公式能使表达主题的词和短语具有较高的权重.对句子权重的计算,则考虑了句子的内容、位置以及线索词的作用和用户偏好等.摘要的生成充分考虑了候选文摘句的相似性,避免了冗余信息的加入.对摘要的评估进行了从句子粒度到词语粒度的改进,提出了一种基于词语粒度的准确率和召回率计算方法.实验证明,该算法生成的自动文摘有着较高的质量,平均准确率达到77.1%.
展开更多
关键词
主题词
自动文摘
组合词
权重计算
句子特征
下载PDF
职称材料
自动文摘综述
被引量:
24
5
作者
郭燕慧
钟义信
+1 位作者
马志勇
姚均勇
《情报学报》
CSSCI
北大核心
2002年第5期582-591,共10页
本文概述了自动文摘的发展历史和研究状况 ,给出当前自动文摘领域主要的研究方法和策略 ,剖析了它们的优点和不足。进一步结合自动文摘自身的特点和难点 ,提出近期自动文摘的研究重点是基于篇章话语形式的浅层分析方法生成指示型文摘。
关键词
研究方法
研究重点
指示型
文摘
自动文摘
话语形式
浅层分析
指示型
文摘
下载PDF
职称材料
中文自动文摘原理与方法探索
被引量:
20
6
作者
吴岩
刘挺
+1 位作者
王开铸
陈彬
《中文信息学报》
CSCD
北大核心
1998年第2期8-16,共9页
本文首先介绍了自动文摘的研究情况及存在问题,然后给出了计算机自动文摘的一般模型,最后介绍了我们所研究的两种自动文摘的原理和方法。
关键词
自动文摘
机械
文摘
理解
文摘
中文
文摘
计算机
下载PDF
职称材料
基于信息融合的多文档自动文摘技术
被引量:
27
7
作者
徐永东
徐志明
王晓龙
《计算机学报》
EI
CSCD
北大核心
2007年第11期2048-2054,共7页
提出了一个面向多文档自动文摘任务的多文本框架(Multiple Document Framework,MDF),该框架通过系统地描述不同层面的文本单元之间的相互关系以及文档集合蕴含的事件在时间上的发生及演变,将多篇文档在不损失文档集合原有信息的前提下...
提出了一个面向多文档自动文摘任务的多文本框架(Multiple Document Framework,MDF),该框架通过系统地描述不同层面的文本单元之间的相互关系以及文档集合蕴含的事件在时间上的发生及演变,将多篇文档在不损失文档集合原有信息的前提下实现信息融合.MDF简化了传统交叉文本结构理论的文本集合表示模型,又补充了信息融合理论中缺乏的事件主题的演变性和分布性信息.文中给出了建立MDF、基于MDF的信息融合、文摘生成等一整套算法.通过对32组不同主题的网络文档试验结果表明,MDF策略很好地实现了多知识源的并行融合,并获得了较好的结果.
展开更多
关键词
多文本框架
多文档
自动文摘
信息融合
时间
下载PDF
职称材料
一种基于LexRank算法的改进的自动文摘系统
被引量:
15
8
作者
纪文倩
李舟军
+1 位作者
巢文涵
陈小明
《计算机科学》
CSCD
北大核心
2010年第5期151-154,218,共5页
自动文摘是计算机语言学领域的一个研究重点,其研究和应用受到了计算机科学、语言学、情报信息学等相关学科的广泛关注。首先介绍了基于LexRank算法的自动文摘方法。针对该方法的不足,从句子相似度计算方法、句子权重计算方法以及冗余...
自动文摘是计算机语言学领域的一个研究重点,其研究和应用受到了计算机科学、语言学、情报信息学等相关学科的广泛关注。首先介绍了基于LexRank算法的自动文摘方法。针对该方法的不足,从句子相似度计算方法、句子权重计算方法以及冗余处理等方面对它进行了改进,从而可以根据输入文本内容动态地调整相关影响因子。实现的文摘系统,可以对中文和英文的单文本或多文本进行自动文摘。在哈工大和DUC的测评语料上进行了实验,结果表明该系统在一定程度上改进了文摘的质量,在多文本文摘中的抗噪声方面也有一定的优越性。最后讨论了自动摘要研究存在的问题,并指出了自动文摘的研究趋势。
展开更多
关键词
自动文摘
LexRank
句子相似度
动态调整
冗余处理
下载PDF
职称材料
基于HowNet概念获取的中文自动文摘系统
被引量:
22
9
作者
王萌
何婷婷
+1 位作者
姬东鸿
王晓荣
《中文信息学报》
CSCD
北大核心
2005年第3期87-93,共7页
本文提出了一种中文自动文摘的方法。不同于其它的基于词频统计的一般方法,运用概念(词义)作为特征取代词语。用概念统计代替传统的词形频率统计方法,建立概念向量空间模型,计算出句子重要度,并对句子进行冗余度计算,抽取文摘句。对于...
本文提出了一种中文自动文摘的方法。不同于其它的基于词频统计的一般方法,运用概念(词义)作为特征取代词语。用概念统计代替传统的词形频率统计方法,建立概念向量空间模型,计算出句子重要度,并对句子进行冗余度计算,抽取文摘句。对于文摘测试,采用两种不同的方法进行测试:一是用机器文摘和专家文摘进行比较的内部测试;二是对不同文摘方法进行分类,通过对分类正确率的比较的外部评测方法。
展开更多
关键词
计算机应用
中文信息处理
HOWNET
自动文摘
概念向量空间模型
下载PDF
职称材料
基于LDA主题特征的自动文摘方法
被引量:
24
10
作者
张明慧
王红玲
周国栋
《计算机应用与软件》
CSCD
2011年第10期20-22,46,共4页
近年来概率主题模型受到了研究者的广泛关注,LDA(Latent Dirichlet Allocation)模型是主题模型中具有代表性的概率生成模型之一,它能够检测文本的隐含主题。提出一个基于LDA模型的主题特征,该特征计算文档的主题分布与句子主题分布的距...
近年来概率主题模型受到了研究者的广泛关注,LDA(Latent Dirichlet Allocation)模型是主题模型中具有代表性的概率生成模型之一,它能够检测文本的隐含主题。提出一个基于LDA模型的主题特征,该特征计算文档的主题分布与句子主题分布的距离。结合传统多文档自动文摘中的常用特征,计算句子权重,最终根据句子的分值抽取句子形成摘要。实验结果证明,加入LDA模型的主题特征后,自动文摘的性能得到了显著的提高。
展开更多
关键词
自动文摘
LDA
主题模型
多文档
下载PDF
职称材料
基于信息抽取和文本生成的自动文摘系统设计
被引量:
13
11
作者
刘挺
吴岩
王开铸
《情报学报》
CSSCI
北大核心
1997年第S1期31-36,共6页
本文提出了一种自动文摘系统的设计方案,该方案将文摘过程分解为信息抽取和文本生成两个子过程。信息抽取过程对原文进行词语频率、词语分布和修辞结构的分析,并在此基础上参考用户对摘要的需求,抽取原文的部分内容填写文摘框架。文...
本文提出了一种自动文摘系统的设计方案,该方案将文摘过程分解为信息抽取和文本生成两个子过程。信息抽取过程对原文进行词语频率、词语分布和修辞结构的分析,并在此基础上参考用户对摘要的需求,抽取原文的部分内容填写文摘框架。文本生成过程对文摘框架中的句子进行加工、组织。
展开更多
关键词
自动文摘
信息抽取
文本生成
下载PDF
职称材料
一种主题句发现的中文自动文摘研究
被引量:
8
12
作者
王萌
李春贵
+1 位作者
唐培和
王晓荣
《计算机工程》
CAS
CSCD
北大核心
2007年第8期180-181,189,共3页
提出了一种基于主题句发现的中文自动文摘方法。该方法使用术语代替传统的词语作为最小语义单位,采用术语长度术语频率方法进行术语权重计算,获得特征词。利用一种改进的k-means聚类算法进行句子聚类,根据聚类结果进行主题句发现。实验...
提出了一种基于主题句发现的中文自动文摘方法。该方法使用术语代替传统的词语作为最小语义单位,采用术语长度术语频率方法进行术语权重计算,获得特征词。利用一种改进的k-means聚类算法进行句子聚类,根据聚类结果进行主题句发现。实验表明,该算法所得到的文摘,在各项指标上优于传统的文摘。
展开更多
关键词
主题句发现
自动文摘
句子聚类
自然语言处理
下载PDF
职称材料
自动文摘系统评价方法的研究与实践
被引量:
8
13
作者
沈洲
王永成
+1 位作者
许一震
方澈
《情报学报》
CSSCI
北大核心
2001年第1期66-72,共7页
自动文摘系统作为一种信息压缩精选工具 ,越来越引起人们广泛的兴趣。但是 ,目前仍未有一种客观公认的评价方法来对已有的系统进行评价 ,从而极大地阻碍了自动文摘领域的研究。本文首先阐述了自动文摘系统评价所面临的问题 ,随后综述了...
自动文摘系统作为一种信息压缩精选工具 ,越来越引起人们广泛的兴趣。但是 ,目前仍未有一种客观公认的评价方法来对已有的系统进行评价 ,从而极大地阻碍了自动文摘领域的研究。本文首先阐述了自动文摘系统评价所面临的问题 ,随后综述了当前国内外自动文摘的评价方法 。
展开更多
关键词
自然语言处理
自动文摘
系统
评价方法
内部评价方法
外部评价方法
下载PDF
职称材料
自动文摘的四种主要方法
被引量:
55
14
作者
刘挺
王开铸
《情报学报》
CSSCI
北大核心
1999年第1期10-19,共10页
本文将现有的自动文摘方法概括为四种:自动摘录、基于理解的自动文摘、信息抽取和基于结构的自动文摘,并详细介绍了这四种方法的基本原理,剖析了它们的优点和不足。最后,概述了中文自动文摘的研究状况。
关键词
自然语言处理
情报科学
自动文摘
下载PDF
职称材料
全信息理论在自动文摘系统中的应用
被引量:
13
15
作者
李蕾
钟义信
郭祥昊
《计算机工程与应用》
CSCD
北大核心
2000年第1期4-7,共4页
该文介绍了全信息理论提出的背景及其主要内容,并将其应用到一种智能业务──自动文摘系统中,设计实现了一个基于理解的、面向神经网络学习算法领域的中文9动文摘系统 Ladies。该系统综合利用语法信息和语义信息来理解原文的...
该文介绍了全信息理论提出的背景及其主要内容,并将其应用到一种智能业务──自动文摘系统中,设计实现了一个基于理解的、面向神经网络学习算法领域的中文9动文摘系统 Ladies。该系统综合利用语法信息和语义信息来理解原文的句法和含义,并通过语用信息制导,对原文进行文摘信息的过滤、提取和生成高质量的文摘。实验结果证明,这一方法是行之有效的。
展开更多
关键词
自动文摘
系统
全信息理论
神经网络
下载PDF
职称材料
基于文本相似度的自动文摘评价方法
被引量:
9
16
作者
黄丽琼
何中市
张杰慧
《计算机应用研究》
CSCD
北大核心
2007年第8期97-99,共3页
讨论了现有的自动文摘评价方法,并具体分析了内部评价方法的缺陷,由此提出了基于文本相似度的自动文摘评价方法。同时,通过基于VSM(支持向量机)相似度和基于语义相似度两种相似度方法来比较评价方法的性能。实验表明,基于相似度的方法...
讨论了现有的自动文摘评价方法,并具体分析了内部评价方法的缺陷,由此提出了基于文本相似度的自动文摘评价方法。同时,通过基于VSM(支持向量机)相似度和基于语义相似度两种相似度方法来比较评价方法的性能。实验表明,基于相似度的方法实现简单、效果良好,是一种更接近自然模型的评价方法。
展开更多
关键词
自动文摘
评价方法
相似度
向量空间模型
下载PDF
职称材料
基于文本聚类的多文档自动文摘研究
被引量:
5
17
作者
郭庆琳
吴克河
+1 位作者
吴慧芳
李存斌
《计算机研究与发展》
EI
CSCD
北大核心
2007年第z2期140-144,共5页
针对当前自动文摘方法的不足,提出了基于文本聚类的自动文摘实现方法.可以克服常规自动文摘方法的不足,使文摘的质量和效果得到大大的提高.将文本聚类引入自动文摘中,不但使单文档的文摘质量得到提高,而且能够实现多文档的自动文摘,这...
针对当前自动文摘方法的不足,提出了基于文本聚类的自动文摘实现方法.可以克服常规自动文摘方法的不足,使文摘的质量和效果得到大大的提高.将文本聚类引入自动文摘中,不但使单文档的文摘质量得到提高,而且能够实现多文档的自动文摘,这是现有的自动文摘技术所没有涉及的.实现了面向"塑料"行业的基于文本聚类的自动文摘系统TCAAS.实验表明该方法可行, 对自动文摘系统的设计具有借鉴意义和深入研究的价值.
展开更多
关键词
自动文摘
文本聚类
自然语言理解
多文档
下载PDF
职称材料
基于局部主题关键句抽取的自动文摘方法
被引量:
5
18
作者
徐超
王萌
+1 位作者
何婷婷
张勇
《计算机工程》
CAS
CSCD
北大核心
2008年第22期49-51,共3页
自动文摘是语言信息处理中的重要环节。该文提出一种基于局部主题关键句抽取的中文自动文摘方法。通过层次分割的方法对文档进行主题分割,从各个局部主题单元中抽取一定数量的句子作为文章的文摘句。通过事先对文档进行语义分析,有效地...
自动文摘是语言信息处理中的重要环节。该文提出一种基于局部主题关键句抽取的中文自动文摘方法。通过层次分割的方法对文档进行主题分割,从各个局部主题单元中抽取一定数量的句子作为文章的文摘句。通过事先对文档进行语义分析,有效地避免了数据冗余和容易忽略分布较小的主题等问题。实验结果表明了该方法的有效性。
展开更多
关键词
自动文摘
主题分割
局部主题单元
下载PDF
职称材料
基于文本聚类的自动文摘系统的研究与实现
被引量:
8
19
作者
郭庆琳
樊孝忠
柳长安
《计算机工程》
EI
CAS
CSCD
北大核心
2006年第4期30-32,121,共4页
针对当前自动文摘方法的不足,提出了基于文本聚类和自然语言理解的自动文摘实现方法。可以克服常规自动文摘方法的不足,使文摘的质量和效果得到大大的提高。将文本聚类引入自动文摘中,不但使单文档的文摘质量得到提高,而且能够实现多文...
针对当前自动文摘方法的不足,提出了基于文本聚类和自然语言理解的自动文摘实现方法。可以克服常规自动文摘方法的不足,使文摘的质量和效果得到大大的提高。将文本聚类引入自动文摘中,不但使单文档的文摘质量得到提高,而且能够实现多文档的自动文摘,这是现有的自动文摘技术所没有涉及的。实现了面向“塑料”行业的基于文本聚类和自然语言理解的自动文摘系统TCAAS。
展开更多
关键词
自动文摘
文本聚类
自然语言理解
下载PDF
职称材料
自动文摘方法分析
被引量:
8
20
作者
金旭
杨炳儒
菅志刚
《计算机应用研究》
CSCD
北大核心
2004年第9期5-6,11,共3页
介绍了目前自动文摘的四种实现方法,并对这四种方法的优缺点进行了较为详细的分析与比较,介绍了它们的应用实例。最后讨论了一种面向非受限领域的综合式中文自动文摘方法。
关键词
自动文摘
向量空间模型
自然语言理解
下载PDF
职称材料
题名
计算机自动文摘方法的分类探讨
1
作者
孙秋月
焦伟婷
蔡宁
机构
河北科技师范学院外国语学院
河北科技师范学院教育学院
出处
《办公自动化》
2023年第3期56-58,38,共4页
文摘
信息化时代,自动文摘是语言信息处理领域的重要研究课题。根据计算机判别语篇主题所采取的理论基础和方法的不同,本文将自动文摘技术分为三类:基于语篇表层特征的统计自动文摘法、基于语篇理解的自动文摘法、语篇表层特征和语篇理解相结合的自动文摘法,探讨了每种自动文摘方法的实施路径、特点和不足,提出基于语篇深层次理解的自动文摘的必要性。
关键词
自动文摘
统计法
语篇表层特征
语篇理解
Keywords
automatic summarization
statistical method
textual superficial features
textual understanding
分类号
TP301.2 [自动化与计算机技术—计算机系统结构]
H085.2 [语言文字—语言学]
C81 [社会学—统计学]
下载PDF
职称材料
题名
面向冗余度控制的中文多文档自动文摘
被引量:
6
2
作者
王红玲
周国栋
朱巧明
机构
苏州大学计算机科学与技术学院
出处
《中文信息学报》
CSCD
北大核心
2012年第2期92-96,共5页
基金
国家自然科学基金资助项目(60873150
60970056)
江苏省高校自然科学基金资助项目(10KJB520016)
文摘
多文档自动文摘能够帮助人们自动、快速地获取信息,是目前的一个研究热点。相比于单文档自动文摘,多文档自动文摘需要更多考虑文档之间的相关性,以及文档信息之间的冗余性。因此如何控制信息冗余是多文档自动文摘的一个关键所在。该文在考虑文摘特性的基础上提出了一个冗余度控制模型,该模型通过计算文本单元在主题概率分布之间的相似度来决定句子的选择,从而达到控制冗余的目的。实验结果表明,该方法能够有效降低冗余度,且总体性能优于现有的自动文摘系统。
关键词
冗余度控制
多文档
自动文摘
中文
自动文摘
Keywords
reduandancy control
multi-document summarization
Chinese automatic summarization
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
主题模型LDA的多文档自动文摘
被引量:
23
3
作者
杨潇
马军
杨同峰
杜言琦
邵海敏
机构
山东经济学院信息管理学院
山东大学计算机科学与技术学院
出处
《智能系统学报》
2010年第2期169-176,共8页
基金
国家自然科学基金资助项目(60970047)
山东省自然科学基金资助项目(Y2008G19)
+1 种基金
山东省科技计划资助项目(2007GG10001002
2008GG10001026)
文摘
近年来使用概率主题模型表示多文档文摘问题受到研究者的关注.LDA(latent dirichlet allocation)是主题模型中具有代表性的概率生成性模型之一.提出了一种基于LDA的文摘方法,该方法以混乱度确定LDA模型的主题数目,以Gibbs抽样获得模型中句子的主题概率分布和主题的词汇概率分布,以句子中主题权重的加和确定各个主题的重要程度,并根据LDA模型中主题的概率分布和句子的概率分布提出了2种不同的句子权重计算模型.实验中使用ROUGE评测标准,与代表最新水平的SumBasic方法和其他2种基于LDA的多文档自动文摘方法在通用型多文档摘要测试集DUC2002上的评测数据进行比较,结果表明提出的基于LDA的多文档自动文摘方法在ROUGE的各个评测标准上均优于SumBasic方法,与其他基于LDA模型的文摘相比也具有优势.
关键词
多文档
自动文摘
句子分值计算
主题模型
LDA
主题数目
Keywords
multi-document summarization
sentence scoring
topic model
latent dirichlet allocation
number of topics
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于主题词权重和句子特征的自动文摘
被引量:
17
4
作者
蒋昌金
彭宏
陈建超
马千里
机构
华南理工大学计算机科学与工程学院
广东商学院数学与计算科学学院
出处
《华南理工大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2010年第7期50-55,共6页
基金
广东省自然科学基金资助项目(07006474)
广东省科技攻关项目(2007B010200044)
文摘
为获得高质量的自动文摘,在组合词识别算法的基础上,充分考虑词的频率、词性、词的位置、词长等因素,构建了一个词语权重计算公式,该公式能使表达主题的词和短语具有较高的权重.对句子权重的计算,则考虑了句子的内容、位置以及线索词的作用和用户偏好等.摘要的生成充分考虑了候选文摘句的相似性,避免了冗余信息的加入.对摘要的评估进行了从句子粒度到词语粒度的改进,提出了一种基于词语粒度的准确率和召回率计算方法.实验证明,该算法生成的自动文摘有着较高的质量,平均准确率达到77.1%.
关键词
主题词
自动文摘
组合词
权重计算
句子特征
Keywords
thematic word
automatic text summarization
combined word
weight computing
sentence feature
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
自动文摘综述
被引量:
24
5
作者
郭燕慧
钟义信
马志勇
姚均勇
机构
北京邮电大学智能研究中心
出处
《情报学报》
CSSCI
北大核心
2002年第5期582-591,共10页
文摘
本文概述了自动文摘的发展历史和研究状况 ,给出当前自动文摘领域主要的研究方法和策略 ,剖析了它们的优点和不足。进一步结合自动文摘自身的特点和难点 ,提出近期自动文摘的研究重点是基于篇章话语形式的浅层分析方法生成指示型文摘。
关键词
研究方法
研究重点
指示型
文摘
自动文摘
话语形式
浅层分析
指示型
文摘
Keywords
automatic summarization,discourse structure,shallow analysis, indicative summarizing.
分类号
G353.2 [文化科学—情报学]
下载PDF
职称材料
题名
中文自动文摘原理与方法探索
被引量:
20
6
作者
吴岩
刘挺
王开铸
陈彬
机构
哈尔滨工业大学计算机系
哈尔滨医科大学基础医学院计算机教研室
出处
《中文信息学报》
CSCD
北大核心
1998年第2期8-16,共9页
文摘
本文首先介绍了自动文摘的研究情况及存在问题,然后给出了计算机自动文摘的一般模型,最后介绍了我们所研究的两种自动文摘的原理和方法。
关键词
自动文摘
机械
文摘
理解
文摘
中文
文摘
计算机
Keywords
automatic abstracting mechanical abstracting understanding abstracting
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于信息融合的多文档自动文摘技术
被引量:
27
7
作者
徐永东
徐志明
王晓龙
机构
哈尔滨工业大学计算机学院智能技术与自然语言处理研究室
出处
《计算机学报》
EI
CSCD
北大核心
2007年第11期2048-2054,共7页
基金
国家自然科学基金重点项目(60435020)
国家自然科学基金(60773070)资助.~~
文摘
提出了一个面向多文档自动文摘任务的多文本框架(Multiple Document Framework,MDF),该框架通过系统地描述不同层面的文本单元之间的相互关系以及文档集合蕴含的事件在时间上的发生及演变,将多篇文档在不损失文档集合原有信息的前提下实现信息融合.MDF简化了传统交叉文本结构理论的文本集合表示模型,又补充了信息融合理论中缺乏的事件主题的演变性和分布性信息.文中给出了建立MDF、基于MDF的信息融合、文摘生成等一整套算法.通过对32组不同主题的网络文档试验结果表明,MDF策略很好地实现了多知识源的并行融合,并获得了较好的结果.
关键词
多文本框架
多文档
自动文摘
信息融合
时间
Keywords
multiple document framework
multi-document automatic summarization
information fusion
time
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
一种基于LexRank算法的改进的自动文摘系统
被引量:
15
8
作者
纪文倩
李舟军
巢文涵
陈小明
机构
北京航空航天大学计算机学院
出处
《计算机科学》
CSCD
北大核心
2010年第5期151-154,218,共5页
基金
国家自然科学基金项目(60573057
60473057
90604007)资助
文摘
自动文摘是计算机语言学领域的一个研究重点,其研究和应用受到了计算机科学、语言学、情报信息学等相关学科的广泛关注。首先介绍了基于LexRank算法的自动文摘方法。针对该方法的不足,从句子相似度计算方法、句子权重计算方法以及冗余处理等方面对它进行了改进,从而可以根据输入文本内容动态地调整相关影响因子。实现的文摘系统,可以对中文和英文的单文本或多文本进行自动文摘。在哈工大和DUC的测评语料上进行了实验,结果表明该系统在一定程度上改进了文摘的质量,在多文本文摘中的抗噪声方面也有一定的优越性。最后讨论了自动摘要研究存在的问题,并指出了自动文摘的研究趋势。
关键词
自动文摘
LexRank
句子相似度
动态调整
冗余处理
Keywords
Automatic abstracting LexRank Sentence similarity Dynamic adjustment Redundancy resolution
分类号
TP393 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于HowNet概念获取的中文自动文摘系统
被引量:
22
9
作者
王萌
何婷婷
姬东鸿
王晓荣
机构
华中师范大学计算机科学系
新加坡信息通讯研究所
出处
《中文信息学报》
CSCD
北大核心
2005年第3期87-93,共7页
基金
国家自然科学基金项目 (6 0 4 42 0 0 5 )
教育部科学技术研究资助项目 (10 5 117)
+1 种基金
国家语言文字应用委员会资助项目 (ZDI10 5 - 43B)
国家重点基础研究 973资助项目 (2 0 0 4CB 31810 4 )
文摘
本文提出了一种中文自动文摘的方法。不同于其它的基于词频统计的一般方法,运用概念(词义)作为特征取代词语。用概念统计代替传统的词形频率统计方法,建立概念向量空间模型,计算出句子重要度,并对句子进行冗余度计算,抽取文摘句。对于文摘测试,采用两种不同的方法进行测试:一是用机器文摘和专家文摘进行比较的内部测试;二是对不同文摘方法进行分类,通过对分类正确率的比较的外部评测方法。
关键词
计算机应用
中文信息处理
HOWNET
自动文摘
概念向量空间模型
Keywords
computer application
Chinese information processing
HowNet
automatic text summarization
conceptual vector space model
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于LDA主题特征的自动文摘方法
被引量:
24
10
作者
张明慧
王红玲
周国栋
机构
苏州大学计算机科学与技术学院
江苏省计算机信息处理技术重点实验室
出处
《计算机应用与软件》
CSCD
2011年第10期20-22,46,共4页
基金
国家自然科学基金(60673041
60873150)
江苏省高校自然科学重大基础研究项目(08KJA520002)
文摘
近年来概率主题模型受到了研究者的广泛关注,LDA(Latent Dirichlet Allocation)模型是主题模型中具有代表性的概率生成模型之一,它能够检测文本的隐含主题。提出一个基于LDA模型的主题特征,该特征计算文档的主题分布与句子主题分布的距离。结合传统多文档自动文摘中的常用特征,计算句子权重,最终根据句子的分值抽取句子形成摘要。实验结果证明,加入LDA模型的主题特征后,自动文摘的性能得到了显著的提高。
关键词
自动文摘
LDA
主题模型
多文档
Keywords
Automatic document summarization Latent dirichlet allocation(LDA) Topic model Multi-document
分类号
TP301 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
基于信息抽取和文本生成的自动文摘系统设计
被引量:
13
11
作者
刘挺
吴岩
王开铸
机构
哈尔滨工业大学计算机系
出处
《情报学报》
CSSCI
北大核心
1997年第S1期31-36,共6页
文摘
本文提出了一种自动文摘系统的设计方案,该方案将文摘过程分解为信息抽取和文本生成两个子过程。信息抽取过程对原文进行词语频率、词语分布和修辞结构的分析,并在此基础上参考用户对摘要的需求,抽取原文的部分内容填写文摘框架。文本生成过程对文摘框架中的句子进行加工、组织。
关键词
自动文摘
信息抽取
文本生成
分类号
G356.7 [文化科学—情报学]
下载PDF
职称材料
题名
一种主题句发现的中文自动文摘研究
被引量:
8
12
作者
王萌
李春贵
唐培和
王晓荣
机构
广西工学院计算机工程系
华中师范大学计算机科学系
出处
《计算机工程》
CAS
CSCD
北大核心
2007年第8期180-181,189,共3页
基金
广西科学基金资助项目(桂科自0481016)
2006年度广西教育厅科研资助项目(149)
广西工学院博士基金资助项目
文摘
提出了一种基于主题句发现的中文自动文摘方法。该方法使用术语代替传统的词语作为最小语义单位,采用术语长度术语频率方法进行术语权重计算,获得特征词。利用一种改进的k-means聚类算法进行句子聚类,根据聚类结果进行主题句发现。实验表明,该算法所得到的文摘,在各项指标上优于传统的文摘。
关键词
主题句发现
自动文摘
句子聚类
自然语言处理
Keywords
Thematic sentence discovery
Automatic text summarization
Sentences clustering
Natural language processing
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
自动文摘系统评价方法的研究与实践
被引量:
8
13
作者
沈洲
王永成
许一震
方澈
机构
上海交通大学计算机系
出处
《情报学报》
CSSCI
北大核心
2001年第1期66-72,共7页
基金
到国家 8 63项目资助 !项目编号 :863 30 6 0 4 0 2 0 2
文摘
自动文摘系统作为一种信息压缩精选工具 ,越来越引起人们广泛的兴趣。但是 ,目前仍未有一种客观公认的评价方法来对已有的系统进行评价 ,从而极大地阻碍了自动文摘领域的研究。本文首先阐述了自动文摘系统评价所面临的问题 ,随后综述了当前国内外自动文摘的评价方法 。
关键词
自然语言处理
自动文摘
系统
评价方法
内部评价方法
外部评价方法
Keywords
natural language processing, automatic summarizing, evaluation method.
分类号
G354 [文化科学—情报学]
下载PDF
职称材料
题名
自动文摘的四种主要方法
被引量:
55
14
作者
刘挺
王开铸
机构
哈尔滨工业大学计算机系
出处
《情报学报》
CSSCI
北大核心
1999年第1期10-19,共10页
文摘
本文将现有的自动文摘方法概括为四种:自动摘录、基于理解的自动文摘、信息抽取和基于结构的自动文摘,并详细介绍了这四种方法的基本原理,剖析了它们的优点和不足。最后,概述了中文自动文摘的研究状况。
关键词
自然语言处理
情报科学
自动文摘
Keywords
natural language processing,information science,automatic abstracting.
分类号
G356.7 [文化科学—情报学]
下载PDF
职称材料
题名
全信息理论在自动文摘系统中的应用
被引量:
13
15
作者
李蕾
钟义信
郭祥昊
机构
北京邮电大学信息工程系
首都信息发展有限公司北京网络多媒体实验室
出处
《计算机工程与应用》
CSCD
北大核心
2000年第1期4-7,共4页
基金
国家863计划!No.863-317-9601-06-03
文摘
该文介绍了全信息理论提出的背景及其主要内容,并将其应用到一种智能业务──自动文摘系统中,设计实现了一个基于理解的、面向神经网络学习算法领域的中文9动文摘系统 Ladies。该系统综合利用语法信息和语义信息来理解原文的句法和含义,并通过语用信息制导,对原文进行文摘信息的过滤、提取和生成高质量的文摘。实验结果证明,这一方法是行之有效的。
关键词
自动文摘
系统
全信息理论
神经网络
Keywords
comprehensive information theory, automatic abstract, syntactic and semantic information analysis, abstract generating
分类号
G356.7 [文化科学—情报学]
下载PDF
职称材料
题名
基于文本相似度的自动文摘评价方法
被引量:
9
16
作者
黄丽琼
何中市
张杰慧
机构
重庆大学计算机学院
出处
《计算机应用研究》
CSCD
北大核心
2007年第8期97-99,共3页
基金
国家自然科学基金资助项目(60173060)
文摘
讨论了现有的自动文摘评价方法,并具体分析了内部评价方法的缺陷,由此提出了基于文本相似度的自动文摘评价方法。同时,通过基于VSM(支持向量机)相似度和基于语义相似度两种相似度方法来比较评价方法的性能。实验表明,基于相似度的方法实现简单、效果良好,是一种更接近自然模型的评价方法。
关键词
自动文摘
评价方法
相似度
向量空间模型
Keywords
automatic summarization
evaluation measures: similarity: vector space model
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于文本聚类的多文档自动文摘研究
被引量:
5
17
作者
郭庆琳
吴克河
吴慧芳
李存斌
机构
华北电力大学计算机科学与技术学院
出处
《计算机研究与发展》
EI
CSCD
北大核心
2007年第z2期140-144,共5页
基金
国家"八六三"高技术研究发展计划基金项目(2004AA1Z2450)
国家自然科学基金项目(70572090,60305009)
华北电力大学博士学位教师科研基金项目(H0585)
文摘
针对当前自动文摘方法的不足,提出了基于文本聚类的自动文摘实现方法.可以克服常规自动文摘方法的不足,使文摘的质量和效果得到大大的提高.将文本聚类引入自动文摘中,不但使单文档的文摘质量得到提高,而且能够实现多文档的自动文摘,这是现有的自动文摘技术所没有涉及的.实现了面向"塑料"行业的基于文本聚类的自动文摘系统TCAAS.实验表明该方法可行, 对自动文摘系统的设计具有借鉴意义和深入研究的价值.
关键词
自动文摘
文本聚类
自然语言理解
多文档
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于局部主题关键句抽取的自动文摘方法
被引量:
5
18
作者
徐超
王萌
何婷婷
张勇
机构
福建师范大学软件学院
广西工学院计算机工程系
华中师范大学计算机科学系
出处
《计算机工程》
CAS
CSCD
北大核心
2008年第22期49-51,共3页
基金
国家自然科学基金资助项目(60773167
60673040)
文摘
自动文摘是语言信息处理中的重要环节。该文提出一种基于局部主题关键句抽取的中文自动文摘方法。通过层次分割的方法对文档进行主题分割,从各个局部主题单元中抽取一定数量的句子作为文章的文摘句。通过事先对文档进行语义分析,有效地避免了数据冗余和容易忽略分布较小的主题等问题。实验结果表明了该方法的有效性。
关键词
自动文摘
主题分割
局部主题单元
Keywords
automatic summarization
topic segmentation
local topic unit
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
基于文本聚类的自动文摘系统的研究与实现
被引量:
8
19
作者
郭庆琳
樊孝忠
柳长安
机构
华北电力大学(北京)计算机系
北京理工大学计算机系
出处
《计算机工程》
EI
CAS
CSCD
北大核心
2006年第4期30-32,121,共4页
基金
国家自然科学基金资助项目(60305009)
华北电力大学博士学位教师科研基金资助项目
文摘
针对当前自动文摘方法的不足,提出了基于文本聚类和自然语言理解的自动文摘实现方法。可以克服常规自动文摘方法的不足,使文摘的质量和效果得到大大的提高。将文本聚类引入自动文摘中,不但使单文档的文摘质量得到提高,而且能够实现多文档的自动文摘,这是现有的自动文摘技术所没有涉及的。实现了面向“塑料”行业的基于文本聚类和自然语言理解的自动文摘系统TCAAS。
关键词
自动文摘
文本聚类
自然语言理解
Keywords
Automatic abstract
Text cluster
Natural language understanding
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
自动文摘方法分析
被引量:
8
20
作者
金旭
杨炳儒
菅志刚
机构
北京科技大学信息工程学院
出处
《计算机应用研究》
CSCD
北大核心
2004年第9期5-6,11,共3页
基金
国家自然科学基金重点项目(69835001)
国家教育部科技重点项目(教技司[2000]175)Method)
文摘
介绍了目前自动文摘的四种实现方法,并对这四种方法的优缺点进行了较为详细的分析与比较,介绍了它们的应用实例。最后讨论了一种面向非受限领域的综合式中文自动文摘方法。
关键词
自动文摘
向量空间模型
自然语言理解
Keywords
Automatic Abstracting
Vector Space Model
NLP
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
计算机自动文摘方法的分类探讨
孙秋月
焦伟婷
蔡宁
《办公自动化》
2023
0
下载PDF
职称材料
2
面向冗余度控制的中文多文档自动文摘
王红玲
周国栋
朱巧明
《中文信息学报》
CSCD
北大核心
2012
6
下载PDF
职称材料
3
主题模型LDA的多文档自动文摘
杨潇
马军
杨同峰
杜言琦
邵海敏
《智能系统学报》
2010
23
下载PDF
职称材料
4
基于主题词权重和句子特征的自动文摘
蒋昌金
彭宏
陈建超
马千里
《华南理工大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2010
17
下载PDF
职称材料
5
自动文摘综述
郭燕慧
钟义信
马志勇
姚均勇
《情报学报》
CSSCI
北大核心
2002
24
下载PDF
职称材料
6
中文自动文摘原理与方法探索
吴岩
刘挺
王开铸
陈彬
《中文信息学报》
CSCD
北大核心
1998
20
下载PDF
职称材料
7
基于信息融合的多文档自动文摘技术
徐永东
徐志明
王晓龙
《计算机学报》
EI
CSCD
北大核心
2007
27
下载PDF
职称材料
8
一种基于LexRank算法的改进的自动文摘系统
纪文倩
李舟军
巢文涵
陈小明
《计算机科学》
CSCD
北大核心
2010
15
下载PDF
职称材料
9
基于HowNet概念获取的中文自动文摘系统
王萌
何婷婷
姬东鸿
王晓荣
《中文信息学报》
CSCD
北大核心
2005
22
下载PDF
职称材料
10
基于LDA主题特征的自动文摘方法
张明慧
王红玲
周国栋
《计算机应用与软件》
CSCD
2011
24
下载PDF
职称材料
11
基于信息抽取和文本生成的自动文摘系统设计
刘挺
吴岩
王开铸
《情报学报》
CSSCI
北大核心
1997
13
下载PDF
职称材料
12
一种主题句发现的中文自动文摘研究
王萌
李春贵
唐培和
王晓荣
《计算机工程》
CAS
CSCD
北大核心
2007
8
下载PDF
职称材料
13
自动文摘系统评价方法的研究与实践
沈洲
王永成
许一震
方澈
《情报学报》
CSSCI
北大核心
2001
8
下载PDF
职称材料
14
自动文摘的四种主要方法
刘挺
王开铸
《情报学报》
CSSCI
北大核心
1999
55
下载PDF
职称材料
15
全信息理论在自动文摘系统中的应用
李蕾
钟义信
郭祥昊
《计算机工程与应用》
CSCD
北大核心
2000
13
下载PDF
职称材料
16
基于文本相似度的自动文摘评价方法
黄丽琼
何中市
张杰慧
《计算机应用研究》
CSCD
北大核心
2007
9
下载PDF
职称材料
17
基于文本聚类的多文档自动文摘研究
郭庆琳
吴克河
吴慧芳
李存斌
《计算机研究与发展》
EI
CSCD
北大核心
2007
5
下载PDF
职称材料
18
基于局部主题关键句抽取的自动文摘方法
徐超
王萌
何婷婷
张勇
《计算机工程》
CAS
CSCD
北大核心
2008
5
下载PDF
职称材料
19
基于文本聚类的自动文摘系统的研究与实现
郭庆琳
樊孝忠
柳长安
《计算机工程》
EI
CAS
CSCD
北大核心
2006
8
下载PDF
职称材料
20
自动文摘方法分析
金旭
杨炳儒
菅志刚
《计算机应用研究》
CSCD
北大核心
2004
8
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
2
…
13
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部