期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
基于主题特征的问答文本摘要自动生成研究 被引量:1
1
作者 刘梦豪 熊回香 +1 位作者 王妞妞 贺宇航 《现代情报》 CSSCI 2023年第8期114-124,177,共12页
[目的/意义]为帮助用户在拥有海量文本信息的问答社区高效率、高质量定位到符合自身需求的信息。[方法/过程]本文提出基于主题特征的问答文本摘要生成模型,该模型融合Word2Vec和SLDA算法多层次表达问答文本语义特征,而后基于图排序的思... [目的/意义]为帮助用户在拥有海量文本信息的问答社区高效率、高质量定位到符合自身需求的信息。[方法/过程]本文提出基于主题特征的问答文本摘要生成模型,该模型融合Word2Vec和SLDA算法多层次表达问答文本语义特征,而后基于图排序的思想,结合MRR冗余控制算法与文本句特征标签,调整句子权重,高效筛选出贴合问题标签的摘要内容。[结果/结论]本文对知乎问答社区多个问题下的问答文本数据进行验证,结果证明该模型具有较高的可行性和有效性。但本文选取了500份回答文本数据进行实证,未来可进一步扩大数据量开展更为充分的验证。 展开更多
关键词 摘要自动生成 知乎 问答社区 监督主题模型 图排序 Word2Vec
下载PDF
基于深度学习的金融文书摘要自动生成研究与实现 被引量:1
2
作者 胡赫薇 龚润泽 叶慕戎 《河南科技》 2019年第32期18-20,共3页
金融文书的自然语言处理是目前金融科技领域的研究热点,相关研究大多数着眼于传统的分词和基于机器学习的语义场景分析这种有监督的学习方法,难以满足当前金融监管行业快速处理金融文本的需求。针对这一问题,本文构建了一个基于多层LST... 金融文书的自然语言处理是目前金融科技领域的研究热点,相关研究大多数着眼于传统的分词和基于机器学习的语义场景分析这种有监督的学习方法,难以满足当前金融监管行业快速处理金融文本的需求。针对这一问题,本文构建了一个基于多层LSTM的中文金融文书摘要自动生成算法框架,通过Seq2Seq模型,基于注意力机制的强化学习框架,发现最优策略,对文本进行编码、解码,从LSTM编码器中抽取文本序列并输出摘要。实验结果表明,多层LSTM结构相比传统RNN的ROUGE值更高,具有较好的学习能力。 展开更多
关键词 金融文本 摘要自动生成 序列到序列 注意力机制
下载PDF
多篇摘要的自动生成算法 被引量:1
3
作者 傅伟鹏 何清 +1 位作者 贸自艳 史忠植 《计算机科学》 CSCD 北大核心 2002年第5期85-88,共4页
1.引言 Internet的迅猛的发展,使人们能方便快捷地获取众多的信息和服务.但是,面对Internet上浩瀚纷繁的信息海洋,人们常常会陷入窘迫的境地:一方面收到太多的信息无从选择和消化,淹没在繁杂的信息中;另一方面是信息的迷失,人们难于找... 1.引言 Internet的迅猛的发展,使人们能方便快捷地获取众多的信息和服务.但是,面对Internet上浩瀚纷繁的信息海洋,人们常常会陷入窘迫的境地:一方面收到太多的信息无从选择和消化,淹没在繁杂的信息中;另一方面是信息的迷失,人们难于找到真正所需的信息.因此,信息社会对能够有效浓缩文本信息的网络自动文摘有着迫切的要求. 展开更多
关键词 自然语言理解 自动文摘 文本信息处理 摘要自动生成算法 机械文摘
下载PDF
一种基于深度学习的中文生成式自动摘要方法 被引量:5
4
作者 李维勇 柳斌 +1 位作者 张伟 陈云芳 《广西师范大学学报(自然科学版)》 CAS 北大核心 2020年第2期51-63,共13页
针对中文的象形性和结构性特点,本文提出了一种新的生成式自动摘要解决方案,包括基于笔画的文本向量生成技术和一个生成式自动摘要模型。基于笔画的文本向量方法针对组成汉字的最小粒度笔画进行编码,增强了通过Skip-Gram模型得到对应的... 针对中文的象形性和结构性特点,本文提出了一种新的生成式自动摘要解决方案,包括基于笔画的文本向量生成技术和一个生成式自动摘要模型。基于笔画的文本向量方法针对组成汉字的最小粒度笔画进行编码,增强了通过Skip-Gram模型得到对应的中文词向量语义信息;然后通过对Seq2Seq模型进行优化,使用Bi-LSTM解决长序列文本信息丢失以及逆向信息的补充问题;并在编码端加入Attention机制以计算不同输入词对解码端的影响权重,在解码端加入Beam Search算法优化生成序列的流畅度。基于LCSTS数据集实验表明,本文提出的模型在中文文本摘要生成质量和可读性上有所提升。 展开更多
关键词 深度学习 生成自动摘要 笔画向量 Seq2Seq 注意力机制
下载PDF
基于深度学习的文本自动摘要方案 被引量:11
5
作者 张克君 李伟男 +2 位作者 钱榕 史泰猛 焦萌 《计算机应用》 CSCD 北大核心 2019年第2期311-315,共5页
针对自然语言处理(NLP)生成式自动摘要领域的语义理解不充分、摘要语句不通顺和摘要准确度不够高的问题,提出了一种新的生成式自动摘要解决方案,包括一种改进的词向量生成技术和一个生成式自动摘要模型。改进的词向量生成技术以Skip-Gra... 针对自然语言处理(NLP)生成式自动摘要领域的语义理解不充分、摘要语句不通顺和摘要准确度不够高的问题,提出了一种新的生成式自动摘要解决方案,包括一种改进的词向量生成技术和一个生成式自动摘要模型。改进的词向量生成技术以Skip-Gram方法生成的词向量为基础,结合摘要的特点,引入词性、词频和逆文本频率三个词特征,有效地提高了词语的理解;而提出的Bi-MulRnn+生成式自动摘要模型以序列映射(seq2seq)与自编码器结构为基础,引入注意力机制、门控循环单元(GRU)结构、双向循环神经网络(BiRnn)、多层循环神经网络(MultiRnn)和集束搜索,提高了生成式摘要准确性与语句流畅度。基于大规模中文短文本摘要(LCSTS)数据集的实验结果表明,该方案能够有效地解决短文本生成式摘要问题,并在Rouge标准评价体系中表现良好,提高了摘要准确性与语句流畅度。 展开更多
关键词 自然语言处理 生成式文本自动摘要 序列映射 自编码器 词向量 循环神经网络
下载PDF
一种基于共现关键词的TextRank文摘自动生成算法 被引量:3
6
作者 阎红灿 李铂初 谷建涛 《计算机工程与科学》 CSCD 北大核心 2023年第11期2060-2069,共10页
传统TextRank算法在生成摘要时只考虑句子间的相似度,忽略了文章本身间的相似度,且生成的摘要往往包含重复的信息表达。为此,提出一种基于共现关键词的TextRank算法,用word2vec模型将文章表示为句向量,考虑到文章的类别,将该类文章的共... 传统TextRank算法在生成摘要时只考虑句子间的相似度,忽略了文章本身间的相似度,且生成的摘要往往包含重复的信息表达。为此,提出一种基于共现关键词的TextRank算法,用word2vec模型将文章表示为句向量,考虑到文章的类别,将该类文章的共现关键词作为参数参与句子权值的迭代计算,然后,通过句子长度、关键词数量等信息对迭代得到的句子权重加以修正。实验结果表明,所提算法能够提高生成摘要的全面性和准确性。同时,所提算法使用MMR对抽取得到的摘要进行去除冗余处理,改善了摘要的重复表达情况。 展开更多
关键词 自动摘要生成 TextRank 共现关键词 MMR算法 word2vec模型
下载PDF
基于双编码器的中文文本摘要技术的研究与实现 被引量:6
7
作者 高巍 马辉 +1 位作者 李大舟 于沛 《计算机工程与设计》 北大核心 2021年第9期2687-2695,共9页
针对自然语言处理领域生成式文本摘要任务中存在的语义编码不充分、摘要语句不通顺问题,提出一种基于序列到序列(Seq2Seq)结构的生成式摘要模型TCAtten-GRU。采用双编码器对源文信息进行充分编码,应用时间卷积网络(TCN)获取全文的语义信... 针对自然语言处理领域生成式文本摘要任务中存在的语义编码不充分、摘要语句不通顺问题,提出一种基于序列到序列(Seq2Seq)结构的生成式摘要模型TCAtten-GRU。采用双编码器对源文信息进行充分编码,应用时间卷积网络(TCN)获取全文的语义信息,卷积神经网络(CNN)提取文本的高层特征。解码器采用结合指针机制和集束搜索的门控循环单元(GRU)解决生成摘要不通顺问题。中文短文本摘要数据集LCSTS的实验结果表明,该模型与RNN、RNN content、MC-LSTMatten和BiGRU-GRUatten这4个模型对比,ROUGE-1提高了0.037-0.155,ROUGE-2提高了0.075-0.156,ROUGE-L提高了0.035-0.157,验证了该模型可以有效提升摘要质量。 展开更多
关键词 生成自动摘要 序列到序列模型 时间卷积网络 卷积神经网络 注意力机制
下载PDF
面向人民日报语料的新闻自动摘要生成 被引量:1
8
作者 梁媛 王东波 黄水清 《知识管理论坛》 2022年第4期452-464,共13页
[目的/意义]面向主流新闻媒体人民日报语料展开研究,旨在为文本自动摘要研究提供思路和实践支撑,进而应用到新闻等相关文本信息处理中,为知识聚合服务和信息获取途径研究做出贡献。[方法/过程]以新时代人民日报语料NEPD中的2015年1月、2... [目的/意义]面向主流新闻媒体人民日报语料展开研究,旨在为文本自动摘要研究提供思路和实践支撑,进而应用到新闻等相关文本信息处理中,为知识聚合服务和信息获取途径研究做出贡献。[方法/过程]以新时代人民日报语料NEPD中的2015年1月、2015年6月和2016年1月的人民日报分词语料作为实验语料,基于TF-IDF、Textrank等抽取式自动摘要算法,以及基于指针生成网络的生成式自动摘要模型展开研究,并对摘要结果进行分析评价。[结果/结论]实验设计面向人民日报语料的新闻抽取式自动摘要算法,构建面向人民日报语料的新闻生成式自动摘要指针生成网络模型,并通过Rouge指标(包括Rouge-1、Rouge-2和Rouge-L 3种指标)对实验结果进行评测,为人民日报分词语料的应用提供具体思路,并对新闻自动摘要系统研究提供语料支持和实践支撑。 展开更多
关键词 人民日报 抽取式自动摘要 生成自动摘要 NEPD 指针生成网络
原文传递
山西国际商务信息智能收集监测服务系统采用的几种智能技术及其算法
9
作者 张兴旺 刘旭楼 《中国新技术新产品》 2015年第18期20-23,共4页
本文简述了山西国际商务信息智能收集监测服务系统的立项背景、技术特点、性能以及它的实施应用对我省政府主管商务部门、国内外贸易企业等单位了解、研究、掌控、国内外市场,推动我省国内外贸易和经济发展的的实际意义。
关键词 智能技术 国际贸易 自然语言理解与处理 智能中文分词 关键词提取 自动生成摘要
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部