基于句子级LSTM编码的文本标题生成被引量：4

TEXT HEADLINE GENERATION BASED ON SENTENCE-LEVEL LSTM ENCODING

下载PDF

导出

摘要在标题自动生成任务中,BiLSTM表示文本是随着时间循环递归对每个单词进行编码,需要逐字读取单词序列,语义信息会随着状态的传递不断减弱。对此,构建一个句子级LSTM的编码器,并行对文本中每个单词编码表示。循环步骤同时对单词之间的局部状态和整体文本的全局状态进行信息交换,编码得到语义表示后使用混合指针网络的解码器生成标题。在相关数据集上进行实验,结果验证了该模型在标题生成任务上的有效性。 In the automatic title generation task,BiLSTM encodes each word with the recurrent time in text representation,which makes the sequence of words needs to be read word by word,and the semantic information will be weakened along with the state transition.This paper constructs a sentence-level LSTM encoder,which encodes each word in parallel.The recurrent step was used to exchange information between the local state of words and the global state of the overall text.After getting the semantic representation,the headline was generated using a decoder of the mixed pointer network.The experiments on the relevant data sets verify the validity of the model on the headline generation task.

作者钱揖丽马雪雯 Qian Yili;Ma Xuewen(School of Computer and Information Technology,Shanxi University,Taiyuan 030006,Shanxi,China;Key Laboratory of Ministry of Education for Computational Intelligence and Chinese Information Processing,Shanxi University,Taiyuan 030006,Shanxi,China)

机构地区山西大学计算机与信息技术学院山西大学计算机智能与中文信息处理教育部重点实验室

出处《计算机应用与软件》北大核心 2021年第5期190-195,共6页 Computer Applications and Software

基金国家重点研发计划重点专项项目(2018YFB1005103) 国家自然科学基金项目(61573231,61673248)。

关键词标题生成句子级 LSTM 序列到序列模型 Headline generation Sentence-level LSTM Sequence-to-sequence model

分类号 TP3 [自动化与计算机技术—计算机科学与技术]

引文网络
相关文献

同被引文献23

1路璐,李涓子,侯磊,张蓝姗.面向话题的新闻综述报告自动生成研究[J].北京大学学报（自然科学版）,2014,50(1):194-200. 被引量：2
2Ayana,Shi-Qi Shen,Yan-Kai Lin,Cun-Chao Tu,Yu Zhao,Zhi-Yuan Liu,Mao-Song Sun.Recent Advances on Neural Headline Generation[J].Journal of Computer Science & Technology,2017,32(4):768-784. 被引量：5
3周法国,吴锡坤,孙泰,孙镇.基于转移学习的中文命名实体识别[J].计算机工程与应用,2018,54(5):117-121. 被引量：4
4刘浏,王东波.命名实体识别研究综述[J].情报学报,2018,37(3):329-340. 被引量：149
5李维勇,柳斌,张伟,陈云芳.一种基于深度学习的中文生成式自动摘要方法[J].广西师范大学学报（自然科学版）,2020,38(2):51-63. 被引量：5
6杨飘,董文永.基于BERT嵌入的中文命名实体识别方法[J].计算机工程,2020,46(4):40-45. 被引量：102
7许晓泓,何霆,王华珍,陈坚.结合Transformer模型与深度神经网络的数据到文本生成方法[J].重庆大学学报（自然科学版）,2020,43(7):91-100. 被引量：13
8王玲.基于Word2Vec词嵌入和双向长短时记忆网络的文本分类实现[J].电子技术与软件工程,2020(15):70-71. 被引量：3
9王雅松,刘明童,马彬彬,张玉洁,徐金安,陈钰枫.基于多翻译引擎的汉语复述平行语料构建方法[J].情报工程,2020,6(5):27-40. 被引量：3
10张智雄,刘欢,于改红.构建基于科技文献知识的人工智能引擎[J].农业图书情报学报,2021,33(1):16-29. 被引量：30

引证文献4

1杜雪涛.大数据认知计算在内容安全管控中的应用[J].大数据,2021,7(6):53-66.
2张毅.灭火救援专业知识智能匹配算法[J].消防科学与技术,2022,41(10):1472-1476.
3王宇飞,张智雄,赵旸,张梦婷,李雪思.中文科技论文标题自动生成系统的设计与实现[J].数据分析与知识发现,2023,7(2):61-71. 被引量：1
4卢益清,严实莲,杜朋.基于Transformer和VAE的汽车新闻文本生成研究[J].北京信息科技大学学报（自然科学版）,2023,38(2):82-87. 被引量：1

二级引证文献2

1胡昊天,邓三鸿,王东波,沈思,沈健威.情报学视角下的预训练语言模型研究进展[J].图书情报工作,2024,68(3):130-150. 被引量：1
2孙智孝,王悦,孙志彬,何俊伟.自然语言处理技术在航空装备领域标准化审查工作中的应用探索[J].航空标准化与质量,2024(1):1-5. 被引量：1

1白雪梅,李哲,张晨洁,汤云琪.基于赛耶模型的电子线路实验教学改革[J].实验室研究与探索,2021,40(2):236-238. 被引量：1
2张仕森,孙宪坤,尹玲,李世玺.基于神经网络的文本标题生成原型系统设计[J].电子科技,2021,34(5):35-41. 被引量：3
3李朝华,王磊,衡志炜.突发性强对流天气快速识别预警改进方法[J].高原山地气象研究,2020,40(3):10-17. 被引量：5
4齐佳琪,迟呈英,战学刚.基于ERNIE-DPCNN的短文本分类研究[J].电脑编程技巧与维护,2021(4):26-27. 被引量：1

计算机应用与软件

2021年第5期

浏览历史

内容加载中请稍等...

基于句子级LSTM编码的文本标题生成被引量：4

同被引文献23

引证文献4

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

基于句子级LSTM编码的文本标题生成 被引量：4

同被引文献23

引证文献4

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

基于句子级LSTM编码的文本标题生成被引量：4