-
题名基于指针生成网络的中文对话文本摘要模型
被引量:1
- 1
-
-
作者
胡清丰
魏赟
邬春学
-
机构
上海理工大学光电信息与计算机工程学院
-
出处
《计算机系统应用》
2023年第1期224-232,共9页
-
基金
国家重点研发计划(2018YFC0810204)。
-
文摘
针对传统Seq2Seq序列模型在文本摘要任务中无法准确地提取到文本中的关键信息、无法处理单词表之外的单词等问题,本文提出一种基于Fastformer的指针生成网络(pointer generator network,PGN)模型,且该模型结合了抽取式和生成式两种文本摘要方法.模型首先利用Fastformer模型高效的获取具有上下文信息的单词嵌入向量,然后利用指针生成网络模型选择从源文本中复制单词或利用词汇表来生成新的摘要信息,以解决文本摘要任务中常出现的OOV(out of vocabulary)问题,同时模型使用覆盖机制来追踪过去时间步的注意力分布,动态的调整单词的重要性,解决了重复词问题,最后,在解码阶段引入了Beam Search优化算法,使得解码器能够获得更加准确的摘要结果.实验在百度AI Studio中汽车大师所提供的汽车诊断对话数据集中进行,结果表明本文提出的FastformerPGN模型在中文文本摘要任务中达到的效果要优于基准模型,具有更好的效果.
-
关键词
深度学习
文本摘要
指针生成网络(PGN)
覆盖机制
Fastformer模型
-
Keywords
deep learning
text summarization
pointer generator network(PGN)
coverage mechanism
Fastformer model
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-