融合句法信息和编辑向量的句子复述生成

Paraphrase Generation with Syntactic Information and Edit Vectors

下载PDF

导出

摘要复述生成技术是自然语言处理领域重要的研究方向,具有广泛的应用场景。目前的预训练模型能够很好地从文本中获取丰富的语义信息,但这些模型生成的复述句在语法结构上缺乏多样性。为解决上述问题,该文对比了不同预训练模型在复述生成任务上的效果,选择UniLM预训练模型作为基础模型,并在此基础上提出了新的句子复述生成方法。首先提出了一种构建句法模板的方法,在不改变模板句的句法结构的前提下,使用特殊字符替换模板句中相关词性的词,同时提出编辑向量的方法用于增强预训练模型。实验结果表明,在Quora和ParaNMT-small数据集上,该文提出的模型在自动评价和人工评价指标上均有明显提升。 Paraphrase generation technology is an important research direction in natural language processing.Current pre-trained models fail to generate the paraphrases with diverse syntactic structures.This paper proposes a sentence paraphrase generation method based on UniLM pre-trained model.Firstly,we propose a method for constructing syntax templates,which uses special characters to replace relevant part-of-speech words without modifying the syntactic structure in the templates.Also,we propose edit vectors to enhance the pre-trained model.Experiments on the Quora and ParaNMT-small datasets demonstrate the improvements of this method in both automatic and human evaluation metric.

作者路曼王东升钟家国李佳伟 LU Man;WANG Dongsheng;ZHONG Jiaguo;LI Jiawei(School of Computer Science,Jiangsu University of Science and Technology,Zhenjiang,Jiangsu 212100,China)

机构地区江苏科技大学计算机学院

出处《中文信息学报》 CSCD 北大核心 2024年第10期165-174,共10页 Journal of Chinese Information Processing

基金国家自然科学基金(61702234) 船舶总体性能创新研究开放基金(25422217)。

关键词复述生成预训练模型多样性 paraphrase generation pre-trained model diversity

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

1陈娟娟,郭阳,张子柯.科学探究学习中思维导图的自动评价方法[J].开放学习研究,2024,29(5):14-22.
2卢加伟,黄颖.国际网络互动中身份构建的人际语用研究——以Quora为例[J].外语电化教学,2024(4):85-90.
3王昊,吴军华.基于自然语言句法信息的正则表达式生成[J].计算机科学,2024,51(S02):92-97.
4臧洁,鲁锦涛,王妍,李翔,廖慧之.融合双通道特征的中文短文本情感分类模型[J].计算机工程与应用,2024,60(21):116-126.
5许炳贤,叶颖,葛舒薇.多技术融合实现实验室测试全过程自动化[J].工业控制计算机,2024,37(10):44-45.
6赵聚雪.人工智能在职业教育自动批改中的应用[J].计算机应用文摘,2024,40(20):73-76.
7支思威,李茂西,吴水秀,陈有德.深层差异特征增强的机器翻译自动评价[J].中文信息学报,2024,38(10):46-53.
8金小婷.基于CBE的课程自动评价与监督系统构建[J].科教文汇,2024(20):159-163.
9杨帮雄.动车组列车智能乘员管理系统的构建[J].铁道运营技术,2024,30(4):10-13.
10胥备,许鹏.对话场景下的情感引导问题生成模型[J].计算机科学,2024,51(11):265-272.

中文信息学报

2024年第10期

融合句法信息和编辑向量的句子复述生成

相关作者

相关机构

相关主题

融合句法信息和编辑向量的句子复述生成

相关作者

相关机构

相关主题

微信扫一扫：分享