融合对比学习的成语完形填空算法被引量：1

An idiom cloze algorithm incorporating contrastive learning

下载PDF

导出

摘要成语完形填空是机器阅读理解(MRC)的一类子任务,旨在测试模型对中文文本中成语的理解和应用能力.针对现有的成语完形填空算法忽视了成语的嵌入向量会出现表征崩溃的现象,并且模型在域外数据上的准确率低,泛化能力较差的问题,本文提出了NeZha-CLofTN.该算法由嵌入层、融合编码层、图注意力子网络和预测层等4部分组成.其中融合编码层中利用对比学习迫使网络改变特征提取的方式,避免了网络输出恒定的嵌入向量,从而预防了表征的崩溃;预测层综合多个近义词图子网络的输出,以获得比其中单独的子网络更好的预测性能,增强模型的泛化能力.NeZha-ClofTN在ChID-Official和ChID-Competition数据集上进行了实验验证,准确率分别达到80.3%和85.3%,并通过消融实验证明了各个模块的有效性. Idiom cloze test is a subtask in Machine Reading Comprehension(MRC), which aim to test the model’s ability to understand and apply idioms in Chinese text. The existing idiom cloze algorithms ignore the fact that the idiom embeddings suffer from representational collapse, which leads to low accuracy and poor generalization performance on out-of-domain data. In this paper, the authors propose the NeZha-CLofTN, which consists of four parts: embedding layer, fusion coding layer, graph attention subnetwork, and prediction layer. The fusion coding layer uses contrastive learning to force the network to change the feature extraction that avoids the network outputting a constant embedding vector, thus preventing the representational collapse. The prediction layer combines the output of multiple synonym subgraphs to obtain better prediction than a single subgraph and to enhance the generalization performance of the model. NeZha-ClofTN is used in the ChID-Official and ChID-Competition datasets with accuracy of 80.3% and 85.3%, and the effectiveness of each module was demonstrated by ablation experiments.

作者张本文黄方怡琚生根 ZHANG Ben-Wen;HUANG Fang-Yi;JU Sheng-Gen(School of Science and Engineering,Sichuan Minzu College,Kangding 626001,China;College of Computer Science,Sichuan University,Chengdu 610005,China)

机构地区四川民族学院理工学院四川大学计算机学院

出处《四川大学学报（自然科学版）》 CAS CSCD 北大核心 2022年第5期54-63,共10页 Journal of Sichuan University(Natural Science Edition)

基金国家自然科学基金重点项目(62137001)。

关键词成语完形填空预训练语言模型对比学习近义词 Idiom cloze test Pre-trained language model Contrastive learning Synonym idiom

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献1

1徐家伟,刘瑞芳,高升,李思.面向中文成语的阅读理解方法研究[J].中文信息学报,2021,35(7):118-125. 被引量：2

二级参考文献1

1聂言之.通用成语与异体成语[J].江西师范大学学报（哲学社会科学版）,1992,25(2):92-97. 被引量：10

共引文献1

1温雪岩,谷训开,李祯,黄英来,黄鹤林.融合释义与双向交互的成语阅读理解方法研究[J].广西师范大学学报（自然科学版）,2023,41(6):70-79.

同被引文献3

1何利,胡飘.基于用户多维度信任的冷启动推荐模型[J].重庆邮电大学学报（自然科学版）,2018,30(6):827-834. 被引量：8
2齐浩翔,尹玲,马莉媛.融合注意力机制的群组推荐研究[J].重庆邮电大学学报（自然科学版）,2022,34(5):828-835. 被引量：1
3付海涛,刘烁,冯宇轩,朱丽,张竞吉,关路.基于对比学习方法的小样本学习[J].吉林大学学报（理学版）,2023,61(1):111-117. 被引量：4

引证文献1

1闫猛猛,汪海涛,贺建峰,陈星.基于自监督学习的序列推荐算法[J].重庆邮电大学学报（自然科学版）,2023,35(4):722-731. 被引量：2

二级引证文献2

1唐宏,张静,刘斌,金哲正.融合深度神经网络和方面感知的可解释推荐方法[J].重庆邮电大学学报（自然科学版）,2024,36(3):609-618.
2吕磊.基于机器学习的网络安全态势感知关键技术研究[J].网络安全技术与应用,2024(9):55-57.

1刘佳琳,李喆.多模态学习的研究热点、动态前沿与趋势分析--基于CiteSpace软件的可视化分析[J].卫生职业教育,2022,40(19):125-129. 被引量：1
2吴宇成,吴越滨.清初名伶徐紫云绘本形象与功能解读[J].美术大观,2022(9):65-68.
3姚奕,杨帆.联合知识图谱和预训练模型的中文关键词抽取方法[J].计算机科学,2022,49(10):243-251. 被引量：2

四川大学学报（自然科学版）

2022年第5期

浏览历史

内容加载中请稍等...

融合对比学习的成语完形填空算法被引量：1

参考文献1

二级参考文献1

共引文献1

同被引文献3

引证文献1

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

融合对比学习的成语完形填空算法 被引量：1

参考文献1

二级参考文献1

共引文献1

同被引文献3

引证文献1

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

融合对比学习的成语完形填空算法被引量：1