基于多层感知机和语义矩阵的答案选择模型被引量：2

Answer Selection Model Based on MLP and Semantic Matrix

下载PDF

导出

摘要答案选择是问答系统领域的关键子任务,其性能表现支撑着问答系统的发展。基于参数冻结的BERT模型生成的动态词向量存在句级语义特征匮乏、问答对词级交互关系缺失等问题。多层感知机具有多种优势,不仅能够实现深度特征挖掘,且计算成本较低。在动态文本向量的基础上,文中提出了一种基于多层感知机和语义矩阵的答案选择模型,多层感知机主要实现文本向量句级语义维度重建,而通过不同的计算方法生成语义矩阵能够挖掘不同的文本特征信息。多层感知机与基于线性模型生成的语义理解矩阵相结合,实现一个语义理解模块,旨在分别挖掘问题句和答案句的句级语义特征;多层感知机与基于双向注意力计算方法生成的语义交互矩阵相结合,实现一个语义交互模块,旨在构建问答对之间的词级交互关系。实验结果表明,所提模型在WikiQA数据集上MAP和MRR分别为0.789和0.806,相比基线模型,该模型在性能上有一致的提升,在SelQA数据集上MAP和MRR分别为0.903和0.911,也具有较好的性能表现。 Answer selection is a key sub-task in the field of question answering systems,and its performance supports the deve-lopment of question answering systems.The dynamic word vector generated by the BERT model based on parameter freezing also has problems such as lack of sentence-level semantic features and the lack of word-level interaction between question and answer.Multilayer perceptrons have a variety of advantages,they not only can achieve deep feature mining,but also have low computational costs.On the basis of dynamic text vectors,this paper proposes an answer selection model based on multi-layer perceptrons and semantic matrix,which mainly realizes the semantic dimension reconstruction of text vector sentences,and generates semantic matrix through different calculation methods to mine different text feature information.The multi-layer perceptron is combined with the semantic understanding matrix generated by the linear model to implement a semantic understanding module,which aims to excavate the sentence-level semantic characteristics of the question sentence and the answer sentence respectively;the multi-layer perceptron is combined with the semantic interaction matrix generated based on the two-way attention calculation method to achieve a semantic interaction module,which aims to build the word-level interaction relationship between the question and answer pairs.Experimental results show that the proposed model has a MAP and MRR of 0.789 and 0.806 on the WikiQA dataset,respectively,which has a consistent performance improvement over the baseline model,on the SelQA dataset,MAP and MRR is 0.903 and 0.911,respectively,which also has a good performance.

作者罗亮程春玲刘倩归耀城 LUO Liang;CHENG Chunling;LIU Qian;GUI Yaocheng(School of Computer Science,Nanjing University of Posts and Telecommunications,Nanjing 210023,China;School of Modern Posts,Nanjing University of Posts and Telecommunications,Nanjing 210023,China)

机构地区南京邮电大学计算机学院、软件学院、网络空间安全学院南京邮电大学现代邮政学院

出处《计算机科学》 CSCD 北大核心 2023年第5期270-276,共7页 Computer Science

基金江苏省双创博士项目(JSSCBS20210507) 南京邮电大学引进人才科研启动基金(NY220176)。

关键词答案选择 BERT模型动态词向量多层感知机语义矩阵 Answer selection BERT model Dynamic word vector Multilayer perceptron Semantic matrix

分类号 TP391.1 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献3

1李志超,吐尔地•托合提,艾斯卡尔•艾木都拉.基于动态注意力和多角度匹配的答案选择模型[J].计算机应用,2021,41(11):3156-3163. 被引量：2
2QIU XiPeng,SUN TianXiang,XU YiGe,SHAO YunFan,DAI Ning,HUANG XuanJing.Pre-trained models for natural language processing: A survey[J].Science China(Technological Sciences),2020,63(10):1872-1897. 被引量：121
3刘睿珩,叶霞,岳增营.面向自然语言处理任务的预训练模型综述[J].计算机应用,2021,41(5):1236-1246. 被引量：17

二级参考文献2

1孙源,王健,张益嘉,钱凌飞,林鸿飞.融合粗细粒度信息的长答案选择神经网络模型[J].中文信息学报,2021,35(4):100-109. 被引量：1
2冯文政,唐杰.融合深度匹配特征的答案选择模型[J].中文信息学报,2019,33(1):118-124. 被引量：7

共引文献137

1丁美荣,冯伟森,黄荣翔,罗嘉俊.基于预训练模型和基础词典扩展的酒店评论情感分析[J].计算机系统应用,2022,31(11):296-308. 被引量：3
2曹艳琴.基于深度学习的英语自然语言处理系统[J].系统仿真技术,2021,17(4):285-288. 被引量：1
3王伟,阮文翰,孟祥福.融合对抗训练的中文GPT对话模型研究[J].辽宁工程技术大学学报（自然科学版）,2023(3):378-384.
4邱凯锋,王则远,何志超,付凯利,梅童霖,关英杰,高飞,伍俊妍.人工智能技术在超说明书用药循证中的应用研究[J].中华临床医师杂志（电子版）,2023,17(12):1212-1218.
5余同瑞,金冉,韩晓臻,李家辉,郁婷.自然语言处理预训练模型的研究综述[J].计算机工程与应用,2020,56(23):12-22. 被引量：41
6郝超,裘杭萍,孙毅,张超然.多标签文本分类研究进展[J].计算机工程与应用,2021,57(10):48-56. 被引量：23
7邱石贵,章化奥,段湘煜,张民.神经机器翻译的词级别正则化[J].厦门大学学报（自然科学版）,2021,60(4):662-669.
8王涛,刘超辉,郑青青,黄嘉曦.基于单向Transformer和孪生网络的多轮任务型对话技术[J].计算机工程,2021,47(7):55-58.
9陈晓玲,唐丽玉,胡颖,江锋,彭巍,冯先超.基于ALBERT模型的园林植物知识实体与关系抽取方法[J].地球信息科学学报,2021,23(7):1208-1220. 被引量：5
10刘畅,阿布都克力木·阿布力孜,姚登峰,哈里旦木·阿布都克里木.维吾尔语形态分析研究综述[J].计算机工程与应用,2021,57(15):42-61. 被引量：3

同被引文献14

1方月彤,黄惠晟,陈麒骏,徐欣.基于多层感知机的情绪分类系统[J].产业与科技论坛,2021,20(2):35-37. 被引量：1
2王冬,甘恒,黄文峰,黄政龙,陈中举.基于MLP模型的影评情感分析研究[J].中国科技论文在线精品论文,2021(2):208-211. 被引量：2
3夏瑜潞.循环神经网络的发展综述[J].电脑知识与技术,2019,15(7X):182-184. 被引量：27
4苏慧婧,索朗拉姆,尼玛扎西,群诺.基于MLP和SepCNN神经网络模型的藏文文本分类研究[J].软件,2020,41(12):11-17. 被引量：3
5黄英双,曹辉.改进人工蜂群算法优化支持向量机及应用[J].计算机应用与软件,2021,38(2):258-263. 被引量：15
6江涛.基于MLP神经网络的商品评论情感分析[J].电子制作,2021,29(12):36-37. 被引量：3
7王婉,张向先,卢恒,张莉曼.融合FastText模型和注意力机制的网络新闻文本分类模型[J].现代情报,2022,42(3):40-47. 被引量：7
8王颖洁,朱久祺,汪祖民,白凤波,弓箭.自然语言处理在文本情感分析领域应用综述[J].计算机应用,2022,42(4):1011-1020. 被引量：38
9王海宁.自然语言处理技术发展[J].中兴通讯技术,2022,28(2):59-64. 被引量：18
10李福祥,王雪,张驰,周明.基于边界点的支持向量机分类算法[J].陕西理工大学学报（自然科学版）,2022,38(3):30-38. 被引量：19

引证文献2

1房伟伟,韩猛.人工智能在自然语言处理中的应用[J].信息记录材料,2023,24(9):221-223.
2王德才,蒋业政,冯雪萍.基于深度学习的图书资源借阅推荐算法研究[J].信息与电脑,2024,36(4):132-134.

1程玉胜,徐玉婷,王一宾,缪佳李.基于共享子空间的潜在语义学习[J].南京大学学报（自然科学版）,2022,58(5):816-826. 被引量：2
2陈林.例谈整体思想在解高考题中的应用[J].高中数理化,2023(7):36-37.
3姚雨浓.上海话口语对话语体中存在句的句法研究[J].汉字文化,2022(19):32-34.
4王开扬,郑刚,杨志坚,肖金星,苗周迪.餐厨垃圾的微生物处理技术研究分析[J].中文科技期刊数据库（全文版）自然科学,2022(2):0037-0039.
5赵展一,李贞贞,钟永恒,王辉,刘佳,孙源,宋姗姗.融合专利类别与语义信息的企业潜在技术关系测算方法研究[J].情报理论与实践,2023,46(3):200-208. 被引量：6
6吕天凤,宋新杰,吴丽,孙娟,张尧,石煜倩,吴元锋.食品中喹诺酮类抗生素的光学和电化学传感器检测方法研究进展[J].食品工业科技,2023,44(9):465-474.
7万杨,陈庚豪,栾兴贺,周龙早,吴丰顺.AT切型石英晶圆抛光工艺对材料去除速率及厚度非均匀性的影响[J].微纳电子技术,2023,60(3):427-434. 被引量：1
8周能容.基于生物学学科核心素养的概念教学策略——以“免疫调节”概念构建为例[J].中学生物教学,2023(8):9-12.
9矫梦蝶,赖昭,申岭鑫,张其聪.金属手表外壳非牛顿流体磨盘抛光工艺参数研究[J].建模与仿真,2023,12(2):1048-1057.
10周莹,刘军彤,宁顺宇,石岩,杨宇峰.胆汁酸代谢与2型糖尿病研究进展[J].辽宁中医药大学学报,2023,25(3):142-146. 被引量：2

计算机科学

2023年第5期

浏览历史

内容加载中请稍等...

基于多层感知机和语义矩阵的答案选择模型被引量：2

参考文献3

二级参考文献2

共引文献137

同被引文献14

引证文献2

相关作者

相关机构

相关主题

浏览历史

基于多层感知机和语义矩阵的答案选择模型 被引量：2

参考文献3

二级参考文献2

共引文献137

同被引文献14

引证文献2

相关作者

相关机构

相关主题

浏览历史

基于多层感知机和语义矩阵的答案选择模型被引量：2