融合问题分类与RoBERTa的答案选择方法被引量：1

An Answer Selection Method Integrating Question Classification and RoBERTa

导出

摘要【目的】为解决现有预训练模型在答案选择任务中对问答句之间的语义交互信息利用不足、模型进行微调时精度不稳定等问题,提出融合问题分类与RoBERTa模型的答案选择方法。【方法】提出保留原实体语义的EAT标注方法并结合多句联合建模的RoBERTa模型构建答案选择模型。此外,通过两段微调过程,对模型进行迁移学习,提高模型微调过程的精度稳定性。【结果】在WiKiQA数据集上,本文方法在P@1、MAP和MRR三个指标分别达到0.843、0.896、0.903;在TrecQA数据集上,上述三个指标分别达到0.955、0.944、0.974。同时,该方法提升了模型精度收敛过程的稳定性。【局限】对于“缩写(ABBR)”和“描述(DESC)”这两种类型的复杂问题,使用命名实体识别工具无法抽取答案句中的关键实体,导致不能利用这两种分类信息增强问答句语义信息交互建模。【结论】将保留原实体语义的融合问题分类信息方法与迁移-自适应策略引入多句建模RoBERTa模型,可以有效提升模型表现并改善模型的鲁棒性。 [Objective]This paper proposes an answer selection method integrating question classification with the RoBERTa model.It aims to address the issues in existing pre-trained models,such as insufficient utilization of semantic interaction information between question-answer sentences and unstable accuracy during fine-tuning.[Methods]We introduced an EAT annotation approach that retained the original entity semantics and combined it with multi-sentence joint-RoBERTa modeling to construct an answer selection model.Additionally,we employed a two-stage fine-tuning process for transfer learning to enhance the model’s stability during fine-tuning.[Results]The proposed method achieved P@1,MAP,and MRR scores of 0.843,0.896,and 0.903 on the WiKiQA dataset.On the TrecQA dataset,the scores reached 0.955,0.944,and 0.974,respectively.Moreover,this method enhanced the stability of the model’s accuracy convergence process.[Limitations]For complex questions of the types“abbreviations(ABBR)”and“descriptions(DESC)”,the new method cannot effectively extract key entities from the answer sentences.Therefore,we cannot use the classification information to enhance semantic interaction modeling between question-answer sentences.[Conclusions]The proposed method could effectively improve model performance and robustness.

作者何丽柳岚清刘杰段建勇王昊 He Li;Liu Lanqing;Liu Jie;Duan Jianyong;Wang Hao(School of Information Science and Technology,North China University of Technology,Beijing 100144,China;China CNONIX National Standard Application and Promotion Lab,Beijing 100144,China;Research Center for Language Intelligence of China,Capital Normal University,Beijing 100089,China)

机构地区北方工业大学信息学院 CNONIX国家标准应用与推广实验室首都师范大学中国语言智能研究中心

出处《数据分析与知识发现》 EI CSSCI CSCD 北大核心 2024年第8期157-167,共11页 Data Analysis and Knowledge Discovery

基金科技创新2030—“新一代人工智能”重大项目(项目编号:2020AAA0109703) 北方工业大学北京城市治理研究基地(项目编号:2023CSZL16)的研究成果之一

关键词答案选择期望答案类型问题分类 RoBERTa 微调迁移学习 Answer Sentence Selection Expected Answer Type Question Classification RoBERTa Fine-Tune Transfer Learning

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

同被引文献19

1张军玲.我国网络舆情信息挖掘研究综述[J].情报科学,2016,34(11):167-172. 被引量：23
2黄畅,郭文忠,郭昆.基于双向量模型的自适应微博话题追踪方法[J].小型微型计算机系统,2019,40(6):1203-1209. 被引量：5
3许烨婧,黄微,郭苏琳,徐烨.多媒体网络舆情话题衍进追踪态势及机理解析[J].情报理论与实践,2020,43(12):156-162. 被引量：7
4邓建高,吴灵铭,齐佳音,徐绪堪,刘亦航.基于信息关联的负面网络舆情风险分级与预测研究[J].情报科学,2022,40(1):38-43. 被引量：12
5郭宇,张传洋,张海涛,于文倩.危机管理视角下突发事件舆情主题演化与治理分析[J].图书情报工作,2022,66(8):113-121. 被引量：24
6朱恒民,钱莉,杨欣谊,魏静.网络舆情话题漂移路径研究[J].情报杂志,2022,41(6):108-113. 被引量：5
7陈虹枢,宋亚慧,金茜茜,汪雪锋.动态主题网络视角下的突破性创新主题识别:以区块链领域为例[J].图书情报工作,2022,66(10):45-58. 被引量：22
8陈苗苗,安璐.突发传染病情境下社会化问答平台用户角色形成及转变——以知乎平台为例[J].图书情报工作,2022,66(12):68-81. 被引量：3
9徐璐璐,杨嘉乐,康乐乐.医学信息领域人工智能技术的主题漂移与未来展望——基于JCR 26本医学信息期刊文本的命名实体识别[J].现代情报,2022,42(10):163-176. 被引量：4
10李玥琪,王晰巍,王楠阿雪,王小天.突发事件下社交媒体网络舆情风险识别及预警模型研究[J].情报学报,2022,41(10):1085-1099. 被引量：15

引证文献1

1周炜,安璐,韩瑞莲.突发事件网络舆情主题转变路径及其风险评估[J].情报学报,2024,43(10):1227-1241.

1孟皓,运红颖,汪涛.ABBR启动ANAMMOX工艺的性能及内部流场结构研究[J].水处理技术,2023,49(8):98-103.
2蒋汶娟,过弋,付娇娇.融合图注意力的复杂时序知识图谱推理问答模型[J].计算机应用,2024,44(10):3047-3057.
3王宁,李秀峰,聂辽栋,刘登程,于勤,樊华春,徐炜.基于MI特征选择的车辆能耗高精度预测方法[J].同济大学学报（自然科学版）,2024,52(S01):39-45.
4陈静.会计核算在风险管理中的作用与优化策略[J].活力,2024,42(22):142-144.
5陈源,陈帅,潘悦.网络安全场景中的自适应策略切换方法及其应用[J].中国科技成果,2024,25(22):22-24.
6周文,后接.CNN振动图像故障诊断方法在熔盐泵中的应用[J].中国设备工程,2024(22):168-173.
7杨元琴,尹翠红,申晓红,吴思超,王安秀.奥马哈系统在老年慢性阻塞性肺疾病健康教育方案构建中的可行性研究[J].中西医结合护理,2024,10(10):24-29.
8Lei Xia,Xiao Liu,Zhan Mao,Yanbin Cai,Jing Zhu,Jiyang Xie,Wanbiao Hu.Temperature/electric field induced photoluminescence-modulation effect in dysprosium-doped barium titanate ferroelectric ceramics[J].Journal of Materiomics,2024,10(5):1117-1125.
9高卓凡,郭文利.一种新的基于Sigmoid函数的分布式深度Q网络概率分布更新策略[J].计算机科学,2024,51(12):277-285.
10刘振华,吴磊,张康生.基于多尺度特征交叉融合注意力的滚动轴承故障诊断方法[J].轴承,2024(12):80-86.

数据分析与知识发现

2024年第8期

浏览历史

内容加载中请稍等...

融合问题分类与RoBERTa的答案选择方法被引量：1

同被引文献19

引证文献1

相关作者

相关机构

相关主题

浏览历史

融合问题分类与RoBERTa的答案选择方法 被引量：1

同被引文献19

引证文献1

相关作者

相关机构

相关主题

浏览历史

融合问题分类与RoBERTa的答案选择方法被引量：1