基于大语言模型的问答技术研究进展综述

Review of Research Progress on Question-Answering Techniques Based on Large Language Models

导出

摘要【目的】全面回顾和概述基于大语言模型的问答技术发展现状、机制原理以及应用趋势。【文献范围】选取与基于大语言模型的问答技术相关的73篇文献。【方法】系统梳理大语言模型的发展现状、参数高效微调策略,分别从面向简单问题的检索增强生成问答推理以及面向复杂问题的提示工程问题推理两方面,深入解析各技术的原理机制、应用价值与存在问题。通过定性分析,全面概述基于大语言模型的问答技术研究进展,并提出未来研究方向。【结果】开源预训练大语言模型不断涌现,高效微调策略可显著提升模型垂直领域适配性。借助文本嵌入与近似最近邻检索技术,检索增强生成技术可有效提升问答可解释性与可信度。借助精心构造的提示工程,可大幅拓展大语言模型的复杂问题推理能力。【局限】大语言模型相关研究发展迅速,调研工作未全面覆盖。【结论】基于大语言模型的问答技术在语义表示、复杂推理等多个方面均取得显著进展,融合外部知识的检索增强生成技术与提示工程技术是当前大语言模型领域的主要研究热点,未来研究工作可在生成内容可控、可信等方面展开深入探索。 [Objective]This paper aims to comprehensively review and summarize the current development status,mechanism principles,and application trends of question-answering techniques based on large language models.[Coverage]We retrieved a total of 73 relevant papers.[Methods]The study systematically reviews the development status of large language models and efficient parameter fine-tuning strategies.It analyzes the principles,mechanisms,application value,and existing issues of various techniques.It focuses on retrievalenhanced generation question-answering inference for simple questions and prompt engineering question inference for complex questions.Through qualitative analysis,the research progress of question-answering techniques based on large language models is comprehensively summarized,and future research directions are proposed.[Results]Open-sourced pre-trained large language models continue to emerge,and efficient fine-tuning strategies can significantly improve model adaptability in vertical domains.Retrieval-augmented generation techniques,aided by text embeddings and approximate nearest neighbor retrieval technology,effectively enhance the interpretability and credibility of question-answering.With carefully crafted prompt engineering,the inference capabilities of large models for complex questions can be significantly expanded.[Limitations]The rapid development of research related to large models may result in incomplete coverage of relevant survey work.[Conclusions]Question-answering techniques based on large language models have made remarkable progress in semantic representation,complex reasoning,and other aspects.Retrieval-enhanced generation techniques and prompt engineering,which integrate external knowledge,are the main research hotspots in large models.Future research may focus on exploring aspects such as controllable and credible content generation.

作者文森钱力胡懋地常志军 Wen Sen;Qian Li;Hu Maodi;Chang Zhijun(National Science Library,Chinese Academy of Sciences,Beijing 100190,China;Department of Information Resources Management,School of Economics and Management,University of Chinese Academy of Sciences,Beijing 100190,China;Key Laboratory of New Publishing and Knowledge Services for Scholarly Journals,Beijing 100190,China)

机构地区中国科学院文献情报中心中国科学院大学经济与管理学院信息资源管理系国家新闻出版署学术期刊新型出版与知识服务重点实验室

出处《数据分析与知识发现》 EI CSCD 北大核心 2024年第6期16-29,共14页 Data Analysis and Knowledge Discovery

基金国家重点研发计划(项目编号:2022YFF0711902) 国家社科基金重大项目(项目编号:21&ZD329)的研究成果之一。

关键词大语言模型问答技术向量检索提示工程 Large Language Models Q&A Technology Vector Retrieval Prompt Engineering

分类号 TP391 [自动化与计算机技术—计算机应用技术] G350 [文化科学—情报学]

引文网络
相关文献

参考文献2

1钱力,刘熠,张智雄,李雪思,谢靖,许钦亚,黎洋,管铮懿,李西雨,文森.ChatGPT的技术基础分析[J].数据分析与知识发现,2023,7(3):6-15. 被引量：113
2赵悦阳,崔雷.文本嵌入技术的研究与应用进展[J].数据与计算发展前沿,2023,5(3):92-110. 被引量：2

二级参考文献14

1何永强,秦勤,王俊鹏.基于深度神经网络的嵌入式向量及话题模型[J].计算机工程与设计,2016,37(12):3384-3388. 被引量：4
2Jindong Chen,Xiaoji Zhou,Xijin Tang.AN EMPIRICAL FEASIBILITY STUDY OF SOCIETAL RISK CLASSIFICATION TOWARD BBS POSTS[J].Journal of Systems Science and Systems Engineering,2018,27(6):709-726. 被引量：3
3张涛,王俊峰.基于文本嵌入特征表示的恶意软件家族分类[J].四川大学学报（自然科学版）,2019,56(3):441-449. 被引量：5
4肖琳,陈博理,黄鑫,刘华锋,景丽萍,于剑.基于标签语义注意力的多标签文本分类[J].软件学报,2020,31(4):1079-1089. 被引量：59
5Mahdi Farnaghi,Zeinab Ghaemi,Ali Mansourian.Dynamic Spatio-Temporal Tweet Mining for Event Detection:A Case Study of Hurricane Florence[J].International Journal of Disaster Risk Science,2020,11(3):378-393. 被引量：1
6薛扬,梁循,谢华伦,杜玮.基于最优文档嵌入的《红楼梦》作者辨析[J].中文信息学报,2020,34(9):97-110. 被引量：2
7范昊,李鹏飞.基于FastText字向量与双向GRU循环神经网络的短文本情感分析研究——以微博评论文本为例[J].情报科学,2021,39(4):15-22. 被引量：23
8马建红,张少光,曹文斌,王晨曦.面向功能信息的相似专利动态聚类混合模型[J].计算机应用与软件,2021,38(5):201-207. 被引量：2
9张爽,刘非凡,罗双玲,夏昊翔.基于领域语义地图的区块链研究主题发现及演化分析[J].情报工程,2021,7(2):3-14. 被引量：3
10陈峥,任建坤,袁浩瑞.融合序列和图结构的机器阅读理解[J].中文信息学报,2021,35(4):120-128. 被引量：3

共引文献113

1刘海涛,陈鹏,陈春梅.论生成式人工智能时代的中国式教学现代化——基于学习哲学的视角[J].沈阳师范大学学报（教育科学版）,2023(5):10-17.
2张嗣宏,张健.以ChatGPT为代表的生成式AI对通信行业的影响和应对思考[J].电信科学,2023,39(5):67-75. 被引量：8
3徐鹏.人工智能NLP技术在图书馆智慧服务中的应用研究[J].玩具世界,2023(2):108-110. 被引量：1
4李育辉,谭北平,陈姚.职业技能的迭代还是替代?--广告营销行业AI可替代性的双重评价体系研究[J].现代广告,2023(10):28-36.
5沈浩,卢伟.影视行业中的生成式人工智能:机遇与挑战[J].现代电影技术,2023(6):10-16. 被引量：6
6胡铭,陈竟.类ChatGPT模型在数字检察中的应用前景及规制[J].人民检察,2023(10):45-50. 被引量：3
7张夏恒.ChatGPT的政治社会动能、风险及防范[J].深圳大学学报（人文社会科学版）,2023,40(3):5-12. 被引量：31
8涂良川.“生成式人工智能”逼近通用智能的哲学叙事——ChatGPT追问智能本质的哲学分析[J].东北师大学报（哲学社会科学版）,2023(4):40-47. 被引量：14
9赵高辉,杨柳.资源与需求:ChatGPT技术与传媒业互动路径探析[J].声屏世界,2023(10):9-12. 被引量：1
10李翔,旷银.ChatGPT类人工智能及其生成物的刑法思考[J].贵州师范大学学报（社会科学版）,2023(4):78-91. 被引量：16

1宝日彤,孙海春.多文档摘要研究综述[J].数据分析与知识发现,2024,8(2):17-32. 被引量：1
2吴越,孙海春.基于图神经网络的知识图谱补全研究综述[J].数据分析与知识发现,2024,8(3):10-28. 被引量：2
3王志永,刘晶晶,王新明,陈博文,聂伟,张瀚林,刘洪海.孤独症人工智能诊疗进展及前沿[J].数据与计算发展前沿,2024,6(3):15-27.
4数智决策大脑·大数据战略重点实验室课题组.2023年数字中国发展报告[J].领导决策信息,2024(31):28-31.
5黄洁.Llama 3.1对我国AIGC产业发展的启示[J].服务外包,2024(8):24-26.
6姜瑞婷,张玥,李微,杨光.生物质基碳球材料研究进展综述[J].黑龙江科学,2024,15(14):27-30.
7洪亮,郭瑶,刘兴丽,李宗雨.基于RAG的煤矿安全智能问答模型[J].黑龙江科技大学学报,2024,34(3):487-492.
8李晴,李艳玲,董杰,葛凤培,林民.基于逻辑推理的机器阅读理解综述[J].计算机科学与探索,2024,18(8):1998-2013.
9张雄涛,祝娜,郭玉慧.基于图神经网络的会话推荐方法综述[J].数据分析与知识发现,2024,8(2):1-16. 被引量：1
10芦存博,左璇,金博,张恒硕,张乃柏.大模型在工业安全领域的应用研究与探索[J].新型工业化,2024,14(7):85-95.

数据分析与知识发现

2024年第6期

浏览历史

内容加载中请稍等...

基于大语言模型的问答技术研究进展综述

参考文献2

二级参考文献14

共引文献113

相关作者

相关机构

相关主题

浏览历史