大模型驱动的科技政策法规问答系统研究

Research on Science and Technology Policy and Regulation Q&A System Driven by Large Models

下载PDF

导出

摘要科技政策法规问答系统(Q&A)在帮助公众理解和应用科技法规方面发挥关键作用。大语言模型(LLM)可以显著提升科技政策法规问答系统的准确性和效率。然而,基于大语言模型的科技政策法规问答系统仍然存在以下问题:缺乏大规模高质量的科技政策法规问答数据集,且现有自动构建大规模数据集的方法在引用和整合政策法规知识方面存在不足;问答系统在处理科技政策法规问题时,专业性、准确性不足且模型知识更新滞后。为解决这些问题,提出了一种检索增强自提示的问答数据集构建方法,并构建了一个大规模高质量的科技政策法规问答数据集;同时,构建了科技政策法规问答系统,该系统结合了经过低秩自适应(LoRA)微调技术优化的大语言模型与科技政策法规知识库,并运用提示学习技术,来引导系统生成准确的答案。实验结果显示,构建的问答数据集在引用和整合科技政策法规知识方面,比传统方法构建的问答数据集有显著提升;相较于通用大语言模型驱动的问答系统,该问答系统在各项指标上也有明显提高。 A question-and-answer(Q&A)system for science and technology(S&T)policies and regulations plays a critical role in helping the public understand and apply these regulations.Large language models(LLM)can significantly enhance the accuracy and efficiency of such systems.However,current LLM-based S&T policy and regulation Q&A systems face several challenges:the lack of large-scale,high-quality datasets,insufficient methods for automatically constructing datasets with accurate policy and regulation knowledge integration,and issues with the professional accuracy and timeliness of the models’knowledge updates.To address these challenges,this paper proposes a retrieval-augmented self-prompting method for constructing a high-quality,large-scale S&T policy and regulation Q&A dataset.Additionally,a Q&A system is developed,which combines an LLM optimized by low-rank adaptation(LoRA)techniques with an S&T policy and regulation knowledge base,and employs prompt learning techniques to guide the system in generating accurate answers.Experimental results demonstrate that the constructed Q&A dataset significantly improves the integration of policy and regulation knowledge compared with traditional methods.Furthermore,the proposed Q&A system outperforms general LLM-driven systems across various metrics,highlighting its enhanced performance in the domain of S&T policies and regulations.

作者向小伟申艳光胡明昊闫天伟罗威罗准辰 XIANG Xiaowei;SHEN Yanguang;HU Minghao;YAN Tianwei;LUO Wei;LUO Zhunchen(School of Information and Electrical Engineering,Hebei University of Engineering,Handan,Hebei 056038,China;Military Science Information Research Center,Academy of Military Sciences,Beijing 100142,China;College of Computer,National University of Defense Technology,Changsha 410037,China)

机构地区河北工程大学信息与电气工程学院军事科学院军事科学信息研究中心国防科技大学计算机学院

出处《计算机科学与探索》 CSCD 北大核心 2024年第9期2349-2360,共12页 Journal of Frontiers of Computer Science and Technology

基金国家自然科学基金面上项目(62376284)。

关键词大语言模型问答数据集低秩自适应微调提示学习科技政策法规问答系统 large language model question-and-answer dataset low-rank adaptive fine-tuning prompt learning science and technology policy and regulation question-and-answer system

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献6

1刘伟,范旭.基于社会主要矛盾判断的科技政策跃迁及创新[J].中国科技论坛,2023(5):29-36. 被引量：2
2胡志强,李朋骏,王金龙,熊晓芸.基于ChatGPT增强和监督对比学习的政策工具归类研究[J].计算机工程与应用,2024,60(7):292-305. 被引量：1
3李辉,曾文,吴晨生,李荣,樊彦芳.中文科技政策数据分析方法研究——以新能源汽车领域科技政策为例[J].现代情报,2018,38(6):68-72. 被引量：5
4李牧南,王良,赖华鹏.基于深度学习的我国科技政策属性识别[J].科研管理,2024,45(2):1-11. 被引量：1
5郑新曼,董瑜.政策文本量化研究的综述与展望[J].现代情报,2021,41(2):168-177. 被引量：52
6张鹤译,王鑫,韩立帆,李钊,陈子睿,陈哲.大语言模型融合知识图谱的问答系统研究[J].计算机科学与探索,2023,17(10):2377-2388. 被引量：30

二级参考文献71

1张媛媛.全面建设社会主义现代化国家与解决新时代社会主要矛盾关系论析[J].前沿,2021(4):27-35. 被引量：1
2李牧南,王良,赖华鹏.中文科技政策文本分类:增强的TextCNN视角[J].科技管理研究,2023,43(2):160-166. 被引量：5
3王超.深度学习在行业指数技术分析中的应用研究[J].管理评论,2021,33(3):75-83. 被引量：3
4周钦强,孙炳达,王义.文本自动分类系统文本预处理方法的研究[J].计算机应用研究,2005,22(2):85-86. 被引量：15
5张二芳.正确认识和解决社会主义社会的主要矛盾[J].理论探索,2000(2):18-21. 被引量：1
6罗杰,陈力,夏德麟,王凯.基于新的关键词提取方法的快速文本分类系统[J].计算机应用研究,2006,23(4):32-34. 被引量：17
7李燕萍,吴绍棠,郜斐,张海雯.改革开放以来我国科研经费管理政策的变迁、评介与走向——基于政策文本的内容分析[J].科学学研究,2009,27(10):1441-1447. 被引量：104
8肖士恩.基于创新型社会的地方科技创新政策评估理论研究[J].科技进步与对策,2010,27(1):103-105. 被引量：12
9汪涛,安暄.类定量化科技政策文本分析框架构建及北京市科技政策演进分析[J].技术经济,2011,30(6):15-17. 被引量：33
10杨阳,郑彦宁,陈峰,赵筱媛,刘志辉.德国发展海上风电的政策分析[J].中国科技论坛,2011(10):154-160. 被引量：5

共引文献85

1刘勘,赵帅,彭虎锋,黄漫宇.营商环境政策的主题演化研究[J].知识管理论坛,2022(3):314-331. 被引量：1
2李慧,余明明.地方政府实施研学旅行注意力配置——基于20个省级政策文本分析[J].绥化学院学报,2023,43(5):15-18. 被引量：1
3徐鲲,张皓月,宋正雯.考虑语调的区域创新政策测度指标改进及评价:基于七个主要经济区政策文本挖掘的研究[J].北京联合大学学报（人文社会科学版）,2023,21(5):60-70.
4刘伟江,孙聪,赵敏慧.科技政策与区域生产率增长——创业与创新的链式中介作用[J].经济管理,2019,41(4):40-56. 被引量：19
5迟玉琢.2018年我国情报学研究进展[J].山东图书馆学刊,2019,0(4):24-31. 被引量：1
6梁继文,杨建林,王伟.政策对科研选题的影响——基于政策文本量化方法的研究[J].现代情报,2021,41(8):109-118. 被引量：10
7赵雪芹,吴鹏,胡慧慧.我国电商扶贫政策分析与对策研究——基于政策工具视角[J].情报工程,2021,7(4):40-54. 被引量：7
8张雨,吴俊.科技政策知识图谱构建研究[J].数字图书馆论坛,2021(8):31-38. 被引量：14
9赵璇.中国减税降费政策制度与体系研究——基于文本分析维度的研究[J].技术经济与管理研究,2021(11):101-106. 被引量：1
10郑新曼,董瑜.基于科技政策文本的程度词典构建研究[J].数据分析与知识发现,2021,5(10):81-93. 被引量：11

1赵金国.贵州省科技(专利)政策法规检索平台建设方案[J].中文科技期刊数据库（文摘版）社会科学,2016(7):296-297.
2骆严,焦洪涛.“技术路线决定权”作为政策法规范畴的演进[J].科学学研究,2024,42(5):991-999.
3高晖.无人机技术在广播发射台巡检与维护中的应用[J].中文科技期刊数据库（文摘版）工程技术,2024(4):0057-0061.
4郭莹琨.论党内法规的法律属性[J].时代人物,2024(6):150-153.
5《科技广场》2024年征稿启事[J].科技广场,2023(6).
6曹爱红,王艳辉,王娜.我国重点省市科研项目管理的地方性法规对比研究——基于新修订《科学技术进步法》的视角[J].科技管理研究,2023,43(12):41-48. 被引量：1
7杜仲鑫,翟敬华,黄晓蓉.人工智能在医学影像设备故障处理中的应用与优化[J].微型计算机,2024(6):109-111.
8张涛,胡晶晶,高丽.毫米波雷达在地下矿井结构三维重建中的应用研究[J].现代工程科技,2024,3(2):5-8.
9刘建伟.新会计准则下的企业税务筹划及管理[J].赣商,2024(2):145-147.
10康勇,田顺红.人工智能在光伏安全检测中的应用研究[J].自动化博览,2024,41(6):30-35.

计算机科学与探索

2024年第9期

浏览历史

内容加载中请稍等...

大模型驱动的科技政策法规问答系统研究

参考文献6

二级参考文献71

共引文献85

相关作者

相关机构

相关主题

浏览历史