生成式大语言模型在中文放射医学领域的应用研究

Application of Generative Large Language Models in Chinese Radiology Domain

下载PDF

导出

摘要在中文放射医学领域中,影像学报告是临床决策的重要依据。因此,利用自然语言处理(NLP)技术来理解和学习影像学报告的文本内容,并以此辅助完成放射科临床工作,已成为该领域的重要研究方向。然而,在使用传统方法处理基于中文影像学报告的自然语言分类与生成任务时,仍然面临训练语料匮乏且涉及隐私、模型泛化能力较差等限制导致的综合性能不足的情况。针对上述问题,提出了一种基于本地高效微调大语言模型的中文放射医学领域自然语言任务解决方案。通过收集并构建大规模高质量中文影像学报告自然语言任务数据集,采用LoRA高效微调方法对开源大语言模型Baichuan2进行有监督微调训练,提出了能够同时解决四种中文放射医学领域临床任务的“龙影大模型”。提出了一套中文放射医学领域自然语言分类与生成任务评价体系。在来自两家中心的三个医学影像种类的报告数据集上进行了多组实验,并与几种典型现有方法进行了对比,结果显示所提方法在分类性能、文本总结与扩充能力和模型泛化性上表现更好。 In the Chinese radiology domain,radiology reports serve as a crucial basis for clinical decision-making.Therefore,utilizing natural language processing(NLP)technology to understand and learn from the textual content of radiology reports,thereby aiding radiological clinical work,has become an important research direction in this domain.However,when dealing with the natural language classification and generation tasks based on Chinese radiology reports using traditional methods,there are still challenges such as a lack of training corpora,privacy concerns,and poor model generalization capabilities,leading to insufficient overall performance.To address these issues,a solution for natural language tasks in the Chinese radiology domain based on locally efficient fine-tuning large language models is proposed.By collecting and constructing a large-scale,high-quality dataset for natural language tasks in the Chinese radiology reports,and employing the LoRA efficient fine-tuning method for supervised fine-tuning training of the open-source large language model Baichuan2,the“RadGPT”capable of solving four types of clinical tasks in the Chinese radiology domain simultaneously is proposed.A set of evaluation systems for natural language classification and generation tasks in the Chinese radiology domain is introduced.Multiple sets of experiments are conducted on three types of radiology report datasets from two centers,and comparisons are made with several typical existing methods.The results demonstrate that the proposed method performs better in terms of classification performance,text summarization and expansion capabilities,and model generalization.

作者陈龙飞高鑫侯皓天叶初阳刘亚欧张美慧 CHEN Longfei;GAO Xin;HOU Haotian;YE Chuyang;LIU Ya'ou;ZHANG Meihui(School of Computer Science&Technology,Beijing Institute of Technology,Beijing 100081,China;School of Integrated Circuits and Electronics,Beijing Institute of Technology,Beijing 100081,China;Department of Radiology,Beijing Tiantan Hospital,Capital Medical University,Beijing 100070,China)

机构地区北京理工大学计算机学院北京理工大学集成电路与电子学院首都医科大学附属北京天坛医院放射科

出处《计算机科学与探索》 CSCD 北大核心 2024年第9期2337-2348,共12页 Journal of Frontiers of Computer Science and Technology

关键词大语言模型影像学报告文本分类文本生成高效微调策略 large language model radiology report text classification text generation efficient fine-tuning strategy

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献2

1吴江,侯绍新,靳萌萌,胡忠义.基于LDA模型特征选择的在线医疗社区文本分类及用户聚类研究[J].情报学报,2017,36(11):1183-1191. 被引量：44
2杜琳,曹东,林树元,瞿溢谦,叶辉.基于BERT与Bi-LSTM融合注意力机制的中医病历文本的提取与自动分类[J].计算机科学,2020,47(S02):416-420. 被引量：27

二级参考文献2

1谌志群,张国煊.文本挖掘研究进展[J].模式识别与人工智能,2005,18(1):65-74. 被引量：49
2杨善林,李永森,胡笑旋,潘若愚.K-MEANS算法中的K值优化问题研究[J].系统工程理论与实践,2006,26(2):97-101. 被引量：190

共引文献68

1陆晨晨,王昊,石斌,裘靖文.面向电商用户评论的细粒度观点挖掘及其分布规律探究[J].知识管理论坛,2024(3):253-268.
2张莉曼,张向先,卢恒,张玲.知识直播平台付费用户群体画像研究[J].图书情报工作,2019,63(5):84-91. 被引量：21
3吴菊华,王煜,黎明,蔡少云.基于加权知识网络的在线健康社区用户知识发现[J].数据分析与知识发现,2019,3(2):108-117. 被引量：3
4陆泉,朱安琪,张霁月,陈静.中文网络健康社区中的用户信息需求挖掘研究——以求医网肿瘤板块数据为例[J].数据分析与知识发现,2019,3(4):22-32. 被引量：20
5张俊,张凯,林单,陈亚军.一种基于离散度及相关性改进的特征选择方法[J].内江师范学院学报,2019,34(10):46-50. 被引量：1
6邓君,胡明乐.用户感知视角下在线医疗社区信息服务质量评价体系研究[J].情报理论与实践,2019,42(10):91-96. 被引量：15
7张会兵,钟昊,胡晓丽.基于主题分析的用户评论聚类方法[J].计算机科学,2019,46(8):50-55. 被引量：4
8张泰瑞,陈渝.基于LDA模型因素提取的健康信息用户转移行为研究[J].图书情报工作,2019,63(21):66-77. 被引量：13
9董园园.利用协变量调整控制混杂因子的鲁棒文本分类[J].计算机系统应用,2020,29(3):155-160.
10娄岩,杨嘉林,黄鲁成,苗红.基于网络问答社区的老年科技公众关注热点及情感分析——以“知乎”为例[J].情报杂志,2020,39(3):115-122. 被引量：21

1刘江峰,刘雏菲,齐月,刘浏,李斌,刘畅,王东波.AIGC助力数字人文研究的实践探索:SikuGPT驱动的古诗词生成研究[J].情报理论与实践,2023,46(5):23-31. 被引量：12
2鹿志平.网络语言分类及其影响探析[J].汉字文化,2024(11):16-18.
3萨沙.使用4种统计指标对语言进行分类[J].南开语言学刊,2023(2):61-61.
4孔建国,韩琪聪,梁海军,李煜琨.基于Conformer的端到端中英文管制语音识别[J].航空计算技术,2024,54(3):1-5.
5张新宇,张家意,高欣.ASC-Net:腹腔镜视频中手术器械与脏器快速分割网络[J].图学学报,2024,45(4):659-669.
6郭嘉,崔思涵.汉英三音节词语音突显对比实验分析[J].中国语音学报,2022(2):100-117.
7刘赟,张位,郑周荣,王梦.针对混合输入的源代码分类技术[J].通信技术,2024,57(7):725-730.
8冯小荣,高正达,王进,王兴隆,惠康华.基于紧致子序列的航班着陆调度问题研究[J].北京航空航天大学学报,2024,50(8):2421-2431.

计算机科学与探索

2024年第9期

浏览历史

内容加载中请稍等...

生成式大语言模型在中文放射医学领域的应用研究

参考文献2

二级参考文献2

共引文献68

相关作者

相关机构

相关主题

浏览历史