基于深度学习的中文临床实验筛选标准的分类被引量：1

Classification of Screening Criteria for Chinese Clinical Trials based on Deep Learning

下载PDF

导出

摘要针对大多数临床实验筛选标准的分类研究都集中在英文资格标准上,研究适合中文资格标准的分类模型,利用第五届中国健康信息处理会议开发的中文临床实验短文本数据集,结合神经网络和预训练语言模型对分类任务进行构建和微调,比较分析Word2vec-BiLSTM模型、CNN模型、RNN模型、预训练语言模型在此应用上的效果差异,并通过实验得到预训练模型ERNIE的分类效果优于其他模型。针对数据不平衡这一特征,对数量较少的类别语料进行数据增强后可有效提升模型的性能和效果,结果显示ERNIE模型的宏观平均F1值和微观平均F1值分别可达到0.8281和0.8537。 Classification research for most clinical trial screening criteria focuses on English eligibility criteria.This paper compares the characteristic of classification models suitable for Chinese eligibility criteria,using the Chinese clinical trial short text dataset developed by the 5th China Health Information Processing Conference,combined with neural networks and pre-trained language models to construct classification tasks and fine-tuning,analyzed the differences in the effects of the Word2vec-BiLSTM model,CNN model,RNN model,and pre-trained language model in this application,and obtained through experiments that the classification effect of the pre-trained model ERNIE performsbetter.In view of the characteristic of data imbalance,the performance and effect of the model can be effectively improved after data enhancement of a small number of category corpora.The results show that the macro-average F1 value and micro-average F1 value of the ERNIE model can reach 0.8281 and 0.8537,respectively.

作者刘子琦胡建成牟谷芳 LIU Ziqi;HU Jiancheng;MOU Gufang(College Applied Mathematics,Chengdu University of Information Technology,Chengdu 610225,China)

机构地区成都信息工程大学应用数学学院

出处《成都信息工程大学学报》 2024年第2期170-177,共8页 Journal of Chengdu University of Information Technology

关键词临床实验医学短文本分类深度学习预训练模型 clinical trials medical short text classification deep learning pre-training model

分类号 TP391.1 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献6

1左圆圆,王媛媛,蒋珊珊,徐榕荟.数据可视化分析综述[J].科技与创新,2019,0(11):82-83. 被引量：22
2王勇,李帅.自然语言处理在医学文本挖掘中的应用[J].电子技术与软件工程,2019(7):190-190. 被引量：5
3宗辉,张泽宇,杨金璇,雷健波,李作峰,郝天永,张晓艳.基于人工智能的中文临床试验筛选标准文本分类研究[J].生物医学工程学杂志,2021,38(1):105-110. 被引量：4
4王培,王亚文,卢苗苗.基于BERT模型的中医文本分类研究[J].电脑知识与技术,2021,17(27):13-14. 被引量：3
5李启行,廖薇.基于注意力机制的生物医学文本分类模型[J].中国医学物理学杂志,2022,39(4):518-523. 被引量：4
6钟桂凤,庞雄文,隋栋.基于Word2Vec和改进注意力机制AlexNet-2的文本分类方法[J].计算机科学,2022,49(4):288-293. 被引量：12

二级参考文献23

1王灿辉,张敏,马少平.自然语言处理在信息检索中的应用综述[J].中文信息学报,2007,21(2):35-45. 被引量：50
2顾铮.基于文本分类技术计算中医方剂相似度[J].微计算机信息,2010,26(12):199-201. 被引量：5
3王华珍,胡雪琴.中医“内生五邪”的智能证型分类[J].计算机工程与应用,2011,47(6):156-160. 被引量：9
4王育林,樊经洋.试论中医学与中国传统文化的关系[J].中华中医药杂志,2014,29(6):1777-1781. 被引量：12
5Nevin Lianwen Zhang,Chen Fu,Teng Fei Liu,Bao-xin Chen,Kin Man Poon,Pei Xian Chen,Yun-ling Zhang.A data-driven method for syndrome type identification and classification in traditional Chinese medicine[J].Journal of Integrative Medicine,2017,15(2):110-123. 被引量：15
6高成亮,徐华,高凯.结合词性信息的基于注意力机制的双向LSTM的中文文本分类[J].河北科技大学学报,2018,39(5):447-454. 被引量：11
7高源.自然语言处理发展与应用概述[J].中国新通信,2019,21(2):117-118. 被引量：8
8陈德鑫,占袁圆,杨兵,谢亚霓.基于CNN-BiLSTM模型的在线医疗实体抽取研究[J].图书情报工作,2019,63(12):105-113. 被引量：15
9王涛,李明.基于LDA模型与语义网络对评论文本挖掘研究[J].重庆工商大学学报（自然科学版）,2019,36(4):9-16. 被引量：12
10刘勘,陈露.面向医疗分诊的深度神经网络学习[J].数据分析与知识发现,2019,3(6):99-108. 被引量：9

共引文献44

1陈积银,李月,聂汉林.全球新闻数据可视化实践研究——基于2021年西格玛数据新闻奖作品的内容分析[J].中国新闻传播研究,2022(2):175-192. 被引量：5
2吴广义,赵志刚,王晓龙,陈默.数据分析在风险评估中的应用初探——以乍得为例[J].中国安全生产科学技术,2019,15(S02):31-34.
3袁逸凡,雷田,陈恳.映射方式对时序数据可视化可用性的影响分析[J].设计艺术研究,2021(2):62-66. 被引量：1
4叶强,詹宝强,马笑晨,李永立.基于文本挖掘和多模块融合的金融数据分类分级方法[J].信息技术与管理应用,2022(1):120-133.
5郑戟明,柳青.Echarts在数据可视化课程中的应用[J].电脑知识与技术,2020,16(2):9-11. 被引量：16
6李雨霏.数据分析技术工具发展现状及趋势[J].信息通信技术与政策,2020(4):23-30. 被引量：5
7穆翠霞.数据可视化课程的教学设计与实践探索[J].电脑知识与技术,2020,16(34):104-108. 被引量：3
8彭慧,孙士学.数据可视化在炼化生产企业中的应用研究[J].电脑知识与技术,2021,17(4):232-233.
9于洋,李永江.基于IBM-I2系统的实证性情报建模分析研究[J].湖南警察学院学报,2021,33(1):80-89. 被引量：2
10李光宙.基于Anaconda平台的专项技术数据分析系统在生产线中的应用[J].科技创新导报,2021,18(11):131-137.

同被引文献5

1雷元金,李世豪,刘毅非,孟建,王刚.基于人工智能算法的大型水电站智能监盘系统研究[J].轻工科技,2021,37(4):95-96. 被引量：5
2陈蕾,郑伟彦,余慧华,傅婧,刘宏伟,夏军强.基于BERT的电网调度语音识别语言模型研究[J].电网技术,2021,45(8):2955-2961. 被引量：14
3王仁超,张毅伟,毛三军.水电工程施工安全隐患文本智能分类与知识挖掘[J].水力发电学报,2022,41(11):96-106. 被引量：14
4王文娟,何晓莲,胡峰,赵伟,钟淘淘.多注意力机制BERT分类模型及其在电力运维中的应用[J].重庆邮电大学学报（自然科学版）,2023,35(1):156-163. 被引量：2
5李瑛,耿军伟,赵留学,陈波.基于ChineseBERT和多特征协同网络的电力设备缺陷文本分类模型[J].微型电脑应用,2024,40(2):106-109. 被引量：1

引证文献1

1李固良,高滨,张佳喆.基于深度学习的监控简报文本分类研究[J].四川水力发电,2024,43(S01):118-124.

1李东,王福威,商月阳,张云飞,檀文彬.基于ERNIE-BiLSTM-DPCNN的微博长文本谣言检测[J].河南科学,2024,42(4):469-475.
2高永兵,李春灿,郑伟业,姜春光.基于ERNIE-AA模型的诉求文本分类技术[J].内蒙古科技大学学报,2024,43(1):31-36.
3谷岩,郑楷洪,胡勇军,宋益善,刘东屏.支持跨领域的中文虚假评论识别方法[J].数据分析与知识发现,2024,8(2):84-98.
4谢莉花,余小娟.资历框架视阈下我国资格标准体系的建设现状、问题与策略[J].复印报刊资料（成人教育学刊）,2022(2):3-10.
5邵晓枫.社区教育教师专业化亟需深入研究的几个问题[J].复印报刊资料（成人教育学刊）,2022(2):42-47.
6金星晔,左从江,方明月,李涛,聂辉华.企业数字化转型的测度难题:基于大语言模型的新方法与新发现[J].经济研究,2024,59(3):34-53. 被引量：8
7陈梦,黄建一,林耿,张梓坪.融合ERNIE和双向注意力流的医生推荐算法[J].闽江学院学报,2024,45(2):42-55.
8黄振帮.基于EPC模型构建岗位任职资格标准[J].复印报刊资料（人力资源开发与管理）,2023(5):70-73.
9陆素菊,周雪.高职院校企业背景教师的教学适应问题及管理优化策略——基于浙江省的实证调研[J].职教通讯,2024(4):5-14.

成都信息工程大学学报

2024年第2期

浏览历史

内容加载中请稍等...

基于深度学习的中文临床实验筛选标准的分类被引量：1

参考文献6

二级参考文献23

共引文献44

同被引文献5

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于深度学习的中文临床实验筛选标准的分类 被引量：1

参考文献6

二级参考文献23

共引文献44

同被引文献5

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于深度学习的中文临床实验筛选标准的分类被引量：1