基于自然语言处理的医学实体识别与标签提取被引量：9

Medical Entity Recognition and Label Extraction Based on Natural Language Processing

下载PDF

导出

摘要随着信息化建设的快速发展,数据产生了爆炸式的增长,医院每天也同样产生大量的医疗记录与数据。其中大部分内容是非结构化数据,具有真实性、主观性和不规范性,不利于解读和处理。由于医疗数据是以非结构化的文本形式存储的,因此无法直接通过计算机直接处理和分析,不仅效率低下,分析质量也无法保证。目前的信息抽取研究中使用的方法的可扩展性都较差,具有一些局限性,故自动化程度不高。文中通过自然语言处理中的规则描述语言方法,对数据中非结构化的医学命名实体进行识别,并通过语义分析进行标签提取,使非结构化的数据结构化,让数据中的描述更为准确、统一。优化了目前信息抽取方法中存在的可扩展性差的缺点,能够根据情况适应不同的情景。 With the rapid development of information construction,data has exploded. Hospitals also produce a large number of medical records and data every day. Most of them are unstructured data with authenticity,subjectivity and irregularity,which is not conducive to interpretation and processing. Since medical data is stored in the form of unstructured text,it cannot be directly processed and analyzed by computer,which is not only inefficient,but also cannot guarantee the quality of analysis. At present,the methods used in information extraction research have poor scalability and some limitations,so the degree of automation is not high. We recognize unstructured medical named entities in data by rule description language method in natural language processing,and extract labels by semantic analysis,so that unstructured data can be structured to make the description of data more accurate and unified. It also optimizes the shortcomings of poor scalability in current information extraction methods,and can adapt to different scenarios according to the situation.

作者赵君珂张振宇蔡开裕 ZHAO Jun-ke;ZHANG Zhen-yu;CAI Kai-yu(National University of Defense Technology,Changsha 410073,China)

机构地区国防科技大学

出处《计算机技术与发展》 2019年第9期18-23,共6页 Computer Technology and Development

基金国家自然科学基金(61572514) 长沙市科技局项目(K1705007)

关键词自然语言处理医学数据非结构化实体识别标签提取 natural language processing medical data unstructured entity identification label extraction

分类号 TP31 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献13

1席韩旭,李维,计虹.基于临床数据中心的科研平台建设与实践[J].中国数字医学,2017,12(10):8-10. 被引量：20
2何炎祥,罗楚威,胡彬尧.基于CRF和规则相结合的地理命名实体识别方法[J].计算机应用与软件,2015,32(1):179-185. 被引量：60
3王志勇,高白,张少典,孙平波.病历智能分析系统的研究与实现[J].中国数字医学,2017,12(10):72-74. 被引量：6
4崔新华.自然语言处理在信息检索中的应用研究[J].贵阳学院学报（自然科学版）,2012,7(3):37-40. 被引量：3
5贾媛媛.自然语言处理中的语义消歧研究[J].淮南师范学院学报,2013,15(5):108-110. 被引量：1
6迪丽达尔.迪力沙提.自然语言处理中的中文自动分词技术[J].信息与电脑（理论版）,2012(11):78-79. 被引量：1
7姚天顺,张桂平,吴映明.基于规则的汉语自动分词系统[J].中文信息学报,1990,4(1):37-43. 被引量：43
8樊梦佳,段东圣,杜翠兰,张仰森,佟玲玲.统计与规则相融合的领域术语抽取算法[J].计算机应用研究,2016,33(8):2282-2285. 被引量：12
9罗超,吴达军.脑卒中患者综合医院焦虑/抑郁情绪测定评分的分析及治疗[J].湖南师范大学学报（医学版）,2014,11(2):85-87. 被引量：40
10马芳莲.医学术语规范化的必要性——兼谈几个常用词的辨正[J].科技术语研究,2000,2(4):6-8. 被引量：6

二级参考文献68

1黄卿贤,胡谷雨.基于本体的网络管理知识模型[J].北京邮电大学学报,2003,26(z2):47-51. 被引量：4
2张敏,宋睿华,马少平.基于语义关系查询扩展的文档重构方法[J].计算机学报,2004,27(10):1395-1401. 被引量：55
3杨宪泽.中文自动分词探讨[J].西南民族学院学报（自然科学版）,1994,20(3):242-245. 被引量：8
4张锋,许云,侯艳,樊孝忠.基于互信息的中文术语抽取系统[J].计算机应用研究,2005,22(5):72-73. 被引量：36
5王娟,慈林林,姚康泽.特征选择方法综述[J].计算机工程与科学,2005,27(12):68-71. 被引量：64
6耿骞,耿崇.利用词语共现进行Ontology的概念获取[J].现代图书情报技术,2006(2):43-45. 被引量：10
7王曰芬,宋爽,苗露.共现分析在知识服务中的应用研究[J].现代图书情报技术,2006(4):29-34. 被引量：59
8周俊生,戴新宇,尹存燕,陈家骏.基于层叠条件随机场模型的中文机构名自动识别[J].电子学报,2006,34(5):804-809. 被引量：112
9杜小勇,李曼,王珊.本体学习研究综述[J].软件学报,2006,17(9):1837-1847. 被引量：241
10张潮生，中文信息处理国际会议论文集，1987年

共引文献227

1唐斌,姚陆晨,姜胜耀.医院科研大数据平台的应用实践探索[J].中国数字医学,2021,16(11):104-108. 被引量：10
2陈业明,戴齐,刘捷.融合字位置特征的铁路事故命名实体识别[J].计算机系统应用,2022,31(12):211-219. 被引量：3
3贺金龙,付立军,姚郑,吕鹏飞,黄徐胜.基于网格LSTM混合算法的地质领域用户意图识别[J].计算机系统应用,2020(10):44-52. 被引量：1
4高原,施元磊,张蕾,曹天奕,冯筠.基于游记文本的游客游览行程重构[J].数据分析与知识发现,2020,4(2):165-172. 被引量：5
5Zhixiang Ji,Xiaohui Wang,Changyu Cai,Hongjian Sun.Power entity recognition based on bidirectional long short-term memory and conditional random fields[J].Global Energy Interconnection,2020,3(2):186-192. 被引量：7
6苏芳仲,林世平.Web文本挖掘中的一种中文分词算法研究及其实现[J].福州大学学报（自然科学版）,2004,32(z1):67-71. 被引量：5
7刘怀亮,张治国,马志辉,孙蕾.基于SVM与KNN的中文文本分类比较实证研究[J].情报理论与实践,2008,31(6):941-944. 被引量：10
8付艳梅.智能答疑系统的中文分词[J].湖北工业大学学报,2009,24(1):65-67. 被引量：4
9肖升,胡金柱,姚双云,吴锋文.关系词搭配的联列分析[J].宁夏大学学报（人文社会科学版）,2009,31(6):75-79. 被引量：2
10孙茂松,邹嘉彦.汉语自动分词研究评述[J].当代语言学,2001,3(1):22-32. 被引量：101

同被引文献71

1李望月,刘瑾,陈娜.大数据技术在乡村画像中的应用研究[J].大数据,2020,6(1):99-118. 被引量：6
2熊爱民.《冒号分类法》与《中图法》整体结构比较[J].贵州教育学院学报,2005,21(1):85-88. 被引量：2
3陈凛,张勇,卫勃,赵向阳,李涛.2335例胃癌外科治疗的临床分析[J].中华胃肠外科杂志,2007,10(5):421-424. 被引量：33
4费志勇,赵新力.基于本体驱动的高校网站招生信息分面组配揭示[J].图书情报工作,2008,52(12):81-84. 被引量：3
5顾颖.专科病例数据库建设现状与对策[J].中华医学图书情报杂志,2011,20(11):20-22. 被引量：23
6黄冬至.医院电子病历系统应用的探讨[J].华夏医学,2012,25(4):589-591. 被引量：3
7吴汉华.大数据时代中如何进行医疗数据挖掘与利用[J].硅谷,2014,7(5):13-13. 被引量：13
8王玮,孙哲,邓靖宇,王振宁,周志伟,梁寒,徐惠绵.基于多中心大样本数据库的胃癌外科治疗相关数据的整合与分析[J].中华胃肠外科杂志,2016,19(2):179-185. 被引量：65
9马帅,王霄英.自然语言处理在医学影像中的应用[J].放射学实践,2016,31(12):1120-1123. 被引量：5
10左婷婷,郑荣寿,曾红梅,张思维,陈万青.中国胃癌流行病学现状[J].中国肿瘤临床,2017,44(1):52-58. 被引量：1050

引证文献9

1谢俊祥,张琳,李勇.美国医疗人工智能概况、问题及愿景分析——基于美国人工智能系列报告的解析[J].中国医疗器械信息,2019,25(17):24-28. 被引量：9
2梁文全,郗洪庆,乔屾,崔建新,张珂诚,高云鹤,宋亚男,张兰,罗辉,卫勃,薛万国,陈凛.基于单中心万例胃癌专病数据库的胃癌外科临床病理信息分析[J].中华胃肠外科杂志,2020,23(11):1051-1058. 被引量：7
3尹思艺,庞晓燕,蔡秀军,林辉,乔凯,王可心,徐哲.基于自然语言处理的病历智能质控系统的研究与应用[J].中国医药科学,2021,11(16):1-4. 被引量：2
4汤磊雯,陈丹丹,邵静,张慧,吴静洁,叶志弘.基于微信小程序的代谢综合征智能健康管理平台的设计与开发[J].浙江大学学报（医学版）,2022,51(1):115-121. 被引量：5
5杨子良,赵自雄,张业武,马家奇.呼吸道传染病个案流行病学画像标签体系构建研究[J].医学信息学杂志,2022,43(4):46-52. 被引量：3
6陈光仪,陈义明,吴小慧.基于图数据库的阅读行为知识图谱构建研究[J].现代计算机,2022,28(16):111-113.
7萧锘,叶琪,刘传丰,冯东雷,许德俊.区域临床科研大数据平台设计与实现[J].中国卫生信息管理杂志,2022,19(5):673-680. 被引量：1
8汪波,刘沙,郑稳.基于深层标签和K-Means++算法的电力用户画像研究[J].鞍山师范学院学报,2022,24(6):43-48. 被引量：1
9姬发家,朱莹,阴皓,张菲菲,王军义.基于混合神经网络的自然语言处理技术研究[J].电子设计工程,2023,31(10):92-96. 被引量：5

二级引证文献33

1谢俊祥,张琳.国内外医疗人工智能战略及细分领域现状分析[J].医学信息学杂志,2020,41(6):2-7. 被引量：4
2徐向东,梁艺琼,李辰,胡建平.190例医疗健康人工智能应用案例分析[J].中国卫生信息管理杂志,2020,17(3):376-382. 被引量：11
3张富程,高凯,姜茂敏.医疗卫生领域人工智能的研究热点及发展趋势研究[J].中国医疗管理科学,2020,10(4):45-51. 被引量：11
4李润生.论医疗人工智能的法律规制——从近期方案到远期设想[J].行政法学研究,2020(4):46-57. 被引量：18
5鲍波涛,李妍,蒲江波,于淼,李婷.人工智能对我国卫生健康的促进及其发展趋势[J].国际生物医学工程杂志,2020,43(4):314-318.
6王秀琪,孙智晶,朱兰,郎景和.智慧医疗在盆底功能障碍性疾病中的研究进展与展望[J].中华妇产科杂志,2020,55(12):872-875. 被引量：9
7卢岩,陆安静,陈娟,张婷,欧阳昭连.基于ClinicalTrials.gov的中美医疗人工智能临床试验注册现状比较研究[J].中国医疗设备,2021,36(5):126-129. 被引量：3
8肖又德,郑永法,戈伟.加权基因共表达网络分析筛胃癌相关分子[J].中国医药导报,2021,18(17):8-12.
9周文康,费艳颖.医疗人工智能前沿研究:特征、趋势以及规制[J].医学与哲学,2021,42(19):38-44. 被引量：10
10马泰,徐辉,张澄,冯颖,谢敏敏,杨雅慧,张毅,孙国平.基于辅助化疗前血清白蛋白水平的列线图预测胃癌患者术后复发及远期生存[J].中国肿瘤,2022,31(1):75-80. 被引量：3

1郎佳.我国普惠性民办幼儿园的政策研究[J].基础教育研究,2019,0(15):13-15.
2秦娅,申国伟,余红星.基于Hadoop的大规模网络安全实体识别方法[J].智能系统学报,2019,14(5):1017-1025. 被引量：12
3苏晟.浅析医院计算机信息化建设的发展与管理[J].各界,2019,0(20):103-103.
4陈斌.大数据环境下医疗数据隐私保护面临的挑战及对策探析[J].信息系统工程,2019,0(9):137-138. 被引量：1
5张星玥.探寻合理高效的教学设计,促进学生语文能力的发展[J].语文教学之友,2019,38(10):13-15.
6丁若尧.面向古汉语史料的信息抽取方法综述[J].中国科技纵横,2019,0(14):50-51. 被引量：1
7肖飞.智慧医疗：释放医生无限智慧能量[J].张江科技评论,2019,0(4):37-39.
8陈南羽.正性暗示语言在微创拔牙中的应用[J].全科口腔医学电子杂志,2019,6(28):44-44.
9刘小兰,潘凎,易淼,李植鹏.分布式低秩张量子空间聚类算法[J].华南理工大学学报（自然科学版）,2019,47(8):77-83.
10杨攀丽.积累是丰富中学生作文语言的基石——浅谈如何才能丰富中学生的作文语言[J].考试周刊,2019,0(69):49-49.

计算机技术与发展

2019年第9期

浏览历史

内容加载中请稍等...

基于自然语言处理的医学实体识别与标签提取被引量：9

参考文献13

二级参考文献68

共引文献227

同被引文献71

引证文献9

二级引证文献33

相关作者

相关机构

相关主题

浏览历史

基于自然语言处理的医学实体识别与标签提取 被引量：9

参考文献13

二级参考文献68

共引文献227

同被引文献71

引证文献9

二级引证文献33

相关作者

相关机构

相关主题

浏览历史

基于自然语言处理的医学实体识别与标签提取被引量：9