摘要
研究了中医医案症状命名实体方法。通过汉字笔画、部首、词根编码器捕获汉字字形蕴含的语义,再通过BERT模型和BiLSTM来获取上下文的语义信息,通过CRF输出最终的命名实体结果。融合字形特征的中医医案命名实体识别方法,比以往效果较好的方法F1值提高了3.0%,有效提高了中医医案症状实体识别的准确率,可为深入挖掘中医药文本信息提供参考。
In this paper,a symptom named entity method of TCM medical records is studied.Firstly,the semantics of Chinese character glyphs are captured by Chinese character stroke,radical and root encoder,then the semantic information of context is obtained by BERT model and BiLSTM,and the final named entity results are output through CRF.The proposed method improves the F1 value by 3.0%over the previous effective method,which effectively improves the accuracy of symptom entity recognition of TCM medical records and can provide a reference for deeper mining of TCM text information.
作者
胡为
刘伟
盛威
卢彦杰
石玉敬
Hu Wei;Liu Wei;Sheng Wei;Lu Yanjie;Shi Yujin(School of Informatics,Hunan University of Chinese Medicine,Changsha,Hunan 410208,China)
出处
《计算机时代》
2023年第7期66-69,73,共5页
Computer Era
基金
湖南省自然科学基金项目(2022JJ30438)
湖南中医药大学自然科学基金项目(2022XJZKC016)
湖南省教育厅科学研究项目(20C1435)
长沙市自然科学基金项目(kq2202260)。