基于混合深度学习的藏医古籍命名实体识别研究被引量：3

Research on Named Entity Identification of Tibetan Medical Ancient Books Based on Hybrid Deep Learning

下载PDF

导出

摘要 [目的/意义]针对藏医古籍知识组织与开发不足的问题,利用混合深度学习方法构建面向藏医古籍的命名实体识别模型,为藏医古籍知识的深度开发与利用提供方法支持。[方法/过程]根据藏医古籍知识特点,构建ALBERT-BiLSTM-CRF模型。以《四部医典》为数据集,在人工标注与文本预处理的基础上,进行命名实体识别实验,并将实验结果与其他3种常见模型进行对比分析。[结果/结论]ALBERT-BiLSTM-CRF模型对藏医古籍实体识别效果最好,F1-score达到96.28%,与其他方法相比提升约7个百分点。 [Purpose/Significance]In view of the lack of organization and utilization of the knowledge of ancient books of Tibetan medicine,a Named Entity Identification model for ancient books of Tibetan medicine was proposed to provide the basis and support for the in-depth mining of knowledge of ancient books of Tibetan medicine.[Method/Process]Based on the data set of the ancient Tibetan medical books“The Four Medical Tantras”,on the basis of manual annotation and text pre-processing,ALBERT-BERT-BILSTM-CRF,BERT-BILSTM-CRF,BILSTM-CRF and BERT were used to carry out named entity recognition experiments,and the experimental results were compared and analyzed.[Results/Conclusion]The F1-score of ALBERT-BERT-BILSTM-CRF model entity recognition reached 96.28%,which is about 7 percentage points higher than other methods.

作者刘佳边俊伊 Liu Jia;Bian Junyi(School of Business and Management,Jilin University,Changchun 130012,China)

机构地区吉林大学商学与管理学院

出处《现代情报》 CSSCI 2023年第11期37-46,共10页 Journal of Modern Information

基金教育部人文社会科学研究规划基金项目“基于数据生态的图书馆知识服务价值共创的演化机制、模拟实验及优化研究”(项目编号:19YJA870007)。

关键词混合深度学习命名实体识别 ALBERT 双向长短期记忆网络条件随机场藏医古籍知识组织《四部医典》 hybrid deep learning named entity identification ALBERT BiLSTM CRF Tibetan medical text knowledge organisation The Four Medical Tantras

分类号 G255 [文化科学—图书馆学]

引文网络
相关文献

参考文献15

1中共中央办公厅国务院办公厅印发《关于推进新时代古籍工作的意见》[J].中华人民共和国国务院公报,2022(12):30-33. 被引量：19
2龙从军,安波.中国少数民族语言文字信息处理的进展[J].暨南学报（哲学社会科学版）,2022,44(9):12-23. 被引量：8
3才让南加,仁增多杰,多杰才让,洛桑东智,李先加.数据挖掘技术在藏药方剂配伍规律研究中的应用思考[J].中国中药杂志,2012,37(16):2366-2367. 被引量：20
4文成当智,贡保东知,东改措,仁真旺甲,泽翁拥忠,贡却拉姆.《四部医典》用药规律——“味性化味”理论的科学内涵分析[J].中国实验方剂学杂志,2019,0(5):201-207. 被引量：28
5罗计根,杜建强,聂斌,熊旺平,刘蕾,贺佳.基于双向LSTM和GBDT的中医文本关系抽取模型[J].计算机应用研究,2019,36(12):3744-3747. 被引量：11
6肖瑞,胡冯菊,裴卫.基于BiLSTM-CRF的中医文本命名实体识别[J].世界科学技术-中医药现代化,2020,22(7):2504-2510. 被引量：31
7谢靖,刘江峰,王东波.古代中国医学文献的命名实体识别研究——以Flat-lattice增强的SikuBERT预训练模型为例[J].图书馆论坛,2022,42(10):51-60. 被引量：14
8何家欢,刘勇国,蒋羽,张云,张春梅,李东晓,张艺.藏药药理命名实体识别[J].医学信息学杂志,2020,41(4):30-36. 被引量：4
9刘浏,王东波.命名实体识别研究综述[J].情报学报,2018,37(3):329-340. 被引量：149
10史加荣,马媛媛.深度学习的研究进展与发展[J].计算机工程与应用,2018,54(10):1-10. 被引量：49

二级参考文献179

1陈美杉,夏晨曦.肝癌患者在线提问的命名实体识别研究:一种基于迁移学习的方法[J].数据分析与知识发现,2019,3(12):61-69. 被引量：15
2台钰莹,王乐春,杨东波.元数据标准登记系统平台构建——以文物行业为例[J].图书馆建设,2019,0(S01):15-19. 被引量：4
3张晓艳,王挺,陈火旺.命名实体识别研究[J].计算机科学,2005,32(4):44-48. 被引量：66
4孙茂松,黄昌宁,高海燕,方捷.中文姓名的自动辨识[J].中文信息学报,1995,9(2):16-27. 被引量：87
5向晓雯,史晓东,曾华琳.一个统计与规则相结合的中文命名实体识别系统[J].计算机应用,2005,25(10):2404-2406. 被引量：37
6徐琳,赵铁军.国家自然科学基金在自然语言处理领域近年来资助的已结题项目综述[J].软件学报,2005,16(10):1853-1858. 被引量：7
7王娟,慈林林,姚康泽.特征选择方法综述[J].计算机工程与科学,2005,27(12):68-71. 被引量：64
8刘非凡,赵军,吕碧波,徐波,于浩,夏迎炬.面向商务信息抽取的产品命名实体识别研究[J].中文信息学报,2006,20(1):7-13. 被引量：47
9俞鸿魁,张华平,刘群,吕学强,施水才.基于层叠隐马尔可夫模型的中文命名实体识别[J].通信学报,2006,27(2):87-94. 被引量：157
10周俊生,戴新宇,尹存燕,陈家骏.基于层叠条件随机场模型的中文机构名自动识别[J].电子学报,2006,34(5):804-809. 被引量：112

共引文献410

1格知加,明吉措姆.论三因五源学说在藏医药中的应用[J].中国民族医药杂志,2022,28(11):62-65. 被引量：2
2陈业明,戴齐,刘捷.融合字位置特征的铁路事故命名实体识别[J].计算机系统应用,2022,31(12):211-219. 被引量：3
3贺金龙,付立军,姚郑,吕鹏飞,黄徐胜.基于网格LSTM混合算法的地质领域用户意图识别[J].计算机系统应用,2020(10):44-52. 被引量：1
4高原,施元磊,张蕾,曹天奕,冯筠.基于游记文本的游客游览行程重构[J].数据分析与知识发现,2020,4(2):165-172. 被引量：5
5李灿,解丹.中医电子病历入院记录信息自动抽取方法研究[J].世界科学技术-中医药现代化,2023,25(5):1615-1622. 被引量：1
6徐安迎,胡孔法,杨涛.基于Neo4j的肺癌中医诊疗知识图谱构建研究[J].世界科学技术-中医药现代化,2023,25(4):1456-1461. 被引量：9
7孔静静,于琦,李敬华,于彤,张竹绿,田野,祖雅琪.实体抽取综述及其在中医药领域的应用[J].世界科学技术-中医药现代化,2022,24(8):2957-2963. 被引量：4
8东改措,文成当智.基于“味性化味”和网络药理学的藏药三热散治疗慢性胃炎的药性和作用机制研究[J].世界科学技术-中医药现代化,2020,22(5):1524-1531. 被引量：1
9刘新亮,张梦琪,谷情,任延昭,何东彬,高万林.基于BERT-CRF模型的生鲜蛋供应链命名实体识别[J].农业机械学报,2021,52(S01):519-525. 被引量：12
10张坤丽,赵旭,关同峰,尚柏羽,李羽蒙,昝红英.面向医疗文本的实体及关系标注平台的构建及应用[J].中文信息学报,2020,34(6):36-44. 被引量：13

同被引文献30

1徐紫云.古代汉语标注语料库的建设与应用[J].华东交通大学学报,2005,22(6):159-162. 被引量：3
2李明杰.非物质文化遗产视角下的中国古籍版本文化保护[J].图书馆,2009(3):4-9. 被引量：10
3王杭.基于语料库视角的藏医术语翻译研究[J].西藏大学学报（社会科学版）,2017,32(1):120-127. 被引量：9
4王国强,石庆功.十年来中国古籍原生性保护技术研究综述[J].图书馆理论与实践,2017,0(12):29-33. 被引量：7
5卢璐,石庆功.十年来中国古籍原生性保护技术研究文献计量分析[J].河南图书馆学刊,2018,38(6):125-128. 被引量：2
6刘玉龙,孙燕,张明霞,舒冰.我国药品不良反应监测发展现状与展望[J].中国药业,2019,28(4):76-79. 被引量：26
7朱笑笑,杨尊琦,刘婧.基于Bi-LSTM和CRF的药品不良反应抽取模型构建[J].数据分析与知识发现,2019,3(2):90-97. 被引量：6
8李纲,潘荣清,毛进,操玉杰.整合BiLSTM-CRF网络和词典资源的中文电子病历实体识别[J].现代情报,2020,40(4):3-12. 被引量：28
9李明杰,张纤柯,陈梦石.古籍数字化研究进展述评(2009-2019)[J].图书情报工作,2020,64(6):130-137. 被引量：34
10张亚飞,于琦,王于心,王嫄,贾晨晨,卫慧蓉,贺培凤.基于药物论坛中潜在不良反应与适应症的知识发现体系构建[J].中华医学图书情报杂志,2020,29(7):38-43. 被引量：5

引证文献3

1王秀红,王同玉.融合SAO和BERT-LDA的古籍保护关键技术识别研究[J].汉字文化,2024(4):198-201.
2仲雨乐,韩普,许鑫.基于异构图注意力网络的药物不良反应实体关系联合抽取研究[J].现代情报,2024,44(9):71-81.
3看不太,卡着杰,娘本先,拉毛才让,扎巴.构建藏医药古籍文献文本语料库的必要性探析[J].青海科技,2024,31(4):164-172.

1刘佳,张心祺,张承坤.基于人文计算的藏医古籍服务平台知识服务功能设计研究[J].现代情报,2023,43(11):47-57. 被引量：1
2杜志刚.基于情境将生命观念融入高中生物学教学的策略探究[J].中学生物学,2023,39(6):87-89.
3沈旺,梁世豪,李昕娱,王文欣,宋雪雁.数字人文视角下藏医学古籍知识发现研究——以《四部医典》为例[J].现代情报,2023,43(11):21-36. 被引量：3
4格知加,扎西卓玛,李秀优,卓玛措,南兴加,仁增平措,尼玛次仁.基于数据挖掘的藏医药治疗真布病用药规律研究[J].中药药理与临床,2023,39(8):97-102. 被引量：7
5项措卓玛,索朗拉姆,次旦卓玛,才让南加.藏医论治新型冠状病毒肺炎探析[J].亚太传统医药,2023,19(9):83-87.
6崔振伟,高玲,苏洪全,田欣,杨志勇.面向炼化场景的烟雾火焰识别技术[J].中国石油和化工标准与质量,2023,43(15):183-186. 被引量：1
7刘黎红,周建新.传送带常见模型及解题策略[J].数理天地（高中版）,2023(20):16-17.
8杨小翠,刘青松,刘惠欣,张希侠.清东陵古籍文献VR阅读可视化应用研究[J].文物鉴定与鉴赏,2023(3):112-115.
9程结晶,王璞钰.古籍中人物史料的关联组织研究--以《汉书·艺文志》中西汉经学家群体为例[J].图书馆论坛,2023,43(3):64-74. 被引量：6
10《网络信息服务与安全保障研究学术丛书》[J].数字图书馆论坛,2023,19(5):74-74.

现代情报

2023年第11期

浏览历史

内容加载中请稍等...

基于混合深度学习的藏医古籍命名实体识别研究被引量：3

参考文献15

二级参考文献179

共引文献410

同被引文献30

引证文献3

相关作者

相关机构

相关主题

浏览历史

基于混合深度学习的藏医古籍命名实体识别研究 被引量：3

参考文献15

二级参考文献179

共引文献410

同被引文献30

引证文献3

相关作者

相关机构

相关主题

浏览历史

基于混合深度学习的藏医古籍命名实体识别研究被引量：3