面向化学资源文本的命名实体识别被引量：6

Named Entity Recognition for Chemical Resource Text

下载PDF

导出

摘要针对化学资源文本中的命名实体,提出一种适合于化学资源文本的命名实体识别方法,旨在将化学物质、属性、参数、量值4种命名实体进行识别.该方法根据化学资源文本的语言规律及特点,建立BLSTM-CRF模型对命名实体进行初步识别,并使用基于词典与规则相结合的方法对识别结果进行校正.实验结果表明,该方法在化学资源文本中能够较好地完成命名实体识别任务,在测试语料上的F1值最高能达到94.26%. A method was proposed for the recognition of four kinds of named entities, chemical substances, attributes, parameters, and values in the chemical resource text. The language rules and characteristics of the chemical resource text were used for reference. Firstly, BLSTM-CRF model was established to the recognition of named entity. Then the algorithm, which based on the combination of the dictionary and rule, was used to correct and improve the recognition results. The result of experiments showed that the algorithm was able to complete the named entity recognition task in the chemical resource text well, and the maximum F1-Measure on the test sets could increase to 94.26%.

作者马建红王立芹姚爽 MA Jianhong;WANG Liqin;YAO Shuang(School of Computer Science and Engineering,Hebei University of Technology,Tianjin 300401,China)

机构地区河北工业大学计算机科学与软件学院

出处《郑州大学学报（理学版）》 CAS 北大核心 2018年第4期14-20,共7页 Journal of Zhengzhou University:Natural Science Edition

基金中国科学技术咨询服务中心计算机辅助创新设计公共服务平台建设服务采购项目(HSZT2015FD/254)

关键词化学资源文本命名实体识别双向长短时记忆网络条件随机场规则 the chemical resource texts named entity recognition BLSTM CRF rule

分类号 TP391.1 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献3

1李楠,郑荣廷,吉久明,滕青青.基于启发式规则的中文化学物质命名识别研究[J].现代图书情报技术,2010(5):13-17. 被引量：12
2潘国巍,吉久明,李楠,郑荣廷.基于两类统计机器学习模型的中文化学物质名称识别研究[J].现代情报,2011,31(11):163-165. 被引量：3
3蔡肖红,刘培玉,王智昊.基于语境情感消岐的评论倾向性分析[J].郑州大学学报（理学版）,2017,49(2):48-53. 被引量：6

二级参考文献30

1黄昌宁,赵海.中文分词十年回顾[J].中文信息学报,2007,21(3):8-19. 被引量：249
2Grishman R, Sundhiem B. Design of the MUC -6 Evaluation[ C]. In : Proceedings of the 6th Message Understanding Conference. NJ : Association for Computational Linguistics, 1995 : 1 - 11.
3Chen H H, Ding Y W, Tsai S C, et al. Description of the NTU System Used for MET - 2 [ C ]. In : Proceedings of the 7th Message Understanding Conference. 1998.
4Black W J, Rinaldi F, Mowatt D. Facile: Description of the NE System Used For MUC - 7 [ C ]. In : Proceedings of the 7th Message Understanding Conference. 1998.
5Sun J, Gao J F, Zhang L, et al. Chinese Named Entity Identification Using Class Based Language Model [ C ]. In : Proceedings of the 19th International Conference on Computational Linguistics. N J: Association for Computational Linguistics, 2002 : 1 - 7.
6Zhou G D, Su J. Named Entity Recognition Using an HMM Based Chunk Tagger[ C ]. In: Proceedings of the 40th Annual Meeting of the ACL. NJ : Association for Computational Linguistics, 2002 : 473 - 480.
7Ramaparkhi A. A Simple Introduction to Maximum Entropy Models for Natural Language Processing [ R ]. Institute for Research in Cognitive Science, University of Pennsylvania, 1997.
8Krauthammer M, Rzhetsky A, Morozov P, et al. Using BLAST for Identifying Gene and Protein Names in Journal Articles [J]. Gene, 2000, 259( 1 ) :245 -252.
9Klinger R, Kolarik C, Fluck J, et al. Detection of IUPAC and IUPAC - like Chemical Names [ J ]. Bioinformatics, 2008, 24 ( 13 ) : 268 - 276.
10Ying He,Mehmet Kayaalp.Biological Entity Recognition with Con-ditional Random Fields. AMIA Annu Symp Proc . 2008

共引文献18

1余传明,黄建秋,郭飞.从客户评论中识别命名实体——基于最大熵模型的实现[J].现代图书情报技术,2011(5):77-82. 被引量：2
2潘国巍,吉久明,李楠,郑荣廷.基于两类统计机器学习模型的中文化学物质名称识别研究[J].现代情报,2011,31(11):163-165. 被引量：3
3李楠,孙济庆,吉久明.汉语词素语义与知识发现研究初探[J].图书情报工作,2013,57(17):109-113. 被引量：3
4石崇德,乔晓东,王惠临,屈鹏.中文科技文献切分的领域适应技术研究[J].图书情报工作,2014,58(19):13-18.
5王倩倩,陈荣,李楠,孙济庆.面向化学名称的术语知识量计算模型研究[J].图书馆杂志,2015,34(10):59-62. 被引量：2
6刘艳超,郭剑毅,余正涛,周兰江,严馨,陈秀琴.融合实体特性识别越南语复杂命名实体的混合方法[J].智能系统学报,2016,11(4):503-512. 被引量：3
7刘海鸥,孙晶晶,苏妍嫄,张亚明.面向图书馆大数据知识服务的多情境兴趣推荐方法[J].现代情报,2018,38(6):62-67. 被引量：21
8张桂平,张宁,白宇.面向问答的数值信息抽取[J].郑州大学学报（理学版）,2018,50(4):21-25. 被引量：3
9徐恩,於志文,杜贺,郭斌.基于移动感知数据的用户画像系统[J].郑州大学学报（理学版）,2019,51(4):30-36. 被引量：5
10焦凯楠,李欣,朱容辰.中文领域命名实体识别综述[J].计算机工程与应用,2021,57(16):1-15. 被引量：41

同被引文献42

1赵宇,单忠臣,顾金凤,董辉.基于特征的回转体零件工艺文件自动生成方法研究[J].应用科技,2004,31(8):5-7. 被引量：1
2刘非凡,赵军,吕碧波,徐波,于浩,夏迎炬.面向商务信息抽取的产品命名实体识别研究[J].中文信息学报,2006,20(1):7-13. 被引量：47
3何庆,汤庸,黄永钊.基于本体的法律知识库的研究与实现[J].计算机科学,2007,34(2):175-177. 被引量：22
4李玉森,张雪英,袁正午.面向GIS的地理命名实体识别研究[J].重庆邮电大学学报（自然科学版）,2008,20(6):719-724. 被引量：10
5陈钰枫,宗成庆,苏克毅.汉英双语命名实体识别与对齐的交互式方法[J].计算机学报,2011,34(9):1688-1696. 被引量：17
6刘持平,董成.非回转体CAPP系统结构与工艺过程自动生成研究[J].新技术新工艺,2011(9):81-83. 被引量：2
7刘挺,车万翔,李正华.语言技术平台[J].中文信息学报,2011,25(6):53-62. 被引量：51
8佘贵清,张永安.审判案例自动抽取与标注模型研究[J].现代图书情报技术,2013(6):23-29. 被引量：19
9翟剑锋.深度学习在自然语言处理中的应用[J].电脑编程技巧与维护,2013(18):74-76. 被引量：13
10韩春燕,刘玉娇,琚生根,李若晨,苏翀.中文微博命名体识别[J].四川大学学报（自然科学版）,2015,52(3):511-516. 被引量：8

引证文献6

1陈彦光,刘海顺,李春楠,刘静,孙媛媛.基于刑事案例的知识图谱构建技术[J].郑州大学学报（理学版）,2019,51(3):85-90. 被引量：11
2何玉洁,杜方,史英杰,宋丽娟.基于深度学习的命名实体识别研究综述[J].计算机工程与应用,2021,57(11):21-36. 被引量：34
3贾猛,王裴岩,张桂平,蔡东风.面向工艺文本的命名实体识别方法研究[J].中文信息学报,2022,36(3):54-63. 被引量：6
4庞娜,袁钺,薛秋红.基于迁移学习的化学键能数据自动抽取[J].现代情报,2023,43(1):19-28.
5张璐,马子睿,王岳,马翠玲.面向高中化学试题的命名实体识别[J].吉林大学学报（信息科学版）,2023,41(4):608-620.
6李瑞婷,王裴岩,王立帮,杨丹清忻.面向工艺实体识别的双向神经概率转换器[J].计算机科学,2024,51(S01):248-255.

二级引证文献51

1刘若男.司法人工智能的障碍分析与优化路径[J].网络信息法学研究,2021(2):27-48.
2李书钦,史运涛,刘召,李志军.面向重大活动食品安全的知识图谱构建技术[J].食品工业,2021,42(5):397-399. 被引量：1
3王治政,王雷,李帅驰,孙媛媛,陈彦光,许策,王刚,林鸿飞.基于多视角知识图谱嵌入的量刑预测[J].模式识别与人工智能,2021,34(7):655-665. 被引量：2
4江洋洋,金伯,张宝昌.深度学习在自然语言处理领域的研究进展[J].计算机工程与应用,2021,57(22):1-14. 被引量：22
5赵辉,庞海婷,冯珊珊,韩东辰.中文命名实体识别技术综述[J].长春工业大学学报,2021,42(5):444-450. 被引量：9
6黄治纲,谢新强,邢铁军,葛东,蔡晨秋,窦丽莉,王天翊.基于司法案例知识图谱的类案推荐[J].南京大学学报（自然科学版）,2021,57(6):1053-1063. 被引量：9
7于润羽,杜军平,薛哲,徐欣,奚军庆.面向科技学术会议的命名实体识别研究[J].智能系统学报,2022,17(1):50-58. 被引量：3
8司徒凌云,石进,杨海平,沈固朝.基于多模态知识图谱的南海疆维权证据链系统构建[J].情报杂志,2021,40(12):23-29. 被引量：19
9刘晶,高立超,孙跃华,冯显宗,季海鹏.基于知识和数据融合驱动的设备故障诊断方法[J].郑州大学学报（理学版）,2022,54(2):39-46. 被引量：10
10张厚昌,刘成良.融合嵌入字词特征的中文医疗命名实体识别[J].中华医学图书情报杂志,2021,30(9):42-49. 被引量：5

1张引兵,宋继华,彭炜明,赵亚伟,宋天宝.短语结构树库向句式结构树库的自动转换研究[J].中文信息学报,2018,32(5):31-41. 被引量：3
2李明珠.浅谈我国法务会计发展存在的问题及策略[J].职工法律天地（下）,2018,0(11):188-188.
3黄丹丹,郭玉翠.融合attention机制的BI-LSTM-CRF中文分词模型[J].软件,2018,39(10):260-266. 被引量：8
4韩娜.谷歌、有道神经机器翻译系统汉英翻译测评[J].山西能源学院学报,2018,31(5):123-124. 被引量：1
5甘蓉.中文分词交叉型歧义消解算法[J].西华大学学报（自然科学版）,2018,37(6):32-36. 被引量：2
6徐雅飒.量刑规则与加重构成的二维视域——理论反思与制度完善[J].河南社会科学,2018,26(10):82-86. 被引量：2
7邢钢.国际私法体系中的实体主义方法:内涵、机制与构造[J].山东社会科学,2018(11):107-114. 被引量：2
8顾铮鸣,金晓斌,杨晓艳,赵庆利,蒋宇超,韩博,单薇,刘晶,周寅康.基于无人机遥感影像监测土地整治项目道路沟渠利用情况[J].农业工程学报,2018,34(23):85-93. 被引量：24

郑州大学学报（理学版）

2018年第4期

浏览历史

内容加载中请稍等...

面向化学资源文本的命名实体识别被引量：6

参考文献3

二级参考文献30

共引文献18

同被引文献42

引证文献6

二级引证文献51

相关作者

相关机构

相关主题

浏览历史

面向化学资源文本的命名实体识别 被引量：6

参考文献3

二级参考文献30

共引文献18

同被引文献42

引证文献6

二级引证文献51

相关作者

相关机构

相关主题

浏览历史

面向化学资源文本的命名实体识别被引量：6