基于条件随机域模型的中文实体关系抽取被引量：2

Chinese Entity Relation Extraction Based on Conditional Random Fields Model

下载PDF

导出

摘要针对信息抽取领域中存在的抽取结果难以满足需要的问题,给出基于条件随机域模型的方法,以解决组块标注和实体关系抽取问题。通过定义中文组块和实体关系的标注方式,选择比较通用的《人民日报》语料,训练出效率较高的二阶模板来抽取文本中的实体关系。实验结果表明,该方法可以获得更好的抽取效果。 To solve disorder among information items and lack of information item in the field of information extraction, this paper proposes a solution to deal with chunks labeling and Entity Relation Extraction（ERE） based on the conditional random fields model. This paper defines the representation of Chinese chunk and entity relation, and uses label dataset of ＂People＇s Daily＂ as sample dataset to train an optimized model for the entity extraction. Experimental results show this method has better extraction performance.

作者周晶

机构地区南京高等职业技术学校计算机管理系

出处《计算机工程》 CAS CSCD 北大核心 2010年第24期192-194,共3页 Computer Engineering

关键词信息抽取组块标注实体关系抽取条件随机域模型 information extraction chunks labeling entity relation extraction Conditional Random Fields（CRFs） model

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献8

1Laender A. A Brief Survey of Web Data Extraction Tools[J]. ACM SIGMOD Record, 2002, 31(2): 84-93.
2刘亚清,陈荣.基于隐马尔可夫模型的Web信息抽取[J].计算机工程,2009,35(18):25-27. 被引量：6
3Freitag D, McCallum A, Pereira E Maximum Entropy Markov Models for Information Extraction and Segmentation[C]//Proc. of the 7th International Conference on Machine Learning. San Francisco, USA: [s. n.], 2000.
4Lafferty J, McCallum A, Pereira F. Conditional Random Fields: Probabilistic Models for Segmenting and Labeling Sequence Data[C]//Proc. of ICML'01. [S. l.]: IEEE Press, 2001: 282-289.
5McCallum A. Early Results for Named Entity Recognition with Conditional Random Fields Feature Induction and Web-enhanced Lexicons[D]. Amherst, USA: University of Massachusetts, 2003.
6洪铭材,张阔,唐杰,李涓子.基于条件随机场(CRFs)的中文词性标注方法[J].计算机科学,2006,33(10):148-151. 被引量：56
7彭春艳,张晖,包玲玉,陈昌平.基于条件随机域的生物命名实体识别[J].计算机工程,2009,35(22):197-199. 被引量：17
8陈晓颖,胡熠,陆汝占.实体关系模板的获取技术[J].计算机工程,2007,33(21):199-201. 被引量：3

二级参考文献22

1Laender A, Ribeiro-Neto B, Silva A, et el. A Brief Survey of Web Data Extraction Tools[J]. ACM SIGMOD Record, 2002, 31(2): 84-93.
2Hammer J, McHugh J, Garcia-Molina H. Semi-structured Data: The TSIMMIS Experience[C]//Proceedings of the 1st East-European Symposium on Advances in Databases and Information Systems. St. Petersburg, Russia: [s. n], 1997.
3Crescenzi V, MeccaG, MerialdoE RoadRunner: Towards Automatic Data Extraction from Large Web Sites[C]//Proceedings of 27th Int'l Conference on Very Large Databases. San Francisco, USA: [s, n.], 2001.
4Muslea I, Minton S, Knoblock C. Hierarchical Wrapper Induction for Semi-structured Information Sources[J]. Autonomous Agents and Multi-Agent Systems, 2001,4(1/2): 93-114.
5Soderland S. Learning Information Extraction Rules for Semistructured and Free Text[J]. Machine Learning, 1999, 34(1-3): 233-272.
6Lafferty J, McCallum A, Pereira F. Conditional Random Fields: Probabilistic Models for Segmenting and Labeling Sequence Data[C]//Proc. of the 18th International Conference on Machine Learning. Williamstown, Australia: [s. n.], 2001.
7Friedrich C M, Revillion T, Hofmann M, et al. Biomedical and Chemical Named Entity Recognition with Conditional Random Fields: The Advantage of Dictionary Features[C]//Proc. of the 2nd International Symposium on Semantic Mining in Biomedicine. Jena, Germany: [s. n.], 2006.
8Wellner B, McCallum A, Peng Fuchun, et al. An Integrated, Conditional Model of Information Extraction and Coreference with Application to Citation Graph Construction[C]//Proc. of the 20th Conference on Uncertainty in Artificial Intelligence. Banff, Canada:[s. n.], 2004.
9Lafferty J,McCallum A,Pereira F.Conditional Random Fields:Probabilistic Models for Segmenting and Labeling Sequence Data.In:Proceedings of the 18th International Conf on machine Learning,2001.282～289
10Sha F,Pereira F.Shallow Parsing with Conditional Random Fields.In:Proceedings of Human Language Technology Conference and North American Chapter of the Association for Computational Linguistics (HLT-NAACL),2003

共引文献78

1于江德,周宏宇,余正涛.基于单个词语特征模板的汉语词性标注[J].山西大学学报（自然科学版）,2011,34(4):513-517. 被引量：1
2周顺先,林亚平,王耀南,易叶青.基于二阶隐马尔可夫模型的文本信息抽取[J].电子学报,2007,35(11):2226-2231. 被引量：25
3尚福华,于剑光,李建平.基于属性分组的条件随机域网络入侵检测模型[J].哈尔滨商业大学学报（自然科学版）,2009,25(3):321-326.
4王丽杰,车万翔,刘挺.基于SVMTool的中文词性标注[J].中文信息学报,2009,23(4):16-21. 被引量：17
5冀中,苏育挺,杨益铮.基于多模态信息融合的新闻独白镜头检测[J].计算机工程与应用,2009,45(25):173-175. 被引量：1
6邢富坤,宋柔,罗智勇.SSD模型及其在汉语词性标注中的应用[J].中文信息学报,2010,24(1):20-24. 被引量：4
7谷川,田喜平.基于条件随机场的汉语词性标注方法研究[J].安阳师范学院学报,2010(5):6-8.
8张硕果,汪成亮.结合CRFs的词典分词法[J].计算机系统应用,2010,19(11):115-118. 被引量：1
9李妩可,郭赛球,尹艳.命名实体关系抽取算法的改进[J].计算机工程,2010,36(24):289-290. 被引量：2
10袁鼎荣,钟宁,张师超.文本信息处理研究述评[J].计算机科学,2011,38(2):9-13. 被引量：11

同被引文献7

1沈伟.电子病历给医疗行为带来的变革[J].医学信息学杂志,2007,28(4):346-347. 被引量：8
2电子病历基本规范(试行)[J].中国卫生质量管理,2010,17(4):22-23. 被引量：3
3张秀梅,徐建武,程煜华,杨公亮.基于知识库的临床决策支持系统构建[J].中华医院管理杂志,2014,30(6):472-475. 被引量：33
4郭喜跃,何婷婷,胡小华,陈前军.基于句法语义特征的中文实体关系抽取[J].中文信息学报,2014,28(6):183-189. 被引量：49
5刘峤,李杨,段宏,刘瑶,秦志光.知识图谱构建技术综述[J].计算机研究与发展,2016,53(3):582-600. 被引量：938
6孙紫阳,顾君忠,杨静.基于深度学习的中文实体关系抽取方法[J].计算机工程,2018,44(9):164-170. 被引量：25
7宁尚明,滕飞,李天瑞.基于多通道自注意力机制的电子病历实体关系抽取[J].计算机学报,2020,43(5):916-929. 被引量：32

引证文献2

1张志昌,周侗,张瑞芳,张敏钰.融合双向GRU与注意力机制的医疗实体关系识别[J].计算机工程,2020,46(6):296-302. 被引量：11
2张世豪,杜圣东,贾真,李天瑞.基于深度神经网络和自注意力机制的医学实体关系抽取[J].计算机科学,2021,48(10):77-84. 被引量：10

二级引证文献21

1梁艳春,房爱莲.基于多通道卷积神经网络的中文文本关系抽取[J].华东师范大学学报（自然科学版）,2021(3):96-104. 被引量：4
2邵良杉,闻爽爽.基于GRU 神经网络的巷道平均风速获取研究[J].黄金科学技术,2021,29(5):709-718. 被引量：1
3徐绪堪,薛梦瑶,钱进.基于知识元语义描述模型的红色文化数字资源知识抽取研究[J].科技情报研究,2022,4(1):23-33. 被引量：9
4马浩,戴国琳,刘新遥,万艳丽.医学知识图谱自动构建研究[J].医学信息,2022,35(4):10-12. 被引量：3
5龚汝鑫,余肖生.基于BERT-BILSTM的医疗文本关系提取方法[J].计算机技术与发展,2022,32(4):186-192. 被引量：3
6支建勋.基于模糊K-means聚类算法的区域数据智能分析方法[J].电子设计工程,2022,30(10):46-49. 被引量：4
7朱大鹏,俞孟蕻,苏贞.基于深度学习的耙吸挖泥船装舱产量预测研究[J].计算机与数字工程,2022,50(9):2109-2113.
8吴智妍,金卫,岳路,生慧.电子病历命名实体识别技术研究综述[J].计算机工程与应用,2022,58(21):13-29. 被引量：7
9赵丹丹,张俊朋,孟佳娜,张志浩,苏文.基于预训练模型和混合神经网络的医疗实体关系抽取[J].北京大学学报（自然科学版）,2023,59(1):65-75. 被引量：3
10郑增亮,沈宙锋,苏前敏.基于XLNet的医学文本实体关系识别模型[J].智能计算机与应用,2023,13(4):8-13. 被引量：1

1张坤,刘妍,王达.针对最大熵模型和条件随机域模型的研究[J].黑龙江科技信息,2007(12X):31-31.
2孙广路,郎非,薛一波.基于条件随机域和语义类的中文组块分析方法[J].哈尔滨工业大学学报,2011,43(7):135-139. 被引量：5
3张海军,史树敏,丁溪源,黄河燕.基于分词提取重复串的未登录词遗漏量化模型[J].中文信息学报,2011,25(2):122-128. 被引量：5
4张秀龙,李新德,戴先中.基于组块分析的路径自然语言语义角色标注方法[J].东南大学学报（自然科学版）,2012,42(A01):127-131. 被引量：3
5李琳,龙从军,江荻.藏语句法功能组块的边界识别[J].中文信息学报,2013,27(6):165-168. 被引量：10
6徐庆,段利国,李爱萍,阴桂梅.基于实体词语义相似度的中文实体关系抽取[J].山东大学学报（工学版）,2015,45(6):7-15. 被引量：4
7毕海滨,黄宇光.基于语义与SVM的中文实体关系抽取[J].福建电脑,2013,29(12):96-98. 被引量：2
8史庆伟,赵政,鲍虎.基于条件随机域的Web信息抽取[J].辽宁工程技术大学学报（自然科学版）,2007,26(4):570-572. 被引量：2
9刘建舟,邵雄凯.基于语义核的中文实体关系抽取[J].信息系统工程,2011,24(3):94-95. 被引量：1
10武帅.基于条件随机域模型的事实信息抽取方法应用[J].现代图书情报技术,2010(10):59-64.

计算机工程

2010年第24期

浏览历史

内容加载中请稍等...

基于条件随机域模型的中文实体关系抽取被引量：2

参考文献8

二级参考文献22

共引文献78

同被引文献7

引证文献2

二级引证文献21

相关作者

相关机构

相关主题

浏览历史

基于条件随机域模型的中文实体关系抽取 被引量：2

参考文献8

二级参考文献22

共引文献78

同被引文献7

引证文献2

二级引证文献21

相关作者

相关机构

相关主题

浏览历史

基于条件随机域模型的中文实体关系抽取被引量：2