语言学组合特征在语义关系抽取中的应用被引量：16

The Application of Combined Linguistic Features in Semantic Relation Extraction

下载PDF

导出

摘要语义关系抽取是信息抽取中的一个重要的研究领域。目前基于特征向量的语义关系抽取已经很难通过发掘新的特征来提高抽取的性能。本文提出了一种特征组合方法,通过在各种词法、语法、语义的基本特征内部及特征之间进行合理的组合形成组合特征,使用基于支持向量机的学习方法,使得关系抽取的准确率和召回率得到了提高。在ACE2004语料库的7个关系大类和23个关系子类抽取实验中F值分别达到了66.6%和59.50%。实验结果表明通过对基本语言学特征进行组合所得到的组合特征能够显著地提高语义关系抽取的性能。 Semantic relation extraction is one of the important fields in information extraction research. The present feature vector based approach for semantic relation extraction can hardly be improved simply by mining new features, This paper presents a novel method through combining the diverse basic lexical, syntactic and semantic features to form new combined features. The experiments show that these combined features positively improve the precision and recall of the SVM based relation extraction. The F-score of relation extraction for the 7 major types and 23 subtypes in ACE 2004 corpora achieves 66.6% and 59.50% respectively.

作者奚斌钱龙华周国栋朱巧明钱培德

机构地区苏州大学计算机科学与技术学院

出处《中文信息学报》 CSCD 北大核心 2008年第3期44-49,63,共7页 Journal of Chinese Information Processing

基金 “863”国家高技术研究发展计划资助项目(2006AA01Z147) 国家自然科学基金资助项目(60673041)

关键词计算机应用中文信息处理语义关系抽取支持向量机组合特征 computer application Chinese information processing semantic relation extraction support vector machine combined features

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献12

1郑家恒,王兴义,李飞.信息抽取模式自动生成方法的研究[J].中文信息学报,2004,18(1):48-54. 被引量：22
2ZHOU G D, SU J, ZHANG J, et al. Exploring various knowledge in relation extraction[A]. UnivofMichgan-AnnArbor,USA: 25-30. ACL' 2005 [C] . June, 2005. 427-434.
3ZHANG M, SU J, WANG D M, et al. Discovering Relations from a Large Raw Corpus Using Tree Simi larity based Clustering[A]. IJCNLP'2005 [C]. Jeju island, Korea :LNCS, October, 2005. 378-389.
4KAMBHATLA N. Combining lexical, syntactic and semantic features with Maximum Entropy models for extracting relations [A]. ACL ' 2004 (poster) [C]. Barcelona,Spain:21-26 July, 2004. 178-181.
5ZHAO S B, GRISMAN R. Extracting relations with integrated information using kernel methods [A]. ACL' 2005[C]. USA : 25-30 UnivofMichgan-AnnArbor June 2005. 419-426.
6ACE 2004. The Automatic Content Extraction (ACE) Projects, 2007 (2007-4-20). http//www, ldc. upenn. edu/ Projects/ACE/.
7WANG T, LI Y Y, KALINA B, et al. Automatic Extraction of Hierarchical Relations from Text[A]. Proceedings of the Third European Semantic Web Conference (ESWC 2006) [C]. USA: Springer, 2006:401-416.
8ZHANG M, ZHANG J, SU J, et al. A Composite Kernel to Extract Relations between Entities with both Flat and Structured Features [A]. ACL' 2006 [C]. Sydney: July, 2006. 825-832.
9车万翔,刘挺,李生.实体关系自动抽取[J].中文信息学报,2005,19(2):1-6. 被引量：115
10董静,孙乐,冯元勇,黄瑞红.中文实体关系抽取中的特征选择研究[J].中文信息学报,2007,21(4):80-85. 被引量：55

二级参考文献30

1车万翔,刘挺,李生.实体关系自动抽取[J].中文信息学报,2005,19(2):1-6. 被引量：115
2梁晗,陈群秀,吴平博.基于事件框架的信息抽取系统[J].中文信息学报,2006,20(2):40-46. 被引量：38
3[1]Ellen Riloff. Automatically Constructing a Dictionary for Information Extraction Tasks[C]. In: Proceedings of the Eleventh National Conference on Artificial Intelligence, 811-816. AAAI Press/ The MIT Press, 1993.
4[2]Stephen Soderland, David Fisher, Jonathan Aseltine, and Wendy Lehnert. CRYSTAL: Inducing a conceptual dictionary[C]. In: Proceedings of the Fourteenth International Joint Conference on Artificial Intelligence, 1314-1319, 1995.
5[3]Ellen Riloff. Automatically Generating Extraction Patterns from Untagged Text[C]. In: Proceedings of Thirteenth National Conference on Artificial Intelligence (AAAI-96), 1044-1049. 1996.
6[4]Ellen Riloff, Rosie Jones. Learning Dictionaries for Information Extraction by Multi-Level Bootstrapping[C]. In: Proceedings of the Sixteenth National Conference on Artificial Intelligence (AAAI-99), Orlando FL. 1999.
7[5]Roman Yangarber, Ralph Grishman, Pasi Tapanainen and Silja Huttunen. Unsupervised Discovery of Scenario-Level Patterns for Information Extraction[C]. In: Proceedings of Sixth Applied Natural Language Processing Conference (ANLP-2000), 282-289, Seattle WA. 2000.
8In: Proceedings of the 6th Message Understanding Conference (MUC - 7) [ C ]. National Institute of Standars and Technology, 1998.
9C. Aone and M. Ramos-Santacruz. Rees: A large-scale relation and event extraction system[A]. In: Proceedings of the 6th Applied Natural Language Processing Conference[C] ,pages 76- 83, 2000.
10S. Miller, M. Crystal, H. Fox, L. Ramshaw, R. Schwartz, R. Stone, R. Weischedel, and the Annotation Group.Algorithms that learn to extract information-BBN: Description of the SIFT system as used for MUC[ A]. In: Proceedings of the Seventh Message Understanding Conference (MUC-7)[C], 1998.

共引文献155

1葛艳,杜坤钰,杜军威,陈卓.基于混合神经网络的实体关系抽取方法研究[J].中文信息学报,2021,35(10):81-89. 被引量：3
2吴婷,孔芳.基于图注意力卷积神经网络的文档级关系抽取[J].中文信息学报,2021,35(10):73-80. 被引量：11
3刘辉,江千军,桂前进,张祺,王梓豫,王磊,王京景.实体关系抽取技术研究进展综述[J].计算机应用研究,2020,37(S02):1-5. 被引量：24
4叶正,林鸿飞,苏绥,刘菁菁.基于支持向量机的人物属性抽取[J].计算机研究与发展,2007,44(z2):271-275. 被引量：11
5崔娜,雷涯邻,安海忠.面向用户需求的新闻文本集信息可视化模型[J].图书情报工作,2011,55(S2):273-279. 被引量：1
6李红亮,杨燕,尹红风,贾真.基于规则的百科人物属性抽取[J].集成技术,2013,2(3):1-4. 被引量：3
7黄毅,王庆林,刘禹.一种基于条件随机场的领域术语上下位关系获取方法[J].中南大学学报（自然科学版）,2013,44(S2):355-359. 被引量：5
8袁毓林.用动词的论元结构跟事件模板相匹配——一种由动词驱动的信息抽取方法[J].中文信息学报,2005,19(5):37-43. 被引量：22
9郑家恒,菅小艳.农作物信息抽取系统的设计与实现[J].计算机工程,2006,32(7):197-198. 被引量：5
10董静,孙乐,冯元勇,黄瑞红.中文实体关系抽取中的特征选择研究[J].中文信息学报,2007,21(4):80-85. 被引量：55

同被引文献185

1袁毓林.准双向动词研究[J].语言研究,1989(1):12-25. 被引量：29
2侯敏,孙建军.汉语中的零形回指及其在汉英机器翻译中的处理对策[J].中文信息学报,2005,19(1):14-20. 被引量：23
3车万翔,刘挺,李生.实体关系自动抽取[J].中文信息学报,2005,19(2):1-6. 被引量：115
4郑庆华,王朝静,孙霞.一种基于结构化语料库的概念语义网络自动生成算法[J].计算机研究与发展,2005,42(3):478-485. 被引量：7
5崔世起,刘群,孟遥,于浩,西野文人.基于大规模语料库的新词检测[J].计算机研究与发展,2006,43(5):927-932. 被引量：32
6刘磊,曹存根,王海涛,陈威.一种基于“是一个”模式的下位概念获取方法[J].计算机科学,2006,33(9):146-151. 被引量：18
7余蕾,曹存根.基于Web语料的概念获取系统的研究与实现[J].计算机科学,2007,34(2):161-165. 被引量：6
8周蕾,朱巧明.基于统计和规则的未登录词识别方法研究[J].计算机工程,2007,33(8):196-198. 被引量：21
9董静,孙乐,冯元勇,黄瑞红.中文实体关系抽取中的特征选择研究[J].中文信息学报,2007,21(4):80-85. 被引量：55
10夏天.汉语词语语义相似度计算研究[J].计算机工程,2007,33(6):191-194. 被引量：63

引证文献16

1黄晨,钱龙华,周国栋,朱巧明.基于卷积树核的无指导中文实体关系抽取研究[J].中文信息学报,2010,24(4):11-17. 被引量：12
2刘兴林,陈建超,马千里.基于互联网的词汇语义知识库构建框架研究[J].计算机与现代化,2010(10):8-11. 被引量：1
3林如琦,陈锦秀,杨肖方,许红磊.多信息融合中文关系抽取技术研究[J].厦门大学学报（自然科学版）,2011,50(3):540-545. 被引量：2
4陈鹏,郭剑毅,余正涛,线岩团,严馨,魏斯超.基于凸组合核函数的中文领域实体关系抽取[J].中文信息学报,2013,27(5):144-148. 被引量：7
5胡亚楠,舒佳根,钱龙华,朱巧明.基于机器翻译的跨语言关系抽取[J].中文信息学报,2013,27(5):191-197. 被引量：2
6胡亚楠,惠浩添,钱龙华,朱巧明.基于机器翻译的双语协同关系抽取[J].计算机应用研究,2015,32(3):662-665. 被引量：2
7陈鹏,郭剑毅,余正涛,严馨,张志坤,高盛祥.融合领域知识短语树核函数的中文领域实体关系抽取[J].南京大学学报（自然科学版）,2015,51(1):181-186. 被引量：9
8饶齐,王裴岩,张桂平.面向中文专利SAO结构抽取的文本特征比较研究[J].北京大学学报（自然科学版）,2015,51(2):349-356. 被引量：15
9沈晓卫,李培峰,朱巧明.槽填充中抽取模式的优化方法[J].中文信息学报,2015,29(2):199-206. 被引量：1
10甘丽新,万常选,刘德喜,钟青,江腾蛟.基于句法语义特征的中文实体关系抽取[J].计算机研究与发展,2016,53(2):284-302. 被引量：74

二级引证文献128

1刘新亮,张梦琪,谷情,任延昭,何东彬,高万林.基于BERT-CRF模型的生鲜蛋供应链命名实体识别[J].农业机械学报,2021,52(S01):519-525. 被引量：9
2葛艳,杜坤钰,杜军威,陈卓.基于混合神经网络的实体关系抽取方法研究[J].中文信息学报,2021,35(10):81-89. 被引量：3
3刘辉,江千军,桂前进,张祺,王梓豫,王磊,王京景.实体关系抽取技术研究进展综述[J].计算机应用研究,2020,37(S02):1-5. 被引量：24
4胡雨晴,纪明宇,王晨龙.基于依存句法的句子相似度计算方法[J].智能计算机与应用,2020(4):113-118. 被引量：2
5王学锋,杨若鹏,贾明亮.基于循环神经网络的作战文书实体关系抽取[J].智能安全,2022,1(1):29-35.
6康静涵.入情入境感悟运用——《颐和园》一课教学谈[J].小学语文教学,2000(7):106-107.
7车海燕,冯铁,张家晨,陈伟,李大利.面向中文自然语言文档的自动知识抽取方法[J].计算机研究与发展,2013,50(4):834-842. 被引量：17
8刘方驰,钟志农,雷霖,吴烨.基于机器学习的实体关系抽取方法[J].兵工自动化,2013,32(9):57-62. 被引量：10
9郭喜跃,何婷婷,胡小华,陈前军.基于句法语义特征的中文实体关系抽取[J].中文信息学报,2014,28(6):183-189. 被引量：48
10陈锋,巢文涵,周庆,李舟军.基于卷积树核的中文微博情感要素识别[J].计算机科学,2014,41(12):133-137. 被引量：7

1辛涛,程绍银,蒋凡.基于组合特征的Web人名消歧方法[J].计算机系统应用,2015,24(11):162-166. 被引量：2
2黄和飞,赵榆琴.Visual FoxPro 6.0中类及其应用实例[J].大理学院学报（综合版）,2006,5(6):4-7.
3黄昌宁.语料库语言[J].中国计算机用户,1990(11):43-45. 被引量：5
4吴萍.一种基于语言学特征的本体匹配改进算法[J].电脑知识与技术（过刊）,2013,19(6X):4094-4097.
5超越第三维[J].微电脑世界,1999,0(1):71-71.
6李先国,徐秋元.五码拼词法字词库的建立和维护[J].中文信息,1992(2):28-31. 被引量：1
7陈群秀.中国计算语言学的发展[J].中国计算机用户,1990(11):46-47. 被引量：1
8刘开瑛.计算语言学概述[J].中国计算机用户,1990(11):31-33.
9范荣.有关面向对象的概念[J].消费导刊,2007,0(7):249-249. 被引量：1
10薛鹏飞,胡玉兰.小波和仿射不变矩的目标特征提取方法研究[J].沈阳理工大学学报,2012,31(3):11-14. 被引量：1

中文信息学报

2008年第3期

浏览历史

内容加载中请稍等...

语言学组合特征在语义关系抽取中的应用被引量：16

参考文献12

二级参考文献30

共引文献155

同被引文献185

引证文献16

二级引证文献128

相关作者

相关机构

相关主题

浏览历史

语言学组合特征在语义关系抽取中的应用 被引量：16

参考文献12

二级参考文献30

共引文献155

同被引文献185

引证文献16

二级引证文献128

相关作者

相关机构

相关主题

浏览历史

语言学组合特征在语义关系抽取中的应用被引量：16