基于机器翻译的跨语言关系抽取被引量：2

Cross-Lingual Relation Extraction Via Machine Translation

下载PDF

导出

摘要训练语料库的规模对基于机器学习的命名实体间语义关系抽取具有重要的作用,而语料库的人工标注需要花费大量的时间和人力。该文提出了使用机器翻译的方法将源语言的关系实例转换成目标语言的关系实例,并通过实体对齐策略将它们加入到目标语言的训练集中,从而使资源丰富的源语言帮助欠资源的目标语言进行语义关系抽取。在ACE2005中英文语料库上的关系抽取实验表明,无论是将中文翻译成英文,还是将英文翻译成中文,都对另一种语言的关系抽取具有帮助作用。特别是当目标语言的训练语料库规模较小时,这种帮助就尤其显著。 The scale of training corpus plays an important role in machine learning-based semantic relation extraction between named entities,however,the annotation of corpus is time-consuming and labor-intensive.In order that a resource-rich language can help a resource-poor language in semantic relation extraction,we propose an approach to transforming relation instances from the source language to the target language via machine translation,and then add them into the training corpus of the target language by way of entity alignment.The experiments on the ACE2005Chinese and English corpora show that,Chinese and English can help each other in relation extraction.Furthermore,this help is particularly significant especially when the scale of training corpus in target language is small.

作者胡亚楠舒佳根钱龙华朱巧明

机构地区苏州大学自然语言处理实验室苏州大学计算机科学与技术学院

出处《中文信息学报》 CSCD 北大核心 2013年第5期191-197,共7页 Journal of Chinese Information Processing

基金国家自然科学基金资助项目(60873150 90920004) 江苏省自然科学基金资助项目(BK2010219) 江苏省高校自然科学重大项目(11KJA520003)

关键词跨语言关系抽取机器翻译实体对齐 Cross-lingual relation extraction machine translation entity alignment

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献24

1Guodong Zhou,Min Zhang.Extracting relation information from text documents by exploring various types of knowledge[J].Information Processing and Management,2007,43:969-982.
2奚斌,钱龙华,周国栋,朱巧明,钱培德.语言学组合特征在语义关系抽取中的应用[J].中文信息学报,2008,22(3):44-49. 被引量：16
3Dandan Liu,Zhiwei Zhao,Yanan Hu,et al.Incorporating Lexical Semantic Similarity to Tree KernelBased Chinese Relation Extraction[C]//Proceedings of Computer School Center for Study of Language & Information.The 13th Chinese Lexical Semantics Workshop.Wuhan:Wuhan University,2012:133-139.
4Jong-Hoon Oh,Kiyotaka Uchimoto,Kentaro Torisawa.Bilingual Co-Training for Monolingual HyponymyRelation Acquisition[C]//Proceedings of ACL,Singapore,2009:432-440.
5Min Zhang,Jian Su,Danmei Wang,et al.Discovering Relations from a Large Raw Corpus Using Tree Similarity-based Clustering[C]//Proceedings of IJCNLP,2005:378-389.
6Fei Wu,Daniel S Weld.Open information extraction using wikipedia[C]//Proceedings of ACL.2010:118-127.
7Seokhwan Kim,Minwoo Jeong,Jonghoon Lee,et al.A Cross-lingual Annotation Projection Approach for Relation Detection[C]//Proceedings of Coling,Beijing,2010:564-571.
8Nanda Kambhatla.Combining lexical,syntactic and semantic features with Maximum Entropy models for extracting relations[C]//Proceedings of ACL.Morristown,NJ,USA,2004:178-181.
9Longhua Qian,Gougong Zhou,Fang Kong,et al.Exploiting constituent dependencies for tree kernel-based semantic relation extraction[C]//Proceedings of COLING.Manchester,2008:697-704.
10Guodong Zhou,Min Zhang,Dong Hong Ji,et al.Tree Kernel-based Relation Extraction with ContextSensitive Structured Parse Tree Information[C]//Proceedings of EMNLP/CoNLL.Prague,Czech,2007:728-736.

二级参考文献73

1车万翔,刘挺,李生.实体关系自动抽取[J].中文信息学报,2005,19(2):1-6. 被引量：116
2张素香,文娟,秦颖,袁彩霞,钟义信.实体关系的自动抽取研究[J].哈尔滨工程大学学报,2006,27(B07):370-373. 被引量：10
3董静,孙乐,冯元勇,黄瑞红.中文实体关系抽取中的特征选择研究[J].中文信息学报,2007,21(4):80-85. 被引量：55
4MUC[EB/OL]. http://www. itl. nist. gov/iaui/874. 02/related project/muc/, 1987-1998.
5ACE. The Automatic Context Extraction Project[EB/ OL]. http://www. ldc. upen. edu/Project/ACE, 2002-2005.
6Collins M,Duffy N. Convolution Kernels for Natural Language[C]//NIPS, 2001.
7Zelenko D, Aone C,Riehardella A. Kernel Methods for Relation Extraction[J]. Journal of Machine Learning Research,2003, (2) : 1083-1106.
8Culotta A, Sorensen J. Dependency tree kernels for relation extraetion[C]//ACL, 2004: 423-429.
9Bunescu R. C. and Mooney R. J. 2005. A Shortest Path Dependency Kernel for Relation Extraction[J]. EMNLP 2005: 724-731.
10Zhang M,Zhang J,Su J, et al. A Composite Kernel to Extract Relations between Entities with both Flat and Structured Features[C]//ACL, 2006 : 825-832.

共引文献145

1葛艳,杜坤钰,杜军威,陈卓.基于混合神经网络的实体关系抽取方法研究[J].中文信息学报,2021,35(10):81-89. 被引量：5
2吴婷,孔芳.基于图注意力卷积神经网络的文档级关系抽取[J].中文信息学报,2021,35(10):73-80. 被引量：12
3刘辉,江千军,桂前进,张祺,王梓豫,王磊,王京景.实体关系抽取技术研究进展综述[J].计算机应用研究,2020,37(S02):1-5. 被引量：25
4叶正,林鸿飞,苏绥,刘菁菁.基于支持向量机的人物属性抽取[J].计算机研究与发展,2007,44(z2):271-275. 被引量：11
5关丽红.基于特定数学模型的语义抽取研究[J].白城师范学院学报,2012,26(3):11-13.
6崔娜,雷涯邻,安海忠.面向用户需求的新闻文本集信息可视化模型[J].图书情报工作,2011,55(S2):273-279. 被引量：1
7李红亮,杨燕,尹红风,贾真.基于规则的百科人物属性抽取[J].集成技术,2013,2(3):1-4. 被引量：3
8黄毅,王庆林,刘禹.一种基于条件随机场的领域术语上下位关系获取方法[J].中南大学学报（自然科学版）,2013,44(S2):355-359. 被引量：5
9董静,孙乐,冯元勇,黄瑞红.中文实体关系抽取中的特征选择研究[J].中文信息学报,2007,21(4):80-85. 被引量：55
10刘迁,焦慧,贾惠波.信息抽取技术的发展现状及构建方法的研究[J].计算机应用研究,2007,24(7):6-9. 被引量：41

同被引文献4

1常鹏,冯楠.基于词共现的文档表示模型[J].中文信息学报,2012,26(1):51-57. 被引量：8
2李国和,岳翔,吴卫江,洪云峰,刘智渊,程远.面向文本分类的特征词选取方法研究与改进[J].中文信息学报,2015,29(4):120-125. 被引量：7
3王明文,付翠琴,徐凡,洪欢.基于词项共现关系图模型的中文观点句识别研究[J].中文信息学报,2015,29(6):185-192. 被引量：5
4胡弘思,姚天昉.基于维基百科的双语可比语料的句子对齐[J].中文信息学报,2016,30(1):198-203. 被引量：3

引证文献2

1刘娇,崔荣一,赵亚慧.基于共现词映射的中英韩跨语种文档相似度计算[J].中文信息学报,2018,32(3):55-63.
2孙康康.多特征融合的中文实体关系抽取研究[J].无线互联科技,2019,16(9):164-165. 被引量：2

二级引证文献2

1李福琳.实体抽取及关系发现关键技术研究[J].信息技术与信息化,2019(10):220-221. 被引量：1
2覃俊,廖立婷,刘晶,叶正,刘璐.融合汉字字形信息的文本关系抽取[J].中南民族大学学报（自然科学版）,2022,41(2):208-214.

1曾得年.浅谈初中文言文翻译的方法[J].教育界（教师培训）,2014,0(8):57-57.
2崔欣.英文辅助晋级XP[J].个人电脑,2001,7(12):52-52.
3e言传情[J].微型计算机,2006(18):167-167.
4团团.图片英文翻译也有道[J].电脑爱好者（普及版）,2010(4):16-16.
5李冠宇,李琳,郭立群,王长霞.基于映射的实例转换研究[J].计算机工程与应用,2010,46(6):144-147. 被引量：1
6黎建辉,吴威,阎保平.一种基于XML的元数据映射与转换方法[J].微电子学与计算机,2008,25(1):34-38. 被引量：16
7曹春华.最酷输入法，文字、图片、视频都能行！[J].电脑知识与技术（经验技巧）,2013(7):31-31.
8游残无界ROG Strix S5VT助你纵横驰骋[J].艺术与设计,2016,5(7):124-124.
9林晓.防火墙的分类与应用[J].网络与信息,2010,24(9):56-56.
10高源,席耀一,李弼程.基于依存句法分析与分类器融合的触发词抽取方法[J].计算机应用研究,2016,33(5):1407-1410. 被引量：10

中文信息学报

2013年第5期

浏览历史

内容加载中请稍等...

基于机器翻译的跨语言关系抽取被引量：2

参考文献24

二级参考文献73

共引文献145

同被引文献4

引证文献2

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

基于机器翻译的跨语言关系抽取 被引量：2

参考文献24

二级参考文献73

共引文献145

同被引文献4

引证文献2

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

基于机器翻译的跨语言关系抽取被引量：2