无指导的中文开放式实体关系抽取被引量：48

Unsupervised Chinese Open Entity Relation Extraction

下载PDF

导出

摘要传统的实体关系抽取需要预先定义关系类型体系,然而定义一个全面的实体关系类型体系是很困难的.开放式实体关系抽取技术解决了预先定义关系类型体系的问题,但是在中文上的研究还比较少.提出面向大规模网络文本的无指导开放式中文实体关系抽取方法,首先使用实体之间的距离限制和关系指示词的位置限制获取候选关系三元组;然后采用全局排序和类型排序的方法来挖掘关系指示词;最后使用关系指示词和句式规则对关系三元组进行过滤.在获取大量关系三元组的同时,还保证了80%以上的微观平均准确率. Entity relation extraction is an important task in information extraction which helps people find knowledge quickly and accurately in various text. Traditionally, entity relation extraction methods require a pre-defined set of relation types and a corpus with manual tags. But it is difficult to build a well-defined architecture of the relation types and it takes a lot of time to label a corpus. Open entity relation extraction is the task of extracting relation triples from natural language text without pre-defined relation types. There is a lot of research in the field of English open entity relation extraction, but rarely in the field of Chinese open entity relation extraction. This paper presents the UnCORE （unsupervised Chinese open entity relation extraction method for the Web）. UnCORE is an unsupervised open entity relation extraction method which discovers relation triples from large-scale Web text. UnCORE exploits using word distance and entity distance constraints to generate candidate relation triples from the raw corpus, and then adopts global ranking and domain ranking methods to discover relation words from the candidate relation triples. Finally UnCORE filters candidate relation triples by using the extracted relation words and some sentence rules. Results show that UnCORE extracts large scale relation triples at precision higher than 80%.

作者秦兵刘安安刘挺

机构地区哈尔滨工业大学计算机科学与技术学院

出处《计算机研究与发展》 EI CSCD 北大核心 2015年第5期1029-1035,共7页 Journal of Computer Research and Development

基金国家自然科学基金项目(61122012 61273321) 国家"八六三"高技术研究发展计划基金项目(2012AA011102)

关键词开放式实体关系抽取无指导关系三元组关系指示词信息抽取 open entity relation extraction unsupervised relation triple relation word information extraction

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献7

1Chinchor N, Marsh E. MUC-7 information extraction task definition [C] //Proc of MUC-7. Stroudsburg, PA: ACL, 1998: 359-367.
2Banko M, Cafarella M J, Soderland S, et al. Open information extraction from the Web [C] //Proc of IJCAI 2007. San Francisco: Morgan Kaufmann, 2007: 2670-2676.
3Wu F, Weld D S. Open information extraction using Wikipedia [C] //Proc of ACL 2010. Stroudsburg, PA: ACL, 2010:118-127.
4Surdeanu M, Tihshirani J, Nallapati R, et al. Multi-instance multi-label learning for relation extraction [C] //Proc of the EMNLP 2012. Stroudsburg, PA: ACL, 2012: 455-465.
5Fader A, Soderland S, Etzioni O. Identifying relation for open information extraction [C] //Proc of the EMNLP 2011. Stroudsburg, PA: ACL, 2011:1535-1545.
6Yao L, Riedel S, McCallum A. Unsupervised relation discovery with sense disambiguation [C] //Proc of the 50th Annual Meeting of the Association for Computational Linguistics. Stroudsburg, PA: ACL, 2012: 712-720.
7Che Wanxiang, Li Zhenghua, Liu Ting. LTP~ A Chinese language technology platform [C] //Proc of the Coling 2010. Stroudsburg, PA: ACL, 2010: 13-16.

同被引文献346

1彭骁男,周兰江,张建安,周枫.融合多特征的老挝语人名地名命名实体识别[J].中国水运（下半月）,2020,20(3):74-77. 被引量：1
2刘辉,江千军,桂前进,张祺,王梓豫,王磊,王京景.实体关系抽取技术研究进展综述[J].计算机应用研究,2020,37(S02):1-5. 被引量：25
3袁琦,刘渊,谢振平,陆菁.宠物知识图谱的半自动化构建方法[J].计算机应用研究,2020,37(1):178-182. 被引量：6
4徐健,张智雄.典型关系抽取系统的技术方法解析[J].数字图书馆论坛,2008(9):13-18. 被引量：3
5陈少波.试论汉语科技词汇[J].浙江师范大学学报（社会科学版）,1998,24(2):62-65. 被引量：2
6梅家驹,竺一鸣,高蕴琦,殷鸿翔.编纂汉语类义词典的尝试——《同义词词林》简介[J].辞书研究,1983(1):133-138. 被引量：15
7车万翔,刘挺,李生.实体关系自动抽取[J].中文信息学报,2005,19(2):1-6. 被引量：116
8陈悦,刘则渊.悄然兴起的科学知识图谱[J].科学学研究,2005,23(2):149-154. 被引量：823
9顾益军,樊孝忠,王建华,汪涛,黄维金.中文停用词表的自动选取[J].北京理工大学学报,2005,25(4):337-340. 被引量：35
10姜吉发.一种事件信息抽取模式获取方法[J].计算机工程,2005,31(15):96-98. 被引量：27

引证文献48

1刘新亮,张梦琪,谷情,任延昭,何东彬,高万林.基于BERT-CRF模型的生鲜蛋供应链命名实体识别[J].农业机械学报,2021,52(S01):519-525. 被引量：12
2徐庆,段利国,李爱萍,阴桂梅.基于实体词语义相似度的中文实体关系抽取[J].山东大学学报（工学版）,2015,45(6):7-15. 被引量：4
3闫旸,赵佳鹏,李全刚,张洋,柳厅文,时金桥.面向文本标题的人物关系抽取[J].计算机应用,2016,36(3):726-730. 被引量：3
4张志华,王建祥,田俊峰,吴国顺,兰曼.基于多元特征的分块人物关系识别系统[J].计算机应用,2016,36(3):751-757. 被引量：3
5刘锦文,邢凯,芮伟康,张利萍,周慧.基于信息关联拓扑的互联网社交关系挖掘[J].计算机应用,2016,36(7):1875-1880. 被引量：3
6单赫源,吴照林,张海粟,刘培磊.结合词语规则和SVM模型的军事命名实体关系抽取方法[J].指挥控制与仿真,2016,38(4):58-63. 被引量：7
7王海艳,曹攀.基于节点属性与正文内容的海量Web信息抽取方法[J].通信学报,2016,37(10):9-17. 被引量：12
8余丽,陆锋,刘希亮,程诗奋,张雪英.稀疏地理实体关系的关键词提取方法[J].地球信息科学学报,2016,18(11):1465-1475. 被引量：9
9康睿智,郝文宁,程恺,占栋辉.面向军事装备实体的属性抽取[J].计算机应用研究,2016,33(12):3721-3724. 被引量：5
10段利国,徐庆,李爱萍,崔敏君.实体词语义信息对中文实体关系抽取的作用研究[J].计算机应用研究,2017,34(1):141-146. 被引量：7

二级引证文献472

1陈瑶,吴红,葛卫红,张海霞,廖俊.基于深度学习模型的我国药品不良反应报告实体关系抽取研究[J].中国药科大学学报,2019,50(6):753-759. 被引量：10
2曹艳琴.基于深度学习的英语自然语言处理系统[J].系统仿真技术,2021,17(4):285-288. 被引量：1
3姜洋,刘龙威.大数据视角下的一体化测绘地理信息监管和服务体系——以广东省为例[J].热带地貌,2021(2):66-72. 被引量：3
4葛世奇,孙新,寇桓锦,袁燕.基于预训练模型的政务领域实体关系抽取[J].情报工程,2022,8(4):3-13. 被引量：2
5余晓蕾,朱笛,王立昊,林军,向剑文.基于知识图谱的嵌入式操作系统测试用例复用推荐模型[J].武汉大学学报（理学版）,2023,69(2):187-194. 被引量：3
6周俊,郑彭元,袁立存,戈为溪,梁静.基于改进CASREL的水稻施肥知识图谱信息抽取研究[J].农业机械学报,2022,53(11):314-322. 被引量：9
7刘新亮,张梦琪,谷情,任延昭,何东彬,高万林.基于BERT-CRF模型的生鲜蛋供应链命名实体识别[J].农业机械学报,2021,52(S01):519-525. 被引量：12
8谢晓璇,鄂海红,匡泽民,谭玲,周庚显,罗浩然,李峻迪,宋美娜.高血压超关系知识图谱建模及用药决策推理实践[J].中文信息学报,2023,37(3):65-78.
9葛艳,杜坤钰,杜军威,陈卓.基于混合神经网络的实体关系抽取方法研究[J].中文信息学报,2021,35(10):81-89. 被引量：5
10王大阜,王静,邓志文,贾志勇,张浴日.深度学习赋能网络安全知识图谱实体关系联合抽取研究[J].中国电子科学研究院学报,2023,18(5):420-428. 被引量：1

1全昌勤,何婷婷,姬东鸿,刘辉.基于指示词的词义消歧方法[J].计算机工程,2005,31(16):48-50.
2刘建舟,邵雄凯.一种改进的中文实体关系抽取方法[J].软件导刊,2011,10(4):27-29. 被引量：2
3刘建舟,邵雄凯.基于语义核的中文实体关系抽取[J].信息系统工程,2011,24(3):94-95. 被引量：1
4范冬梅,卢志茂,张汝波.面向词义消歧的指示词扩展技术[J].计算机工程与应用,2010,46(15):10-12. 被引量：1
5赵静玉,范新峰,陈越.Use Case的分析设计和实现[J].微机发展,2000,10(1):60-62.
6汤薇.网络取证中基于实体行为的信任模型[J].科技信息,2010(10).
7SICK 超声波传感器UM18-2 Core[J].自动化博览,2013(12):9-9.
8李焕良,张琦,杨小强,邵立福,李卫士.基于蓝牙技术的集成液压传感器设计[J].中国制造业信息化（学术版）,2005,34(2):102-103.
9杨建明.关系抽取方法研究[J].电子技术（上海）,2009(4):36-41. 被引量：2
10汤小娜,苏劲松.贝叶斯分类在词义消歧中的分析[J].黑龙江科技信息,2007(04S):38-38.

计算机研究与发展

2015年第5期

浏览历史

内容加载中请稍等...

无指导的中文开放式实体关系抽取被引量：48

参考文献7

同被引文献346

引证文献48

二级引证文献472

相关作者

相关机构

相关主题

浏览历史

无指导的中文开放式实体关系抽取 被引量：48

参考文献7

同被引文献346

引证文献48

二级引证文献472

相关作者

相关机构

相关主题

浏览历史

无指导的中文开放式实体关系抽取被引量：48