特定领域概念属性关系抽取方法研究被引量：1

Research on Extraction Method of Specific Domain Concept and Property

下载PDF

导出

摘要针对互联网中开放式中文文本关系难以抽取的问题,提出一个新的关系抽取方法。为缓解关系三元组抽取较难的问题,给出一个新的基于属性和概念实例的关系三元组构造方法,抽取的大量概念实例关系三元组中不仅包含大量显式关系三元组,还包含部分隐式关系三元组。在此基础上,针对关系三元组含有噪声和错误的问题,使用基于Adaboost迭代算法的协同训练方法对关系抽取模型进行优化。以大学类别领域百科条目真实文本为实验数据进行实验的结果表明,与同类关系抽取方法对比,该方法在召回率和F值上能取得较好的抽取性能。 A new relation extraction method is proposed to solve the problem of relation extraction from open Chinese free texts. In order to alleviate the difficult problem of relation triples extraction, a method based on the relationship between attribute and concept instance triples is proposed, a large number of instances of concept and relation triples includes explicit relation triples and contains an implicit relation triples. The relationship triple construction contains noise and error, in view of the relationship between the ternary group is used contains noise and wrong question, Adaboost based iterative algorithm of collaborative training methods is used to strengthen the relationship between extraction model. Experiment is carried out on the text of the encyclopedia entries in the field of university, and the experimental results show that the method can obtain better performance.

作者王旭阳姜喜秋 WANG Xuyang JIANG Xiqiu(College of Computer and Communication, Lanzhou University of Technology, Lanzhou 730050, Chin)

机构地区兰州理工大学计算机与通信学院

出处《吉林大学学报（信息科学版）》 CAS 2017年第4期430-437,共8页 Journal of Jilin University（Information Science Edition）

基金国家自然科学基金资助项目(61563030)

关键词关系抽取关系三元组 Adaboost迭代算法协同训练 relation extraction relation triples Adaboost iterative algorithm collaborative training

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献14

1王生生,玄雪花.基于定性空间推理的中文文本空间关系识别[J].吉林大学学报（理学版）,2016,54(3):529-534. 被引量：2
2杨月华,杜军平,平源.特定领域概念间关系自动抽取方法[J].北京邮电大学学报,2013,36(5):81-85. 被引量：2
3李文辉,倪洪印.一种改进的Adaboost训练算法[J].吉林大学学报（理学版）,2011,49(3):498-504. 被引量：23
4车海燕,冯铁,张家晨,陈伟,李大利.面向中文自然语言文档的自动知识抽取方法[J].计算机研究与发展,2013,50(4):834-842. 被引量：17
5彭涛,戴耀康,朱枫彤,张邦佐,刘露,闫昭,钱锋.一种基于规则的无监督词性标注方法[J].吉林大学学报（理学版）,2015,53(5):956-962. 被引量：4
6陈立玮,冯岩松,赵东岩.基于弱监督学习的海量网络数据关系抽取[J].计算机研究与发展,2013,50(9):1825-1835. 被引量：34
7贾真,何大可,尹红风,李天瑞.基于无监督学习的部分-整体关系获取[J].西南交通大学学报,2014,49(4):590-596. 被引量：9
8于微波,赵琳,佟冬.基于Adaboost人脸检测算法[J].吉林大学学报（信息科学版）,2014,32(5):539-544. 被引量：8
9杨宇飞,戴齐,贾真,尹红风.基于弱监督的属性关系抽取方法[J].计算机应用,2014,34(1):64-68. 被引量：10
10荆涛,左万利,孙吉贵,车海燕.中文网页语义标注：由句子到RDF表示[J].计算机研究与发展,2008,45(7):1221-1231. 被引量：31

二级参考文献191

1王睿,张洁,张由仪,于禛,姚天昉.基于混合模型的中文命名实体抽取系统[J].清华大学学报（自然科学版）,2005,45(S1):1908-1914. 被引量：10
2叶正,林鸿飞,苏绥,刘菁菁.基于支持向量机的人物属性抽取[J].计算机研究与发展,2007,44(z2):271-275. 被引量：11
3陈卫,周晓,叶菲,谭营.AdaBoost-NN在雷达信号识别中的应用[J].电子对抗技术,2005,20(1):29-33. 被引量：4
4车万翔,刘挺,李生.实体关系自动抽取[J].中文信息学报,2005,19(2):1-6. 被引量：115
5武勃,黄畅,艾海舟,劳世竑.基于连续Adaboost算法的多视角人脸检测[J].计算机研究与发展,2005,42(9):1612-1621. 被引量：66
6凌云,刘军,王勋.多层次web文本分类[J].情报学报,2005,24(6):684-689. 被引量：12
7俞鸿魁,张华平,刘群,吕学强,施水才.基于层叠隐马尔可夫模型的中文命名实体识别[J].通信学报,2006,27(2):87-94. 被引量：153
8崔世起,刘群,孟遥,于浩,西野文人.基于大规模语料库的新词检测[J].计算机研究与发展,2006,43(5):927-932. 被引量：32
9周俊生,戴新宇,尹存燕,陈家骏.基于层叠条件随机场模型的中文机构名自动识别[J].电子学报,2006,34(5):804-809. 被引量：112
10杜小勇,李曼,王珊.本体学习研究综述[J].软件学报,2006,17(9):1837-1847. 被引量：241

共引文献393

1郭崇慧,许蒙.一种基于众包模式的试题知识点标注方法[J].信息与管理研究,2019,0(6):64-72. 被引量：3
2杨耿,张业明,侯金利,刘咏炫,鲁骏,周靖.高速公路图像识别技术应用探析[J].中国交通信息化,2022(S01):294-298. 被引量：1
3吴天昊,古丽拉·阿东别克.基于神经元块级别注意力机制的LSTM关系抽取[J].计算机应用研究,2020,37(S02):76-79. 被引量：6
4盛泳潘,付雪峰,吴天星.基于开放域抽取的多文档概念图构建研究[J].计算机应用研究,2020,37(1):19-25. 被引量：2
5谭朋柳,徐光勇,张露玉,王润庶.基于卷积神经网络和Adaboost的心脏病预测模型[J].计算机应用,2023,43(S01):19-25. 被引量：2
6涂鼎,陈岭,陈根才,吴勇,王敬昌.基于多路层次聚类的商品评论数据概念分类构建[J].计算机研究与发展,2013,50(S2):208-215. 被引量：3
7董恩增,闫胜旭,佟吉钢.基于主动视觉的人脸检测与跟踪算法研究[J].系统仿真学报,2015,27(5):973-979. 被引量：6
8刘红芬,刘晓峰,张雪英,黄丽霞,王子中.改进的AdaBoost.M2-SVM在低信噪比语音识别中的应用[J].微电子学与计算机,2015,32(2):88-91. 被引量：1
9张玉峰,蔡皎洁.基于数据挖掘的Web文本语义分析与标注研究[J].情报理论与实践,2010,33(2):85-88. 被引量：7
10常平梅,李冠宇,张俊.基于本体集成的语义标注模型设计[J].计算机工程与设计,2010,31(5):1125-1129. 被引量：6

同被引文献3

1荆涛,左万利,孙吉贵,车海燕.中文网页语义标注：由句子到RDF表示[J].计算机研究与发展,2008,45(7):1221-1231. 被引量：31
2王桐,王磊,吴吉义,徐贺.WordNet中的综合概念语义相似度计算方法[J].北京邮电大学学报,2013,36(2):98-101. 被引量：25
3杨博,蔡东风,杨华.开放式信息抽取研究进展[J].中文信息学报,2014,28(4):1-11. 被引量：28

引证文献1

1盛泳潘,付雪峰,吴天星.基于开放域抽取的多文档概念图构建研究[J].计算机应用研究,2020,37(1):19-25. 被引量：2

二级引证文献2

1萧展辉,孙刚,邹文景.基于数据挖掘的业务系统元数据文档自动更新模型[J].电子设计工程,2022,30(16):190-193.
2邬宝娴,谢燚,郝天永,沈映姗.一种新的自动概念图生成模型C-IK2[J].中文信息学报,2023,37(11):158-170.

1廖志勇.多兵种协同训练[J].兵器知识,2017,0(11).
2王加楠,鲁强.基于模式的远监督关系抽取算法[J].中文信息学报,2017,31(4):122-131. 被引量：3
3第四次工业革命:一场席卷世界的大变革[J].创新时代,2017,0(9):5-8.
4卞拓蒙.一个关系信念逻辑（英文）[J].逻辑学研究,2017,10(3):1-21. 被引量：1
5刘涛.试论钱钟书对古典诗歌暗合现象的研究[J].淮阴师范学院学报（哲学社会科学版）,2017,39(5):490-493.
6魏再晨.做绿色产业中的金融专家——访中国节能财务公司总经理杜乐[J].中国金融家,2017(9):90-91.
7陈佳.“一字”板书领课堂[J].教育实践与研究（中学版）（B）,2017(10):10-11.
8门威.基于MapReduce的大数据处理算法综述[J].濮阳职业技术学院学报,2017,30(5):85-88. 被引量：2
9何伟,黄友能,袁保宗,林碧琴.对话系统中知识处理的研究[J].铁道学报,2001,23(z1):32-37.
10崔琳,宋启祥,李玉林,戚溪溪.基于潜在地理——社会关系感知的兴趣点推荐研究[J].宿州学院学报,2017,32(9):96-102.

吉林大学学报（信息科学版）

2017年第4期

浏览历史

内容加载中请稍等...

特定领域概念属性关系抽取方法研究被引量：1

参考文献14

二级参考文献191

共引文献393

同被引文献3

引证文献1

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

特定领域概念属性关系抽取方法研究 被引量：1

参考文献14

二级参考文献191

共引文献393

同被引文献3

引证文献1

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

特定领域概念属性关系抽取方法研究被引量：1