多特征融合与注意力机制的中文文本关系抽取被引量：3

Research on Extraction Method of Text Entity Relations Based on Multi-feature Fusion and Attention Mechanism

下载PDF

导出

摘要在中文关系抽取任务中,数据稀疏和噪声传播问题是其研究难点。基于此,提出了在文本特征组织方面融合位置特征、最短依存特征和N-gram特征等多元特征,并提升关键性特征的权重,以缓解传统词特征的数据稀疏问题。这种组合特征进一步改善了文本中噪声传播问题,提高了句法特征在稀疏性问题下的可靠性。此外,在传统的双向LSTM神经网络中加入注意力机制,使模型更关注较为重要的特征,降低噪声对抽取任务的影响。在人物关系公开语料集上进行实验,结果表明采用该方法进行中文文本关系抽取的效果较好,并为信息抽取、知识图谱等领域提供了方法支持。 At present, data sparsity and noise propagation have become difficult problems in Chinese relational extraction. In order to alleviate the data sparsity problem of traditional word features, we propose to use the fusion of location features, minimum dependency features and N-gram features in text feature organization, and enhance the weight of key features. This combination feature further improves the problem of noise propagation in text, and improves the reliability of syntactic features under sparse problem. In addition, attention mechanism is added to the traditional two-way LSTM neural network to make the model pay more attention to the more important features and reduce the influence of redundant noise on the extraction task. Experiments on the open corpus of human relations show that the proposed method achieves good results in the task of Chinese text relational extraction, and provides methodological support for information extraction, knowledge mapping and other fields.

作者陈振彬叶颖雅冯浩男李明轩陈珂 CHEN Zhenbin;YE Yingya;FENG Haonan;LI Mingxuan;CHEN Ke(College ofComputer Science and Technology, Guangdong University of Petrochemical Technology, Maoming 525000, China)

机构地区广东石油化工学院计算机学院

出处《广东石油化工学院学报》 2019年第4期36-40,共5页 Journal of Guangdong University of Petrochemical Technology

基金广东省自然科学基金项目(2016A030307049,2018A030307032) 广东省高等院校学科与专业建设专项资金项目(2016KTSCX090) 大学生创新创业训练与培育项目(733013,733435,733437)

关键词依存句法分析 N-GRAM 关系抽取双向LSTM 注意力机制 dependency parsing N-gram relation extraction BiLSTM attention mechanism

分类号 TP312 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献2

1甘丽新,万常选,刘德喜,钟青,江腾蛟.基于句法语义特征的中文实体关系抽取[J].计算机研究与发展,2016,53(2):284-302. 被引量：74
2李明耀,杨静.基于依存分析的开放式中文实体关系抽取方法[J].计算机工程,2016,42(6):201-207. 被引量：27

二级参考文献39

1车万翔,刘挺,李生.实体关系自动抽取[J].中文信息学报,2005,19(2):1-6. 被引量：115
2张素香,李蕾,秦颖,钟义信.基于Boot Strapping的中文实体关系自动生成[J].微电子学与计算机,2006,23(12):15-18. 被引量：3
3董静,孙乐,冯元勇,黄瑞红.中文实体关系抽取中的特征选择研究[J].中文信息学报,2007,21(4):80-85. 被引量：55
4黄伯荣,廖序东.现代汉语[M].3版.北京:高等教育出版社,2002:12.
5Kambhatla N. Combining lexical, syntactic, and semantic features with maximum entropy models for extracting relations [C]//Proc of the ACL 2004 on Interactive Poster and Demonstration Sessions. Stroudsburg, PA: Association for Computational Linguistics, 2004:1-4.
6Zhou G D, Su J, Zhang J, et al. Exploring various knowledge in relation extraction [C]//Proc of the 43rd Annual Meeting on Association for Computational Linguistics. Stroudsburg, PA.. Association for Computational Linguistics, 2005:427-434.
7Jiang J, Zhai C X. A systematic exploration of the feature space for relation extraction [C]//Proc of Human Language Technologies: The Conference of the North American Chapter of the Association for Computational Linguistics (NAACL-HLT'07). Stroudsburg, PA: Association for Computational Linguistics, 2007:113-120.
8Chan Y S, Roth D. Exploiting background knowledge for relation extraction [C]//Proc of the 23rd Int Conf on Computational Linguistics. Stroudsburg, PA: Association for Computational Linguistics, 2010:152-160.
9Sun A, Grishman R, Sekine S. Semi-supervised relation extraction with large-scale word clustering [C]//Proc of the 49th Annual Meeting of the Association for Computational Linguistics: Human Language Technologies. Stroudsburg, PA: Association for Computational Linguistics, 2011, 1: 521-529.
10Chen Z, Ji H. Language specific issue and feature exploration in Chinese event extraction [C] //Proc of Human Language Technologies: The 2009 Annual Conference of the North American Chapter of the Association for Computational Linguistics, Companion Volume: Short Papers. Stroudsburg, PA~ Association for Computational Linguistics, 2009: 209- 212.

共引文献91

1陈瑶,吴红,葛卫红,张海霞,廖俊.基于深度学习模型的我国药品不良反应报告实体关系抽取研究[J].中国药科大学学报,2019,50(6):753-759. 被引量：9
2邢毅雪,朱永华,高海燕,周金,张克.基于注意力机制的远程监督实体关系抽取[J].上海大学学报（自然科学版）,2021,27(5):983-992. 被引量：5
3刘新亮,张梦琪,谷情,任延昭,何东彬,高万林.基于BERT-CRF模型的生鲜蛋供应链命名实体识别[J].农业机械学报,2021,52(S01):519-525. 被引量：8
4葛艳,杜坤钰,杜军威,陈卓.基于混合神经网络的实体关系抽取方法研究[J].中文信息学报,2021,35(10):81-89. 被引量：3
5刘辉,江千军,桂前进,张祺,王梓豫,王磊,王京景.实体关系抽取技术研究进展综述[J].计算机应用研究,2020,37(S02):1-5. 被引量：23
6胡雨晴,纪明宇,王晨龙.基于依存句法的句子相似度计算方法[J].智能计算机与应用,2020(4):113-118. 被引量：2
7秦晓慧,侯霞,赵雪.一种融合语义角色和依存句法的实体关系抽取算法[J].北京信息科技大学学报（自然科学版）,2019,34(1):64-67. 被引量：4
8余丽,陆锋,刘希亮,程诗奋,张雪英.稀疏地理实体关系的关键词提取方法[J].地球信息科学学报,2016,18(11):1465-1475. 被引量：9
9徐谦谦.汽车自动驾驶英文信息特征提取优化仿真[J].计算机仿真,2016,33(11):175-178. 被引量：3
10李月洁.自然场景中特定文字图像优化识别研究与仿真[J].计算机仿真,2016,33(11):357-360. 被引量：5

同被引文献11

1刘伟,陈鸿昶,黄瑞阳.基于Tree-based CNN的关系抽取[J].中文信息学报,2018,32(11):34-40. 被引量：10
2甘丽新,万常选,刘德喜,钟青,江腾蛟.基于句法语义特征的中文实体关系抽取[J].计算机研究与发展,2016,53(2):284-302. 被引量：74
3肜博辉,付琨,黄宇,王洋.基于多通道卷积神经网的实体关系抽取[J].计算机应用研究,2017,34(3):689-692. 被引量：21
4孙建东,顾秀森,李彦,徐蔚然.基于COAE2016数据集的中文实体关系抽取算法研究[J].山东大学学报（理学版）,2017,52(9):7-12. 被引量：13
5蔡强,郝佳云,曹健,李海生.采用多尺度注意力机制的远程监督关系抽取[J].中文信息学报,2018,32(1):96-101. 被引量：12
6李博,赵翔,王帅,葛斌,肖卫东.改进的卷积神经网络关系分类方法研究[J].计算机科学与探索,2018,12(5):697-707. 被引量：10
7张兰霞,胡文心.基于双向GRU神经网络和双层注意力机制的中文文本中人物关系抽取研究[J].计算机应用与软件,2018,35(11):130-135. 被引量：20
8孙康康.多特征融合的中文实体关系抽取研究[J].无线互联科技,2019,16(9):164-165. 被引量：2
9李卫疆,李涛,漆芳.基于多特征自注意力BLSTM的中文实体关系抽取[J].中文信息学报,2019,33(10):47-56. 被引量：24
10夏鹤珑,严丹丹.基于多头注意力机制的人物关系抽取方法[J].成都工业学院学报,2020,23(1):32-36. 被引量：1

引证文献3

1杜慧祥,杨文忠,石义乐,柴亚闯,王丽花.基于Bert和卷积神经网络的人物关系抽取研究[J].东北师大学报（自然科学版）,2021,53(3):49-55. 被引量：5
2覃俊,廖立婷,刘晶,叶正,刘璐.融合汉字字形信息的文本关系抽取[J].中南民族大学学报（自然科学版）,2022,41(2):208-214.
3殷纤慧,古丽拉·阿东别克.基于多特征注意力卷积神经网络的旅游领域实体关系抽取[J].东北师大学报（自然科学版）,2022,54(1):79-83. 被引量：1

二级引证文献6

1段文昱,朱继召,赵浩楠,黄友澎,范纯龙.面向武器装备领域的实体及关系抽取方法研究[J].中国电子科学研究院学报,2022,17(12):1165-1172. 被引量：1
2李景玉.基于BERT的孪生网络计算句子语义相似度[J].科技资讯,2021,19(32):1-4.
3刘艺璇,孙英娟,李婉桦,杨丹阳,刘乾.基于深度学习的评分预测社交推荐[J].东北师大学报（自然科学版）,2022,54(3):83-89.
4卢东岳,王兴芬,李莉.基于流调数据的患者关系知识图谱构建[J].微电子学与计算机,2023,40(3):46-55.
5杨崇洛,生龙,魏忠诚,王巍.新冠文本实体关系抽取及数据集构建方法研究[J].计算机工程与应用,2023,59(8):97-104. 被引量：1
6曹茂俊,胡喆.基于卷积神经网络的医疗护理实体关系抽取[J].电子设计工程,2024,32(8):18-22.

1张兰霞,胡文心.基于双向GRU神经网络和双层注意力机制的中文文本中人物关系抽取研究[J].计算机应用与软件,2018,35(11):130-135. 被引量：20
2阳小华,张硕望,欧阳纯萍.中文关系抽取技术研究[J].南华大学学报（自然科学版）,2018,32(1):66-72. 被引量：2
3郜慧娟.以幼儿为主体的足球运动的组织策略[J].科普童话（新课堂）,2019,0(16):155-155.
4张妤,邓廷勇,夏冰.基于LS-SVM的中文文本情感分类[J].科学技术创新,2019(26):56-57. 被引量：2
5马超义,徐蔚然.基于弱监督和半自动方法的中文关系抽取数据集构建[J].中文信息学报,2017,31(5):114-119. 被引量：3
6李孟林.基于似然比的短文本作者归属研究[J].信息安全研究,2019,5(9):843-846.
7方玉萍,万荣,方达.中文文本未登录词识别的研究[J].电脑知识与技术,2019,15(7Z):203-204.
8赵文涛,吕霞.基于用户特征和相似置信度的协同过滤算法[J].测控技术,2019,38(8):95-98. 被引量：2
9唐思源,杨敏,白金牛.基于深度卷积神经网络的肺结节检测与识别[J].科学技术与工程,2019,19(22):241-248. 被引量：16
10朱海明.石洞口污水处理厂内反硝化深床滤池运行状态下的降噪研究[J].工程建设与设计,2019,0(16):139-140. 被引量：1

广东石油化工学院学报

2019年第4期

浏览历史

内容加载中请稍等...

多特征融合与注意力机制的中文文本关系抽取被引量：3

参考文献2

二级参考文献39

共引文献91

同被引文献11

引证文献3

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

多特征融合与注意力机制的中文文本关系抽取 被引量：3

参考文献2

二级参考文献39

共引文献91

同被引文献11

引证文献3

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

多特征融合与注意力机制的中文文本关系抽取被引量：3