基于多层交互注意力机制的商品属性抽取被引量：2

AEMIA:Extracting Commodity Attributes Based on Multi-level Interactive Attention Mechanism

导出

摘要【目的】提升模型对文本结构特征和文本特征间关联性的感知,充分挖掘文本内在语义,深层次指导抽取任务。【方法】对文本、句法和词性进行特征抽取,得到各自的特征;将不同的特征进行融合,获得完备的文本结构特征;再设计一个多层交互注意力机制,该机制聚焦于文本结构特征和文本特征之间的深层关联,并采用双线性融合策略,以保证信息的完整性;最后,通过常用的分类器进行属性抽取。【结果】在公开的数据集上,所提模型的属性抽取准确率相比于已有模型至少提高了1.2个百分点。【局限】所提模型对隐式属性词感知迟钝,句子中出现三个以上隐式属性词,模型的性能将大幅度降低。【结论】在显式的商品属性词抽取任务中,建模文本结构特征与文本特征间关联性的方法可以有效提高属性抽取的准确率。 [Objective]This paper develops a new model to improve the perception of structural features and correlation between text features,aiming to fully explore the internal semantics and extract attributes.[Methods]First,we extracted the features of text,syntax and part of speech.Then,we merged different features to obtain complete text structure features.Third,we designed a multi-layer interactive attention mechanism,which focuses on the deep correlation between text structural features and text features.Fourth,we adopted bilinear fusion strategy to ensure the information integrity.Finally,we extracted attributes with common classifiers.[Results]We examined the new model with publicly available data sets,and found its extraction accuracy was at least 1.2percentage point higher than that of the existing methods.[Limitations]The model was insensitive to implicit attribute words,and the performance of the model will be greatly reduced with more than three implicit attribute words in the sentence.[Conclusions]The proposed method can effectively improve the accuracy of commodity attributes extraction.

作者苏明星吴厚月李健黄菊张顺香 Su Mingxing;Wu Houyue;Li Jian;Huang Ju;Zhang Shunxiang(School of Computer Science and Engineering,Anhui University of Science&Technology,Huainan 232001,China)

机构地区安徽理工大学计算机科学与工程学院

出处《数据分析与知识发现》 CSSCI CSCD 北大核心 2023年第2期108-118,共11页 Data Analysis and Knowledge Discovery

基金国家自然科学基金项目(项目编号:62076006) 安徽省属高校协同创新项目(项目编号:GXXT-2021-008)的研究成果之一。

关键词属性抽取交互注意力机制依存关系 BiGRU BERT Attribute Extraction Interactive Attention Mechanism Dependency Relationship BiGRU BERT

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献6

1张严,李天瑞.面向评论的方面级情感分析综述[J].计算机科学,2020,47(6):194-200. 被引量：32
2彭春艳,张晖,包玲玉,陈昌平.基于条件随机域的生物命名实体识别[J].计算机工程,2009,35(22):197-199. 被引量：17
3苏丰龙,谢庆华,邱继远,岳振军.基于深度学习的领域实体属性词聚类抽取研究[J].微型机与应用,2016,35(1):53-55. 被引量：7
4王仁武,张文慧.基于深度学习的隐性评价对象识别方法[J].计算机工程,2019,45(8):315-320. 被引量：5
5尉桢楷,程梦,周夏冰,李志峰,邹博伟,洪宇,姚建民.基于类卷积交互式注意力机制的属性抽取研究[J].计算机研究与发展,2020,57(11):2456-2466. 被引量：9
6李成梁,赵中英,李超,亓亮,温彦.基于依存关系嵌入与条件随机场的商品属性抽取方法[J].数据分析与知识发现,2020,4(5):54-65. 被引量：4

二级参考文献33

1Lafferty J, McCallum A, Pereira F. Conditional Random Fields: Probabilistic Models for Segmenting and Labeling Sequence Data[C]//Proc. of the 18th International Conference on Machine Learning. Williamstown, Australia: [s. n.], 2001.
2Friedrich C M, Revillion T, Hofmann M, et al. Biomedical and Chemical Named Entity Recognition with Conditional Random Fields: The Advantage of Dictionary Features[C]//Proc. of the 2nd International Symposium on Semantic Mining in Biomedicine. Jena, Germany: [s. n.], 2006.
3Wellner B, McCallum A, Peng Fuchun, et al. An Integrated, Conditional Model of Information Extraction and Coreference with Application to Citation Graph Construction[C]//Proc. of the 20th Conference on Uncertainty in Artificial Intelligence. Banff, Canada:[s. n.], 2004.
4MARTIN S,NEY H.Algorithms for bigram and trigram word clustering[C].In:Proc European Conference Speech Communication and Technology,Madrid,1995:1253-1256.
5刘树杰,董力,张家骏,等.深度学习在自然语言处理中的应用[J].中国计算机学会通讯,2015,11(3):9-16.
6BENGIO Y,DUCHARME R,VINCENT P,et al.A neural probabilistic language model[J].The Joural of Machine Research,2003(3):1137-1155.
7MIKOLOV T,KOMBRINK S,BURGET L,et al.Extensions of recurrent neural network language model[C].Acoustics,Speech and Signal Processing(ICASSP),2011IEEE International Conference on,IEEE,2011:5528-5531.
8朱鸿宇,刘瑰,陈左宁,唐福华.实体关系识别中长距离依赖问题的研究[J].小型微型计算机系统,2008,29(2):364-367. 被引量：2
9杨志豪,林鸿飞,李彦鹏.条件随机域与上下文线索结合的生物实体识别[J].计算机工程,2008,34(7):203-204. 被引量：3
10郎君,忻舟,秦兵,刘挺,李生.集成多种背景语义知识的共指消解[J].中文信息学报,2009,23(3):3-9. 被引量：7

共引文献66

1马进,杨一帆,陈文亮.基于远程监督的人物属性抽取研究[J].中文信息学报,2020(6):64-72. 被引量：11
2周晶.基于条件随机域模型的中文实体关系抽取[J].计算机工程,2010,36(24):192-194. 被引量：2
3鞠久朋,张伟伟,宁建军,周国栋.CRF与规则相结合的地理空间命名实体识别[J].计算机工程,2011,37(7):210-212. 被引量：31
4叶枫,陈莺莺,周根贵,李昊旻,李莹.电子病历中命名实体的智能识别[J].中国生物医学工程学报,2011,30(2):256-262. 被引量：47
5罗芳,熊前兴,肖敏.基于本体的产品命名实体识别研究[J].武汉理工大学学报（信息与管理工程版）,2011,33(6):948-952. 被引量：3
6邱莎,王付艳,申浩如,段玻,阿圆,丁海燕.基于含边界词性特征的中文命名实体识别[J].计算机工程,2012,38(13):128-130. 被引量：7
7鲁亚楠,孙锐,姬东鸿.基于位置敏感Embedding的中文命名实体识别[J].计算机应用研究,2017,34(2):365-368. 被引量：3
8阿迪来.艾合买提,冯向萍.基于条件随机场的维吾尔语音乐实体识别[J].智能计算机与应用,2017,7(2):59-62. 被引量：2
9杨娅,杨志豪,林鸿飞,宫本东,王健.MBNER:面向生物医学领域的多种实体识别系统[J].中文信息学报,2016,30(1):170-175 182. 被引量：7
10王仁武,孟现茹,孔琦.实体—属性抽取的GRU+CRF方法[J].现代情报,2018,38(10):57-64. 被引量：5

同被引文献31

1倪铭远,邓宏涛,高望.基于图卷积神经网络的虚假新闻检测[J].计算机应用,2023,43(S01):49-55. 被引量：2
2赵宇翔,范哲,朱庆华.用户生成内容(UGC)概念解析及研究进展[J].中国图书馆学报,2012,38(5):68-81. 被引量：287
3高良谋,马文甲.开放式创新:内涵、框架与中国情境[J].管理世界,2014,30(6):157-169. 被引量：204
4于超,朱瑾,张文倩,张耀耀.信息交互视角下在线社群协同进化耦合域构建机制研究[J].情报科学,2018,36(12):111-117. 被引量：4
5申光龙,彭晓东,秦鹏飞.虚拟品牌社区顾客间互动对顾客参与价值共创的影响研究——以体验价值为中介变量[J].管理学报,2016,13(12):1808-1816. 被引量：100
6唐洪婷,李志宏,秦睿.基于超网络的大众协同创新社区用户知识模型研究[J].管理学报,2017,14(6):859-867. 被引量：15
7刘永相,李彦斌,林亮,江冰,刘期烈,谢冬菊.基于区块链的共享汽车智能合约算法设计[J].计算机应用,2020,40(S01):231-237. 被引量：3
8沈波,卢宜芳.企业与用户知识共创研究综述[J].情报探索,2021(3):128-134. 被引量：2
9沈旺,李世钰,刘嘉宇,李贺.问答社区回答质量评价体系优化方法研究[J].数据分析与知识发现,2021,5(2):83-93. 被引量：9
10张海涛,任亮,刘伟利,周红磊.基于超网络的用户知识协同创新研究——以开放式创新社区“花粉俱乐部”为例[J].情报学报,2021,40(4):402-413. 被引量：9

引证文献2

1王松,骆莹,刘新民.基于双粒度语义特征与异质性网络的知识共创价值识别[J].情报杂志,2024,43(5):123-131.
2汪才钦,周渝皓,张顺香,王琰慧,王小龙.基于语境增强的新能源汽车投诉文本方面-观点对抽取[J].计算机应用,2024,44(8):2430-2436.

1蒋川宇,韩翔宇,杨文蕊,吕博涵,黄小欧,谢夏,谷阳.医学知识图谱研究与应用综述[J].计算机科学,2023,50(3):83-93. 被引量：10
2潘雨晨,尉桢楷,洪宇,徐庆婷,姚建民.融合高频属性信息的属性抽取研究[J].中文信息学报,2023,37(1):132-143. 被引量：2
3许绚如.利用高中语文好课堂提升学生语文核心素养[J].语文世界（中旬刊）,2023(3):46-47.
4张君燕.“迟钝”的力量[J].发明与创新（初中生）,2023(5):1-1.
5崔少国,独潇,杨泽田.多注意力机制融合低高阶特征的神经推荐算法[J].计算机工程与应用,2023,59(8):192-199. 被引量：4
6菅文静.小学语文阅读教学文本的多角度阐释[J].教学管理与教育研究,2023,8(7):29-31. 被引量：1
7黄维栋.透过开满鲜花的月亮[J].微型小说选刊,2022(1):95-96.
8吉旭霞.无缝隙护理在氯吡格雷治疗冠心病心绞痛患者中的干预效果分析--评《冠心病诊断与治疗》[J].世界中医药,2023,18(4). 被引量：1
9E.M.齐奥朗.因工作而堕落[J].读写月报,2023(7).
10封红旗,孙杨,杨森,李文杰.基于BERT的中文电子病历命名实体识别[J].计算机工程与设计,2023,44(4):1220-1227. 被引量：10

数据分析与知识发现

2023年第2期

浏览历史

内容加载中请稍等...

基于多层交互注意力机制的商品属性抽取被引量：2

参考文献6

二级参考文献33

共引文献66

同被引文献31

引证文献2

相关作者

相关机构

相关主题

浏览历史

基于多层交互注意力机制的商品属性抽取 被引量：2

参考文献6

二级参考文献33

共引文献66

同被引文献31

引证文献2

相关作者

相关机构

相关主题

浏览历史

基于多层交互注意力机制的商品属性抽取被引量：2