CNN-SM:基于义原与多特征融合的消费品领域缺陷词识别模型

CNN-SM:Identifying Words on Defective Products with Sememe and Multi-features

导出

摘要【目的】针对消费品领域中缺陷词识别任务精度不足的问题,提出基于义原与多特征融合的消费品领域缺陷词识别模型。【方法】模型输入为融合义原信息的分布式词向量,在此基础上添加词性特征和经过随机嵌入的词位置向量,以增添词向量所包含的信息;在卷积神经网络上去除了最大池化,增加卷积核输出的深度向量所包含的信息,为单词分类提供更充分的信息。【结果】实验结果表明,所提模型相较于仅添加词位置向量的卷积神经网络模型,在精确率、召回率和F1值上分别有0.021、0.002和0.012的提升。【局限】不同场景下的相同表述的极性识别不足。【结论】通过消融实验证明,义原、词性以及去除池化层有助于领域词识别模型性能的提升。 [Objective]This paper proposes a CNN model based on the sememe and multi-features,aiming to improve the recognition accuracy of words on defected consumer products.[Methods]First,we created the model’s input with a distributed word vector fused with sememe.Then,we added part-of-speech features and randomly embedded word position vectors to the input.Finally,we removed the max pooling and increased the information contained in the depth vector output by the convolution kernel,which provided sufficient information for word classification.[Results]Compared with the CNN model only adding word position vectors,the proposed method improved the precision,recall and F1 values by 0.021,0.002 and 0.012,respectively.[Limitations]We need to improve the polarity recognition of the same expression in different scenarios.[Conclusions]The sememe,part-of-speech,and the removal of pooling layer could improve the performance of model for domain word recognition.

作者游新冬袁梦龙张乐吕学强 You Xindong;Yuan Menglong;Zhang Le;Lv Xueqiang(Beijing Key Laboratory of Internet Culture and Digital Dissemination Research,Beijing Information Science and Technology University,Beijing100101,China)

机构地区北京信息科技大学网络文化与数字传播北京市重点实验室

出处《数据分析与知识发现》 CSSCI CSCD 北大核心 2022年第9期77-85,共9页 Data Analysis and Knowledge Discovery

基金北京市自然科学基金项目(项目编号:4212020) 国家自然科学基金项目(项目编号:62171043) 中国标准化研究院院长基金项目(项目编号:282020Y-7511)的研究成果之一。

关键词消费品领域词义原词向量卷积神经网络 Consumer Product Domain Words Sememe Word Vector CNN

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献13

1彭郴,吕学强,孙宁,张乐,姜肇财,宋黎.基于CNN的消费品缺陷领域词典构建方法研究[J].数据分析与知识发现,2020,4(11):112-120. 被引量：9
2闫强,张笑妍,周思敏.基于义原相似度的关键词抽取方法[J].数据分析与知识发现,2021,5(4):80-89. 被引量：9
3邵卫,化柏林.基于依存句法分析的科技政策领域主题词表无监督构建[J].情报工程,2020,6(6):33-44. 被引量：11
4陈可嘉,黄思翌.中文短文本自动关键词提取的改进RAKE算法[J].小型微型计算机系统,2021,42(6):1171-1175. 被引量：10
5黄睿智,黄德才.词间关系的不确定图模型与关键词自动抽取方法[J].小型微型计算机系统,2019,40(2):300-304. 被引量：6
6张震,曾金.面向用户评论的关键词抽取研究——以美团为例[J].数据分析与知识发现,2019,3(3):36-44. 被引量：7
7段建勇,游世薪,张梅,王昊.基于多特征融合的关键词抽取[J].计算机科学,2020,47(S02):73-77. 被引量：8
8董振东,董强,郝长伶.知网的理论发现[J].中文信息学报,2007,21(4):3-9. 被引量：99
9郗亚辉.产品评论中领域情感词典的构建[J].中文信息学报,2016,30(5):136-144. 被引量：23
10张琴,张智雄.基于PhraseLDA模型的主题短语挖掘方法研究[J].图书情报工作,2017,61(8):120-125. 被引量：8

二级参考文献107

1唐琳,郭崇慧,陈静锋.中文分词技术研究综述[J].数据分析与知识发现,2020,4(2):1-17. 被引量：45
2严娇,马静,房康.基于融合共现距离的句法网络下文本语义相似度计算[J].数据分析与知识发现,2019,3(12):93-100. 被引量：3
3聂卉.结合词向量和词图算法的用户兴趣建模研究[J].数据分析与知识发现,2019,3(12):30-40. 被引量：8
4沈艳,陈赟,黄卓.文本大数据分析在经济学和金融学中的应用:一个文献综述[J].经济学（季刊）,2019,18(4):1153-1186. 被引量：88
5李宇明.程度与否定[J].世界汉语教学,1999,13(1):29-36. 被引量：32
6张国宪.形容词的记量[J].世界汉语教学,1996,10(4):35-44. 被引量：55
7钮菊生.论现代公共政策的功能与特点[J].江海学刊,2001(5):71-75. 被引量：9
8孙霞,郑庆华,王朝静,张素娟.一种基于生语料的领域词典生成方法[J].小型微型计算机系统,2005,26(6):1088-1092. 被引量：11
9陈文亮,朱靖波,朱慕华,姚天顺.基于领域词典的文本特征表示[J].计算机研究与发展,2005,42(12):2155-2160. 被引量：22
10朱嫣岚,闵锦,周雅倩,黄萱菁,吴立德.基于HowNet的词汇语义倾向计算[J].中文信息学报,2006,20(1):14-20. 被引量：327

共引文献215

1钱小飞.语言数据资源建设中的关键问题及对策[J].语料库语言学,2021,8(2):94-105. 被引量：2
2熊回香,陈子薇,叶佳鑫.基于共现关系的关键词层次结构构建研究[J].知识管理论坛,2022(4):443-451. 被引量：1
3臧国全,张凯亮,肖洋,贾瑞莹.数据隐私风险的识别与消减——以医疗数据为例[J].情报学进展,2024(1):205-246.
4曾金,张耀峰,黄新杰,黄廷海.面向用户评论的主题挖掘研究——以美团为例[J].情报科学,2022,40(11):78-84. 被引量：9
5翟羽佳,许佳,李晓.面向突发重大公共卫生事件的多源异构应急信息融合模型研究[J].图书与情报,2021(5):9-20. 被引量：7
6徐鲲,张皓月,宋正雯.考虑语调的区域创新政策测度指标改进及评价:基于七个主要经济区政策文本挖掘的研究[J].北京联合大学学报（人文社会科学版）,2023,21(5):60-70.
7张瑞霞,肖汉.基于知网的词图构造[J].华北水利水电学院学报,2008(3):53-56. 被引量：6
8陈锐,张蕾,卢春俊,牟力科.基于概念图的信息检索的查询扩展模型[J].计算机应用,2009,29(2):545-548.
9周波,蔡东风.基于条件随机场的中文组织机构名识别研究[J].沈阳航空工业学院学报,2009,26(1):49-52. 被引量：8
10张瑞霞,朱贵良,杨国增.基于知识图的汉语词汇语义相似度计算[J].中文信息学报,2009,23(3):116-120. 被引量：11

1武剑,薛玉石,山春凤,檀青松.基于相电流工频变化量极性的微电网纵联保护方案[J].微型电脑应用,2022,38(9):117-120. 被引量：3

数据分析与知识发现

2022年第9期

浏览历史

内容加载中请稍等...

CNN-SM:基于义原与多特征融合的消费品领域缺陷词识别模型

参考文献13

二级参考文献107

共引文献215

相关作者

相关机构

相关主题

浏览历史