期刊文献+

基于CNN的消费品缺陷领域词典构建方法研究 被引量:9

Building Phrase Dictionary for Defective Products with Convolutional Neural Network
原文传递
导出
摘要 【目的】有效地构建消费品缺陷领域词典,有助于了解专业领域动态与领域关键信息。【方法】首先,通过语料中的词频特征挖掘领域相关短语词;其次,使用TF-IDF算法构建领域词库以减少人工标注成本;最后,基于卷积神经网络(CNN)模型融入语义、位置信息进一步生成领域词典,提升领域词典的健壮性与泛化能力。【结果】实验结果表明,本文方法与统计学习方法相比,在准确率、召回率和F1值上提升了6%~9%。【局限】仅在消费品缺陷领域文本上构建词典,在其他领域的效果有待验证。【结论】基于CNN的消费品缺陷领域词典构建方法可以提升消费品缺陷领域词典的构建效果。 [Objective]This paper builds a dictionary for defective products,aiming to helps users better understand the latest developments of specific domains.[Methods]First,we extracted domain-related phrases from the corpus using word frequency features.Then,we reduced manual labeling work with the help of the TFIDF algorithm.Finally,we proposed a Convolutional Neural Network(CNN)model using semantic and position information to generate the domain dictionary.[Results]Compared with the statistical learning method,our model improved the accuracy,recall and F1 values by 6%~9%.[Limitations]More research is needed to examine our method in other fields.[Conclusions]The proposed CNN-based method could effectively construct a dictionary for defective products.
作者 彭郴 吕学强 孙宁 张乐 姜肇财 宋黎 Peng Chen;Lv Xueqiang;Sun Ning;Zang Le;Jiang Zhaocai;Song Li(Beijing Key Laboratory of Internet Culture and Digital Dissemination Research,Beijing Information Science and Technology University,Beijing 100101,China;China National Institute of Standardization,Beijing 100191,China)
出处 《数据分析与知识发现》 CSSCI CSCD 北大核心 2020年第11期112-120,共9页 Data Analysis and Knowledge Discovery
基金 国家自然科学基金项目“中文专利侵权自动检测研究”(项目编号:61671070) 青海省藏文信息处理与机器翻译重点实验室/藏文信息处理教育部重点实验室开放课题基金项目“藏文网络热点事件检测与情感分析研究”(项目编号:2019Z002) 中国标准化研究院院长基金项目“基于电商评价信息的典型消费品缺陷线索安全评价方法研究”(项目编号:282020Y-7511)的研究成果之一。
关键词 领域词典 词频特征 TF-IDF 卷积神经网络 Domain Dictionary Word Frequency Feature TF-IDF CNN
  • 相关文献

参考文献6

二级参考文献46

共引文献98

同被引文献94

引证文献9

二级引证文献18

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部