基于CWSA方面词提取模型的差异化需求挖掘方法研究--以京东手机评论为例被引量：2

Mining Differentiated Demands with Aspect Word Extraction: Case Study of Smartphone Reviews

导出

摘要【目的】提出一种基于深度学习的方面词提取方法,实现差异化与精细化的挖掘分析。【方法】设计语境窗口自注意力(Context Window Self-Attention,CWSA)模型进行方面词提取,在把握文本整体信息的基础上,聚焦语境窗口内以及邻近文本的语义,从评论中挖掘细粒度的产品特征。在此基础上,采用方面级情感分析方法分析用户需求。【结果】根据京东手机评论构造了方面词提取和方面级情感分析中文数据集,CWSA模型在该数据集上F1分数达到89.65%,效果优于基线方面词提取模型。【局限】公开的中文领域方面词数据集较为匮乏,未来将构建多个产品的中文数据集以获得更丰富的实验分析,并在英文数据集上拓展模型的跨语言适应能力。【结论】在近90万条京东手机评论上进行模型的应用验证,表明所提模型能为企业提供差异化与精细化的挖掘分析。 [Objective] This paper proposes a new deep learning algorithm to extract aspect words, aiming to achieve differentiated and refined user demand analysis. [Methods] We designed a Context Window SelfAttention(CWSA) model to extract aspect words. This model focuses on semantics of the context window and adjacent texts based on overall information of the full-texts. Then, we extracted the fine-grained product features from their reviews. Finally, we conducted the aspect-level sentiment analysis to further examine user demands.[Results] The paper constructed a Chinese dataset for aspect word extraction and aspect-level sentiment analysis with nearly 900, 000 reviews of smartphones sold by JD. com. The proposed CWSA model’s F1 score reached 89.65% on this dataset, which was better than those of the baseline models. [Limitations] There are limited publicly accessible Chinese datasets for aspect word extraction and aspect-level sentiments. More Chinese and English datasets of multiple products need to be constructed to improve our model’s cross-language adaptability.[Conclusions] The proposed model improves differentiated and refined data mining.

作者肖宇晗林慧苹 Xiao Yuhan;Lin Huiping(School of Software&Microelectronics,Peking University,Beijing 102600,China)

机构地区北京大学软件与微电子学院

出处《数据分析与知识发现》 CSCD 北大核心 2023年第1期63-75,共13页 Data Analysis and Knowledge Discovery

基金国家重点研发计划(项目编号:2018YFB1702900)的研究成果之一。

关键词深度学习方面词提取情感分析差异化需求挖掘 Deep Learning Aspect Word Extraction Sentiment Analysis Differentiated Demand Mining

分类号 TP391.1 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献5

1李贺,曹阳,沈旺,李叶叶,涂敏.基于LDA主题识别与Kano模型分析的用户需求研究[J].情报科学,2021,39(8):3-11. 被引量：37
2韩忠明,李梦琪,刘雯,张梦玫,段大高,于重重.网络评论方面级观点挖掘方法研究综述[J].软件学报,2018,29(2):417-441. 被引量：33
3常耀成,张宇翔,王红,万怀宇,肖春景.特征驱动的关键词提取算法综述[J].软件学报,2018,29(7):2046-2070. 被引量：36
4肖宇晗,林慧苹,汪权彬,谭营.基于双特征嵌套注意力的方面词情感分析算法[J].智能系统学报,2021,16(1):142-151. 被引量：6
5张严,李天瑞.面向评论的方面级情感分析综述[J].计算机科学,2020,47(6):194-200. 被引量：32

二级参考文献37

1朱嫣岚,闵锦,周雅倩,黄萱菁,吴立德.基于HowNet的词汇语义倾向计算[J].中文信息学报,2006,20(1):14-20. 被引量：326
2索红光,刘玉树,曹淑英.一种基于词汇链的关键词抽取方法[J].中文信息学报,2006,20(6):25-30. 被引量：88
3姚天昉,程希文,徐飞玉,汉思·乌思克尔特,王睿.文本意见挖掘综述[J].中文信息学报,2008,22(3):71-80. 被引量：106
4李钝,乔保军,曹元大,万月亮.基于语义分析的词汇倾向识别研究[J].模式识别与人工智能,2008,21(4):482-487. 被引量：17
5王辉,王晖昱,左万利.观点挖掘综述[J].计算机应用研究,2009,26(1):25-29. 被引量：16
6郎君,忻舟,秦兵,刘挺,李生.集成多种背景语义知识的共指消解[J].中文信息学报,2009,23(3):3-9. 被引量：7
7杜伟夫,谭松波,云晓春,程学旗.一种新的情感词汇语义倾向计算方法[J].计算机研究与发展,2009,46(10):1713-1720. 被引量：21
8刘鸿宇,赵妍妍,秦兵,刘挺.评价对象抽取及其倾向性分析[J].中文信息学报,2010,24(1):84-88. 被引量：99
9徐冰,赵铁军,王山雨,郑德权.基于浅层句法特征的评价对象抽取研究[J].自动化学报,2011,37(10):1241-1247. 被引量：49
10黄萱菁,张奇,吴苑斌.文本情感倾向分析[J].中文信息学报,2011,25(6):118-126. 被引量：61

共引文献135

1侯雪亮,李新,陈远平.基于多神经网络混合的短文本分类模型[J].计算机系统应用,2020(10):9-19. 被引量：5
2陆晨晨,王昊,石斌,裘靖文.面向电商用户评论的细粒度观点挖掘及其分布规律探究[J].知识管理论坛,2024(3):253-268.
3曾金,张耀峰,黄新杰,黄廷海.面向用户评论的主题挖掘研究——以美团为例[J].情报科学,2022,40(11):78-84. 被引量：7
4吴运明,王令村,魏子栋,郭顺利.基于Canopy-Kmeans的移动商务用户需求聚合挖掘及分析研究[J].情报科学,2022,40(10):97-106. 被引量：3
5向菲,谢耀谈.基于特征规则的在线医疗社区用户评论观点挖掘与情感分析方法[J].医学信息学杂志,2018,39(11):9-14. 被引量：4
6曹书芳,李金海.基于在线评论特征的领域本体概念获取方法[J].中国集体经济,2018(26):74-75.
7曾寰,胡运全,李金忠,戴贞明,龙满生.网络评论观点挖掘研究[J].科技风,2018(29):218-218. 被引量：1
8秦海菲,杜军平.酒店在线评论数据的特征挖掘[J].智能系统学报,2018,13(6):1006-1014. 被引量：9
9花树雯,张云华.基于主题模型的短文本情感分析的研究[J].电工技术,2019(4):91-94.
10睢国钦,那日萨,彭振.基于深度学习和CRFs的产品评论观点抽取方法[J].情报杂志,2019,38(5):177-185. 被引量：10

同被引文献36

1石文华,龚雪,张绮,王璐.在线初次评论与在线追加评论的比较研究[J].管理科学,2016,29(4):45-58. 被引量：35
2吴江,侯绍新,靳萌萌,胡忠义.基于LDA模型特征选择的在线医疗社区文本分类及用户聚类研究[J].情报学报,2017,36(11):1183-1191. 被引量：44
3吴鹏,应杨,沈思.基于双向长短期记忆模型的网民负面情感分类研究[J].情报学报,2018,37(8):845-853. 被引量：36
4李亚琴.电子商务平台用户在线评论比较研究[J].现代情报,2017,37(7):79-83. 被引量：2
5张诗林.基于Bi-LSTM和CRF的中文网购评论中商品属性提取[J].计算机与现代化,2019(2):93-97. 被引量：4
6睢国钦,那日萨,彭振.基于深度学习和CRFs的产品评论观点抽取方法[J].情报杂志,2019,38(5):177-185. 被引量：10
7余传明,王峰,胡莎莎,安璐.基于生成对抗网络的跨语言文本情感分析[J].情报理论与实践,2019,42(11):135-141. 被引量：7
8张艳丰,王羽西,彭丽徽,刘亚丽.基于文本挖掘的在线用户追加评论内容情报研究——以京东商城手机评论数据为例[J].现代情报,2020,40(9):96-105. 被引量：16
9周知,方正东.融合依存句法与产品特征库的用户观点识别研究[J].情报理论与实践,2021,44(7):111-117. 被引量：11
10李贺,曹阳,沈旺,李叶叶,涂敏.基于LDA主题识别与Kano模型分析的用户需求研究[J].情报科学,2021,39(8):3-11. 被引量：37

引证文献2

1陆晨晨,王昊,石斌,裘靖文.面向电商用户评论的细粒度观点挖掘及其分布规律探究[J].知识管理论坛,2024(3):253-268.
2韩普,叶东宇.面向在线健康社区的生成式方面级情感分析[J].现代情报,2024,44(10):142-153.

1陈士同.把握文本,从材料中寻找解题密码--以2022年高考真题为例谈论述类文本的备考[J].学语文,2023(1):49-51.
2刘源源,孙童心,郑址洪.“招募老年用户”的方法研究——以探寻如何招募北京地区老年用户参与产品设计调研为例[J].装饰,2022(11):76-81.
3朱培公.基于“三划”融合的园区企业需求挖掘模式研究[J].产业创新研究,2023(3):65-67.
4陈友鹏,陈洁,刘树坤,邓汝荣.外镶嵌式大型水冷式铝合金电机外壳挤压模[J].铝加工,2023(1):59-63.
5李坚.基于BIM和时空大数据云平台的智慧城市研究与应用[J].中文科技期刊数据库（文摘版）工程技术,2021(8):394-395.
6陆璐,郁舒兰.全屋定制设计中的住户需求分析[J].家具,2023,44(1):85-89. 被引量：3
7王琛.大数据下的新型智慧城市建设路径探寻[J].中文科技期刊数据库（引文版）工程技术,2021(6):188-189.
8吴林蔚.面向高光谱图像的农用地精细化识别分类研究[J].现代工程科技,2022,1(11):5-8.
9刘畅宜.新消费背景下设计语境的思与辨——以长沙潮宗街Moonlin餐厅为例[J].中外建筑,2023(2):6-11. 被引量：2
10李秋子.基于知觉现象投射的室内空间设计策略研究[J].艺术科技,2023,36(1):211-213.

数据分析与知识发现

2023年第1期

浏览历史

内容加载中请稍等...

基于CWSA方面词提取模型的差异化需求挖掘方法研究--以京东手机评论为例被引量：2

参考文献5

二级参考文献37

共引文献135

同被引文献36

引证文献2

相关作者

相关机构

相关主题

浏览历史

基于CWSA方面词提取模型的差异化需求挖掘方法研究--以京东手机评论为例 被引量：2

参考文献5

二级参考文献37

共引文献135

同被引文献36

引证文献2

相关作者

相关机构

相关主题

浏览历史

基于CWSA方面词提取模型的差异化需求挖掘方法研究--以京东手机评论为例被引量：2