融合信息增益和梯度下降算法的在线评论有用程度预测模型被引量：2

Helpfulness Degree Prediction Model of Online Reviews Fusing Information Gain and Gradient Decline Algorithms

下载PDF

导出

摘要由于无法预知产品在线评论的文本内容是否对浏览者有用,大量的无用评论增加了潜在消费者的信息搜索成本,甚至降低了潜在消费者购买产品的可能性。为提高电子商务平台的有用在线评论率,为撰写评论者提供测试功能,建立在线评论有用程度预测模型。根据在线评论的文本特征,所提模型选择在线评论的词语数量、词语的有用值、产品特征数量等3个特征,构建一个预测在线评论有用程度的模型,其中词语的有用值是词语区分在线评论有用程度的信息增益量,然后根据大量在线评论数据利用梯度下降算法解出模型参数。实验结果显示,随着词语数量、词语有用值、产品特征数量的增长,评论有用程度不断提高。实验中把在线评论分为一般、有用、非常有用3个程度,对于一般的在线评论,预测精确率为92.96%;对于“有用”在线评论,预测精确率为94.83%;对于“非常有用”在线评论,预测精确率为67.63%。实验对模型性能进行测试,得到平均精确率为85.05%,召回率为82.81%,F1值为83.72%,该结果验证了所提模型预测在线评论有用程度的可行性。 Because it is impossible to predict whether the text content of online product reviews is helpful for viewers,many reviewers write a large number of unhelpful reviews,which increases the cost of information search for potential consumers,and even reduces the possibility of potential consumers buying products.In order to improve the helpful online reviews rate of e-commerce platform and provide test function for reviewers,a prediction model of online reviews helpfulness is established.According to the text characteristics of online reviews,the model chooses three features of online reviews:the number of words,the helpful value of words,and the number of product features,to construct a model for predicting the helpfulness of online reviews.The helpful value is the information gain of words to distinguish the helpfulness of online reviews.And then,according to a large number of online reviews,by using the gradient descent algorithm,the model parameters are solved.The experimental results show that with the increase of the number of words,helpful value of words and the number of product features,the helpfulness of reviews increases continuously.The online reviews are divided into three levels:general,helpful and very helpful.The general predicted accuracy of online reviews is 92.96%,helpful accuracy is 94.83%,and very helpful accuracy is 67.63%.The average accuracy,recall and F1 of the model are 85.05%,82.81%and 83.72%,respectively.The results verify the feasibility of the model to predict the helpfulness of online reviews.

作者冯进展蔡淑琴 FENG Jin-zhan;CAI Shu-qin(School of Management,Huazhong University of Science and Technology,Wuhan 430074,China)

机构地区华中科技大学管理学院

出处《计算机科学》 CSCD 北大核心 2020年第10期69-74,共6页 Computer Science

基金国家自然科学基金(71371081) 教育部博士点基金(20130142110044)。

关键词在线评论有用程度信息增益梯度下降法 Online reviews Helpfulness degree Information gain Gradient descent algorithm

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献7

1于明朕,那日萨.基于互自扩展模式的中文产品属性提取算法[J].计算机应用研究,2017,34(4):977-980. 被引量：3
2王洪伟,孟园.在线评论质量有用特征识别:基于GBDT特征贡献度方法[J].中文信息学报,2017,31(3):109-117. 被引量：13
3胡学钢,陈方鑫,张玉红.在线商品评论有用性影响因素研究[J].计算机应用研究,2016,33(12):3559-3561. 被引量：8
4徐乔,张霄,余绍淮,陈启浩,刘修国.综合多特征的极化SAR图像随机森林分类算法[J].遥感学报,2019,23(4):685-694. 被引量：21
5姜巍,张莉,戴翼,蒋竞,王刚.面向用户需求获取的在线评论有用性分析[J].计算机学报,2013,36(1):119-131. 被引量：56
6李超,向静,向军.在线商品评论可信性评价方法[J].计算机应用,2019,39(1):181-185. 被引量：2
7王祖辉,姜维.基于粗糙集的在线评论情感分析模型[J].计算机工程,2012,38(16):1-4. 被引量：3

二级参考文献34

1杨芙清.软件工程技术发展思索[J].软件学报,2005,16(1):1-7. 被引量：266
2姜维,王晓龙,关毅,徐志明.应用粗糙集理论提取特征的词性标注模型[J].高技术通讯,2006,16(10):996-1000. 被引量：3
3Pang Bo, Lee L, Vaithyanathan S. Thumbs Up: Sentiment Classi- fication Using Machine Learning Techniques[C]//Proc. of Association for Computational Linguistics Conference on Em- pirical Methods in Natural Language Processing. Stroudsburg, USA: [s. n.]. 2002.
4Pang Bo, Lee L. Seeing Stars: Exploiting Class Relationships for Sentiment Categorization with Respect to Rating Scales[C]//Proc. of the 43rd Annual Meeting on Association for Computational Linguistics. Ann Arbor, Michigan, USA: [s. n.], 2005.
5Jindal N, Liu Bing. Identifying Comparative Sentences in Text Doeuments[C]//Proe. of the 29th Annual International ACM SIGIR Conference on Research and Development in Information Retrieval. Seattle, USA: ACM Press, 2006.
6Tumey P D. Thumbs Up or Thumbs Down: Semantic Orientation Applied to Unsupervised Classification of Reviews[C]//Proc. of the 40th Annual Meeting on Association for Computational Linguistics. Philadelphia, Pennsylvania, USA: [s. n.], 2002.
7Gamon M, Aue A. Automatic Identification of Sentiment Vocabu- lary: Exploiting Low Association with Known Sentiment Terms[C]//Proc. of ACL Workshop on Feature Engineering for Machine Learning in Natural Language Processing. Ann Arbor, Michigan, USA: [s. n.], 2005.
8Zhao Yan, Wang Xiaolong, Liu Bingquan, et al. Applying Class Triggers in Chinese POS Tagging Based on Maximum Entropy Model[C]//Proc. of International Conference on Machine Learning and Cybernetics. [S. 1.]: IEEE Press, 2004.
9Wojciech Z. Variable Precision Rough Sets Model[J]. Journal of Computer and System Sciences, 1993, 46(1): 39-59.
10Gim6nez J, M~rquez L. SVMTooI: A General POS Tagger Generator Based on Support Vector Machines[C]//Proc. of the 4th International Conference on Language Resources and Evaluation. Lisbon, Portugal: [s. n.], 2004.

共引文献99

1丁美荣,冯伟森,黄荣翔,罗嘉俊.基于预训练模型和基础词典扩展的酒店评论情感分析[J].计算机系统应用,2022,31(11):296-308. 被引量：3
2李晓军,李少臣,刘星,姚俊萍.消费者在线评论质量影响因素及组态研究[J].火箭军工程大学学报,2020(1):77-82.
3单鸿波,周尚锦,于海燕,葛滨,孙志宏.概念设计早期阶段产品协同设计系统的开发[J].东华大学学报（自然科学版）,2013,39(4):535-538.
4聂卉,王佳佳.产品评论垃圾识别研究综述[J].现代图书情报技术,2014(2):63-71. 被引量：11
5蔡晓珍,徐健,吴思竹.面向情感分析的用户评论过滤模型研究[J].现代图书情报技术,2014(4):58-64. 被引量：12
6聂卉.基于内容分析的用户评论质量的评价与预测[J].图书情报工作,2014,58(13):83-89. 被引量：20
7黄婷婷,曾国荪,熊焕亮.基于商品特征关联度的购物客户评论可信排序方法[J].计算机应用,2014,34(8):2322-2327. 被引量：12
8余文喆,沙朝锋,何晓丰,张蓉.考虑观点多样性的评论选择问题[J].计算机研究与发展,2015,52(5):1050-1060. 被引量：3
9崔建苓,杨达,李娟.RERM:一种基于评论挖掘的需求获取方法[J].计算机应用与软件,2015,32(8):28-33. 被引量：8
10倪瑜泽,彭蓉,孙栋,赖涵.基于用户评论的潜在演化需求发现方法[J].武汉大学学报（理学版）,2015,61(4):347-355. 被引量：6

同被引文献32

1孙瑞安,张云华.结合AdaBERT的TextCNN垃圾弹幕识别和过滤算法[J].智能计算机与应用,2021,11(4):9-13. 被引量：3
2陈建龙.论信息效用及其实现过程[J].北京大学学报（哲学社会科学版）,1996,33(3):36-40. 被引量：21
3殷国鹏.消费者认为怎样的在线评论更有用?——社会性因素的影响效应[J].管理世界,2012,28(12):115-124. 被引量：184
4李贺,祝琳琳,闫敏,刘金承,洪闯.开放式创新社区用户信息有用性识别研究[J].数据分析与知识发现,2018,2(12):12-22. 被引量：8
5邹益民,张智雄.网络科技信息中的知识对象行为识别方法[J].情报理论与实践,2014,37(9):59-63. 被引量：2
6刘伟,徐鹏涛.O2O电商平台在线点评有用性影响因素的识别研究——以餐饮行业O2O模式为例[J].中国管理科学,2016,24(5):168-176. 被引量：51
7李中梅,张向先,郭顺利.移动商务环境下O2O用户在线评论有用性影响因素研究[J].情报科学,2017,35(2):130-137. 被引量：28
8喻昕,许正良.网络直播平台中弹幕用户信息参与行为研究——基于沉浸理论的视角[J].情报科学,2017,35(10):147-151. 被引量：80
9苗蕊,徐健.评分不一致性对在线评论有用性的影响——归因理论的视角[J].中国管理科学,2018,26(5):178-186. 被引量：43
10洪庆,王思尧,赵钦佩,李江峰,饶卫雄.基于弹幕情感分析和聚类算法的视频用户群体分类[J].计算机工程与科学,2018,40(6):1125-1139. 被引量：35

引证文献2

1张瑞,何禄鑫,黄炜.多特征融合下视频网站弹幕信息有用性检测研究[J].现代情报,2022,42(4):99-109. 被引量：3
2吴健健,李文畅,时宏伟.利用多维评分进行在线评论的有用性预测[J].计算机系统应用,2023,32(12):21-31.

二级引证文献3

1张芸蕾,穆昱彤,季星辰.基于B站学习区交互式体验的学习情况研究——以弹幕为例[J].新闻传播,2023(14):152-156.
2王晰巍,邱程程,李玥琪.突发公共事件下社交网络谣言辟谣效果评价及实证研究[J].情报理论与实践,2022,45(12):14-21. 被引量：3
3王松,骆莹,刘新民.基于文本语义与关联网络双链路融合的用户生成内容价值早期识别研究[J].数据分析与知识发现,2023,7(11):101-113.

1江嘉骏,刘玉珍,陈康.移动互联网是否带来行为偏误——来自网络借贷市场的新证据[J].经济研究,2020,55(6):39-55. 被引量：9
2刘睿,高旖笛.体验经济时代旅游特色产品的营销策略探析[J].科技经济市场,2020(8):155-156. 被引量：2
3胡万亭,贾真.基于加权词向量和卷积神经网络的新闻文本分类[J].计算机系统应用,2020,29(5):275-279. 被引量：7
4陈媛媛.基于设计心理学的产品外观设计和色彩应用探究[J].科技传播,2020,12(18):124-125. 被引量：5
5李杰骏,罗耀祖,王宇坤,罗庆佳,唐灏.深度学习中GD算法的学习过程研究[J].计算机产品与流通,2020(9):245-245.
6江芬芬,梅姝娥,仲伟俊.考虑产品创新程度的推荐奖励策略分析[J].Journal of Southeast University(English Edition),2020,36(3):357-363.
7田韶旭.游客在线评价的情感倾向分析在改善营销策略中的应用——以“青岛啤酒博物馆”为例[J].营销界（理论与实践）,2020(3):24-25.
8益明.好事成双:东风天龙KL成功挑战实况运营性能新极限,龙擎DA14 AMT上市[J].商用汽车,2020(7):21-23.

计算机科学

2020年第10期

浏览历史

内容加载中请稍等...

融合信息增益和梯度下降算法的在线评论有用程度预测模型被引量：2

参考文献7

二级参考文献34

共引文献99

同被引文献32

引证文献2

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

融合信息增益和梯度下降算法的在线评论有用程度预测模型 被引量：2

参考文献7

二级参考文献34

共引文献99

同被引文献32

引证文献2

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

融合信息增益和梯度下降算法的在线评论有用程度预测模型被引量：2