基于聚类与句子加权的欺骗性评论检测被引量：1

Deceptive Comment Detection Based on Clustering and Sentence Weighting

下载PDF

导出

摘要消费者在购物前往往会参考产品评论,欺骗性评论容易误导顾客使其作出错误决定。现有检测欺骗性垃圾评论的方法大多采用机器学习方法,难以学习评论的潜在语义。因此提出一个基于聚类与注意力机制的神经网络模型学习评论语义表示。该模型使用基于密度峰值的快速搜索聚类算法找出词向量空间语义群,通过KL-divergence计算权重,然后综合句子中单词与单词所属的语义群得到句子表示。实验结果表明,该模型准确率达82.2%,超过现有基准,在欺骗性垃圾评论识别中具有一定使用价值。 Consumers prefer to read product reviews before shopping.Deceptive comments can easily mislead customers to make wrong decisions.Existing methods for detecting fraudulent spam comments mostly use machine learning,but it is difficult to learn the underly ing semantics of comments.This paper proposes a neural network model based on clustering and attention mechanism to learn the se mantic representation of comments.Specifically,this paper first makes the fast search clustering algorithm based on density peaks to find the semantic group in the word vector space,and calculates the weight by KL-divergence.Then it synthesizes the words in the sen tence and the semantic group to which the word belongs to get the sentence representation.The experimental results show that the accu racy of the proposed model reaches 82.2%,which exceeds the current benchmark.Therefore,it has certain value in the identification of fraudulent spam comments.

作者张建鑫 ZHANG Jian-xin(College of Computer Science and Engineering,Shandong University of Science and Technology,Qingdao 266000,China)

机构地区山东科技大学计算机科学与工程学院

出处《软件导刊》 2019年第2期34-37,共4页 Software Guide

关键词欺骗性评论聚类句子加权神经网络 deceptive review detection clustering sentence weighting neural network

分类号 TP306 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献8

1林政,谭松波,程学旗.基于情感关键句抽取的情感分类研究[J].计算机研究与发展,2012,49(11):2376-2382. 被引量：27
2李素科,蒋严冰.基于情感特征聚类的半监督情感分类[J].计算机研究与发展,2013,50(12):2570-2577. 被引量：23
3任亚峰,姬东鸿,张红斌,尹兰.基于PU学习算法的虚假评论识别研究[J].计算机研究与发展,2015,52(3):639-648. 被引量：30
4杜伟夫,谭松波,云晓春,程学旗.一种新的情感词汇语义倾向计算方法[J].计算机研究与发展,2009,46(10):1713-1720. 被引量：21
5胡熠,陆汝占,李学宁,段建勇,陈玉泉.基于语言建模的文本情感分类研究[J].计算机研究与发展,2007,44(9):1469-1475. 被引量：23
6赵妍妍,秦兵,刘挺.文本情感分析[J].软件学报,2010,21(8):1834-1848. 被引量：546
7张珊,于留宝,胡长军.基于表情图片与情感词的中文微博情感分析[J].计算机科学,2012,39(S3):146-148. 被引量：55
8贾培灵,樊建聪,彭延军.一种基于簇边界的密度峰值点快速搜索聚类算法[J].南京大学学报（自然科学版）,2017,53(2):368-377. 被引量：6

二级参考文献122

1朱嫣岚,闵锦,周雅倩,黄萱菁,吴立德.基于HowNet的词汇语义倾向计算[J].中文信息学报,2006,20(1):14-20. 被引量：327
2徐琳宏,林鸿飞,杨志豪.基于语义理解的文本倾向性识别机制[J].中文信息学报,2007,21(1):96-100. 被引量：123
3高琰,谷士文,唐琎,蔡自兴.机器学习中谱聚类方法的研究[J].计算机科学,2007,34(2):201-203. 被引量：31
4刘群李素建.基于《知网》的词汇语义相似度的计算.中文计算语言学,2002,17(2):59-76.
5Tumey P. Thumbs up or thumbs down? semantic orientation applied to unsupervised classification of reviews [C] //Proc of the 40th Annual Meeting of the Association for Computational Linguistics. New,York: ACM, 2002: 417- 424.
6Pang B, Lee L, Shivakumar V. Thumbs up? sentiment classification using machine learning techniques [C]//Proc of the 2002 Conf on Empirical Methods in Natural Language Processing. Stroudsburg, PA, USA: ACL, 2002:79-86.
7Wiebe J M. Learning subjective adjectives from corpora [C] //Proc of the 17th National Conf on Artificial Intelligence. Menlo Park: AAAI Press, 2000:735-740.
8Hatzivassiloglou V, McKeown K R. Predicting the semantic orientation of adjectives [C]//Proc of the 35th Annual Meeting of the Association for Computational Linguistics and the 8th Conf of the European Chapter of the Association for Computational Linguistics. Stroudsburg. PA, USA: ACL, 1997:174-181.
9Turney P, Littman M. Measuring praise and criticism: inference of semantic orientation from association [J]. ACM Trans on Information Systems, 2003, 21(4): 315-346.
10Pang B, Lee L. A sentimental education: Sentiment analysis using subjectivity summarization based on minimum cuts [C] //Proc of the 42nd Annual Meeting on Association for Computational Linguistics. Srroudsburg, PA, USA: ACL. 2004:271-278.

共引文献698

1李芮涵,王立明,王昌燕.民俗文化类景区投射形象与感知形象对比分析——以喀什古城景区为例[J].特区经济,2023(9):156-160.
2王曰芬,吴鹏,丁晟春,陈芬.社会舆情分析研究与进展综述[J].情报学进展,2016(1):132-185. 被引量：1
3包乾辉,李佳利,石淑珍,戴引,刘雪.基于DSLML的鸡蛋消费在线评论情感分析[J].农业机械学报,2021,52(S01):496-503. 被引量：6
4王弘睿,刘畅,于东.面向人工智能伦理计算的中文道德词典构建方法研究[J].中文信息学报,2021,35(10):39-47. 被引量：3
5王昭雨,庄惟敏.情感语义视角:街区更新后评估方法应用研究[J].建筑学报,2020(S02):105-109. 被引量：20
6刘栋,张彩环.情境特征及其在情感分类模型中的应用[J].计算机应用研究,2020,37(1):144-147.
7徐晖,王中卿,李寿山,张民.结合情感信息的个性化对话生成[J].计算机科学,2022,49(S02):99-104. 被引量：3
8张良波,任际范,周晶晶,吴欣宇.电商直播中弹幕互动特征对销售效率的影响[J].管理科学,2023,36(4):17-29. 被引量：2
9安颖,葛格.基于平行语料库的英汉电商评价对比研究[J].汉字文化,2022(23):113-115.
10蔡馥谣.抖音短视频中辽宁城市形象的呈现与传播策略研究[J].都市文化研究,2024(1):230-242.

同被引文献3

1孙升芸,田萱,何军.基于评论行为的商品垃圾评论的识别研究[J].计算机工程与设计,2012,33(11):4314-4319. 被引量：9
2任亚峰,尹兰,姬东鸿.基于语言结构和情感极性的虚假评论识别[J].计算机科学与探索,2014,8(3):313-320. 被引量：27
3陈燕方,娄策群.在线商品虚假评论形成路径研究[J].现代情报,2015,35(1):49-53. 被引量：20

引证文献1

1王琢,汪浩,胡润龙,高珮.基于有监督学习的店铺类虚假评论检测[J].软件导刊,2020,19(4):71-74. 被引量：3

二级引证文献3

1李慧,王琢.一种基于无监督集成学习的虚假评论检测方法[J].沈阳理工大学学报,2021,40(6):31-35. 被引量：2
2陈晓,彭湃,李新,陈鹏.基于机器学习的商品虚假价格检测[J].信息技术与信息化,2022(2):214-217.
3袁紫烟,任勋益,黄家铭.一种改进图神经网络的虚假评论检测方法[J].软件导刊,2024,23(3):27-33.

1刘雨心,王莉,张昊.基于分层注意力机制的神经网络垃圾评论检测模型[J].计算机应用,2018,38(11):3063-3068. 被引量：3
2Annie,蔡金萍.如果一个酒庄可以代表一个国家[J].葡萄酒,2019,0(1):70-73.
3刘知远,宋长河,杨成.社交媒体平台谣言的早期自动检测[J].全球传媒学刊,2018,5(4):65-80. 被引量：8
4周畅.试析小红书的口碑营销[J].信息周刊,2018,0(14):0154-0154.
5李帷韬,陶海,吴四茜,王建平,徐晓冰.基于深度学习的青梅品级半监督智能认知方法[J].计算机应用与软件,2018,35(11):245-252. 被引量：1
6李倩,陈兴杰,彭乐乐,安小雪.无砟轨道扣件快速匹配定位方法研究[J].计算机测量与控制,2019,27(1):267-270. 被引量：2
7胡杨添秀,孟利民,蒋维,江培瑞,商宇洲.基于萤火虫算法的层间网络编码优化[J].高技术通讯,2018,28(11):915-922. 被引量：2
8项建弘,王宁,王恒.基于BSA的MIB-OMP毫米波大规模MIMO混合预编码[J].应用科技,2019,46(1):94-100. 被引量：1
9王一博,王晓蓉,王新迎,何远舵,王亚沙,赵俊峰.细分行业用电的CPI预测方法[J].计算机应用,2018,38(A02):119-123.
10范朝冬,刘颖南,章兢,易灵芝,肖乐意.弱连接多子群分子动理论优化算法[J].控制理论与应用,2019,36(1):108-119. 被引量：1

软件导刊

2019年第2期

浏览历史

内容加载中请稍等...

基于聚类与句子加权的欺骗性评论检测被引量：1

参考文献8

二级参考文献122

共引文献698

同被引文献3

引证文献1

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

基于聚类与句子加权的欺骗性评论检测 被引量：1

参考文献8

二级参考文献122

共引文献698

同被引文献3

引证文献1

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

基于聚类与句子加权的欺骗性评论检测被引量：1