期刊文献+
共找到15篇文章
< 1 >
每页显示 20 50 100
Effective Opinion Spam Detection: A Study on Review Metadata Versus Content 被引量:1
1
作者 Ajay Rastogi Monica Mehrotra Syed Shafat Ali 《Journal of Data and Information Science》 CSCD 2020年第2期76-110,共35页
Purpose:This paper aims to analyze the effectiveness of two major types of features—metadata-based(behavioral)and content-based(textual)—in opinion spam detection.Design/methodology/approach:Based on spam-detection ... Purpose:This paper aims to analyze the effectiveness of two major types of features—metadata-based(behavioral)and content-based(textual)—in opinion spam detection.Design/methodology/approach:Based on spam-detection perspectives,our approach works in three settings:review-centric(spam detection),reviewer-centric(spammer detection)and product-centric(spam-targeted product detection).Besides this,to negate any kind of classifier-bias,we employ four classifiers to get a better and unbiased reflection of the obtained results.In addition,we have proposed a new set of features which are compared against some well-known related works.The experiments performed on two real-world datasets show the effectiveness of different features in opinion spam detection.Findings:Our findings indicate that behavioral features are more efficient as well as effective than the textual to detect opinion spam across all three settings.In addition,models trained on hybrid features produce results quite similar to those trained on behavioral features than on the textual,further establishing the superiority of behavioral features as dominating indicators of opinion spam.The features used in this work provide improvement over existing features utilized in other related works.Furthermore,the computation time analysis for feature extraction phase shows the better cost efficiency of behavioral features over the textual.Research limitations:The analyses conducted in this paper are solely limited to two wellknown datasets,viz.,Yelp Zip and Yelp NYC of Yelp.com.Practical implications:The results obtained in this paper can be used to improve the detection of opinion spam,wherein the researchers may work on improving and developing feature engineering and selection techniques focused more on metadata information.Originality/value:To the best of our knowledge,this study is the first of its kind which considers three perspectives(review,reviewer and product-centric)and four classifiers to analyze the effectiveness of opinion spam detection using two major types of features.This study also introduces some novel features,which help to improve the performance of opinion spam detection methods. 展开更多
关键词 Opinion spam Behavioral features Textual features review spammers Spam-targeted products
下载PDF
数据挖掘方法与技术在虚假评论者检测中的应用研究进展
2
作者 徐曼 《计算机应用文摘》 2023年第24期77-79,83,共4页
虚假评论的存在严重扰乱了公平公正的市场竞争秩序,对虚假评论的识别和检测是函待研究的问题。虚假评论者是虚假评论行为的构成主体之一,多个虚假评论者通过相互协同构成了虚假评论群组,但现有综述缺乏对虚假评论者相关研究的专门述评... 虚假评论的存在严重扰乱了公平公正的市场竞争秩序,对虚假评论的识别和检测是函待研究的问题。虚假评论者是虚假评论行为的构成主体之一,多个虚假评论者通过相互协同构成了虚假评论群组,但现有综述缺乏对虚假评论者相关研究的专门述评。文章对相关中文文献进行了回顾和分析,总结了近年来国内数据挖掘方法与技术在虚假评论者和虚假评论群组检测中的应用,认为虚假评论检测领域未来可从正面和负面虚假评论的区别检测、虚假评论者数据集的建立、数据挖掘算法和框架的建立等方面开展深入研究。 展开更多
关键词 虚假评论 虚假评论者 虚假评论群组 数据挖掘 识别与检测
下载PDF
基于用户行为的产品垃圾评论者检测研究 被引量:16
3
作者 邱云飞 王建坤 +1 位作者 邵良杉 刘大有 《计算机工程》 CAS CSCD 2012年第11期254-257,261,共5页
为找到垃圾评论的制造者,提出一种基于用户行为的产品垃圾评论者检测方法。从垃圾评论者的行为目的出发,将其发表垃圾评论的5种行为模式作为垃圾评论者的检测指标,从卓越亚马逊网站获取1 470个评论用户,按单指标选取、5个指标集成选取... 为找到垃圾评论的制造者,提出一种基于用户行为的产品垃圾评论者检测方法。从垃圾评论者的行为目的出发,将其发表垃圾评论的5种行为模式作为垃圾评论者的检测指标,从卓越亚马逊网站获取1 470个评论用户,按单指标选取、5个指标集成选取的方法确定最可能和最不可能成为垃圾评论者的评论用户各25个,并对这50个评论者进行人工标记,根据标记结果设计有监督的线性回归模型。实验结果表明,该模型从1 470个评论者中发现88个用户为垃圾评论者,对垃圾评论者的检测效果优于基于用户有用性投票的基准方法。 展开更多
关键词 用户行为 线性回归模型 垃圾评论者检测 短文本 产品评论 垃圾评论
下载PDF
基于评论行为的商品垃圾评论的识别研究 被引量:9
4
作者 孙升芸 田萱 何军 《计算机工程与设计》 CSCD 北大核心 2012年第11期4314-4319,共6页
为了识别商品垃圾评论,基于垃评论员发表的多为垃圾评论这一基本思想,提出一种基于评论员评论行为来判定其是否为垃圾评论员的方法。分析定义了垃圾评论员常见的三类评论行为,分别是针对同类商品发表垃圾评论,针对同品牌商品发表垃圾评... 为了识别商品垃圾评论,基于垃评论员发表的多为垃圾评论这一基本思想,提出一种基于评论员评论行为来判定其是否为垃圾评论员的方法。分析定义了垃圾评论员常见的三类评论行为,分别是针对同类商品发表垃圾评论,针对同品牌商品发表垃圾评论和针对同一卖家商品发表垃圾评论;在对这三类评论行为建模的同时提出一种依据重复性过高或过低打分的评论数量来计算评论员垃圾指数(spam score)的方法。实验数据为在当当网摄影摄像商品区发表过评论的评论员的所有评论信息。实验结果通过人工评判和计算NDCG(normalize discounted cumulative gain)值的方法来检验,实验结果准确有效。 展开更多
关键词 商品评论 垃圾评论 垃圾评论识别 垃圾评论员 评论行为
下载PDF
基于带权评论图的水军群组检测及特征分析 被引量:7
5
作者 张琪 纪淑娟 +1 位作者 傅强 张纯金 《计算机应用》 CSCD 北大核心 2019年第6期1595-1600,共6页
针对在电子商务平台上检测编写虚假评论的水军群组的问题,提出了基于带权评论图的水军群组检测算法(WGSA)。首先,利用共评论特征构建带权评论图,权重由一系列群组造假指标计算得到;然后,为边权重设置阈值筛选可疑子图;最后,从图的社区... 针对在电子商务平台上检测编写虚假评论的水军群组的问题,提出了基于带权评论图的水军群组检测算法(WGSA)。首先,利用共评论特征构建带权评论图,权重由一系列群组造假指标计算得到;然后,为边权重设置阈值筛选可疑子图;最后,从图的社区结构出发,利用社区发现算法生成最终的水军群组。在Yelp大型数据集上的实验结果表明,与K均值聚类算法(KMeans)、基于密度的噪声应用空间聚类算法(DBscan)以及层次聚类算法相比WGSA算法的准确度更高,同时对检测到水军群组的特征与差异作了分析,发现水军群组的活跃度不同,危害也不同。其中,高活跃度群组危害最大,应重点关注。 展开更多
关键词 电子商务 水军群组 带权评论图 社区发现 聚类
下载PDF
基于SVM的新浪微博营销类水帖识别研究 被引量:5
6
作者 叶施仁 孙宁 《湘潭大学自然科学学报》 CAS 北大核心 2015年第4期70-74,共5页
研究一种发现水帖的分类算法.该方法利用SimHash方法将发帖重复当成类似网页去重的问题处理,发帖内容的重复度和其他特征,如发帖的密集型、帐号名称的相似性,所使用的客户端等特征将用于水帖与正常发帖的分类.该文利用新浪微博API下载... 研究一种发现水帖的分类算法.该方法利用SimHash方法将发帖重复当成类似网页去重的问题处理,发帖内容的重复度和其他特征,如发帖的密集型、帐号名称的相似性,所使用的客户端等特征将用于水帖与正常发帖的分类.该文利用新浪微博API下载多个汽车营销账号下的交互数据作为实验数据,并使用SVM作为分类器.实验结果表明,该方法能够较好地发现那些伪装性非常好的水军所发布的水帖. 展开更多
关键词 评论行为 评论特征 支持向量机 水帖识别
下载PDF
考虑结构与行为特征的水军群组检测算法 被引量:2
7
作者 张琪 纪淑娟 +2 位作者 张文鹏 曹宁 李宁 《计算机应用研究》 CSCD 北大核心 2022年第5期1374-1379,共6页
在线评论对用户的购买决策有重要的影响作用,部分卖方为提高自身信誉或贬低竞争对手的产品,通过雇佣大量水军有组织、有策略地撰写虚假评论来误导潜在消费者。为了检测这种有组织的水军群组,提出了一个综合考虑网络结构与评论者的行为... 在线评论对用户的购买决策有重要的影响作用,部分卖方为提高自身信誉或贬低竞争对手的产品,通过雇佣大量水军有组织、有策略地撰写虚假评论来误导潜在消费者。为了检测这种有组织的水军群组,提出了一个综合考虑网络结构与评论者的行为特征水军群组检测算法。首先,根据评分和评论时间相关性得到评论者之间的紧密度,构建评论者关系图;其次,基于构建的评论者关系图,利用标签传播方法检测社区,得到候选群组集合;最后,复原候选群组对应的二部图,以对比可疑度为评估指标,在每个二部图上找到最终的造假者。基于真实数据集的实验结果证明了该算法的有效性。 展开更多
关键词 水军群组 评论者关系图 标签传播 二部图
下载PDF
基于评论者关系的垃圾评论者识别研究 被引量:3
8
作者 徐小婷 魏晶晶 +2 位作者 廖祥文 刘月 陈水利 《集美大学学报(自然科学版)》 CAS 2016年第2期146-152,共7页
垃圾评论者在很大程度上误导潜在消费者和观点挖掘系统。目前检测垃圾评论者的方法主要是基于评论、评论者和商店之间的关系,忽略了评论者之间的关系。针对上述问题,提出了基于评论者多边图的产品垃圾评论者检测方法。首先,以每个评论... 垃圾评论者在很大程度上误导潜在消费者和观点挖掘系统。目前检测垃圾评论者的方法主要是基于评论、评论者和商店之间的关系,忽略了评论者之间的关系。针对上述问题,提出了基于评论者多边图的产品垃圾评论者检测方法。首先,以每个评论者为节点,评论者之间的关系为边,构建评论者之间的关系图模型;其次,根据多边图模型,提出了一种基于PageRank的评论者互评估可信度模型来检测垃圾评论者;最后,采用卓越亚马逊和Resellerrating.com平台上的数据进行验证。结果表明:该模型能够更有效地识别出垃圾评论者,在一定程度上解决了难识别仅发表一条评论的评论者的可信度问题。 展开更多
关键词 互评估 可信度 多边图模型 评论关系 垃圾评论者
下载PDF
虚假评论检测研究综述 被引量:33
9
作者 李璐旸 秦兵 刘挺 《计算机学报》 EI CSCD 北大核心 2018年第4期946-968,共23页
随着电子商务网站及点评网站的发展,评论信息日益影响着人们的生活.越来越多的网络用户通过发布评论分享消费体验、评价产品的质量,并在做出消费决策时参考其他用户的评论.人们对评论信息的依赖催化了虚假评论的不断涌现.虚假评论,指一... 随着电子商务网站及点评网站的发展,评论信息日益影响着人们的生活.越来越多的网络用户通过发布评论分享消费体验、评价产品的质量,并在做出消费决策时参考其他用户的评论.人们对评论信息的依赖催化了虚假评论的不断涌现.虚假评论,指一些用户出于商业或其他不良动机,在评论中编造不实消费经历、对评价对象的质量等进行鼓吹或诽谤.虚假评论容易对用户的观点或决策产生误导,干扰人们的日常生活.由于人类识别虚假评论的准确率较低,综合运用自然语言处理技术有效检测虚假评论、帮助用户获取真实评论信息,在学术研究及产业应用层面均具有深远意义.对虚假评论检测任务,研究者们主要从虚假评论文本、虚假评论发布者及虚假评论群组三个角度开展研究.该文将依次对三类研究进行归纳分析,具体分别从特征设计、模型方法、数据集、评级指标等方面进行了对比总结.最后对未来研究方向进行了探讨和展望. 展开更多
关键词 虚假评论检测 虚假评论者检测 合谋欺诈检测 观点挖掘 内容挖掘
下载PDF
基于D-S证据理论的电子商务虚假评论者检测 被引量:9
10
作者 张文宇 岳昆 张彬彬 《小型微型计算机系统》 CSCD 北大核心 2018年第11期2428-2435,共8页
在线商品的销售与商品评价信息密切相关,拥有较多好评信息的商品更受消费者的青睐.于是越来越多的电商商家开始雇佣甚至充当虚假评论者对商品进行不切实际的评论,广大消费者成为了最终的受害者.本文提出一种基于评论者行为的虚假评论者... 在线商品的销售与商品评价信息密切相关,拥有较多好评信息的商品更受消费者的青睐.于是越来越多的电商商家开始雇佣甚至充当虚假评论者对商品进行不切实际的评论,广大消费者成为了最终的受害者.本文提出一种基于评论者行为的虚假评论者检测方法,该方法从虚假评论者作弊动机出发,综合考虑评论者评价行为、评论者交流行为以及评论者对商品的关注行为,将评论者行为视为证据并构建D-S证据理论模型.首先,本文利用多种维度对评论者的三种行为特征进行量化并构建三个独立的SVM模型,然后将SVM无阈值输出通过sigmoid函数实现后验概率输出,最后将其用于证据融合并根据识别框架下的证据支持度对评论者身份进行检测.实验结果表明,本文提出的方法准确有效. 展开更多
关键词 虚假评论者 用户行为 证据理论 支持向量机 SIGMOID函数
下载PDF
电子商务垃圾评论者识别研究 被引量:4
11
作者 富越 董保华 《科学决策》 CSSCI 2015年第9期79-94,共16页
论文以100个刷客(垃圾评论者)和100个正常评论者的历史评论数据作为研究对象,结合淘宝刷客的特点提取了14个用于刷客识别的特征,采用SVM算法和KNN算法构建分类模型并使用两种模型对淘宝网上的刷客进行识别。研究发现:两种分类模型对淘... 论文以100个刷客(垃圾评论者)和100个正常评论者的历史评论数据作为研究对象,结合淘宝刷客的特点提取了14个用于刷客识别的特征,采用SVM算法和KNN算法构建分类模型并使用两种模型对淘宝网上的刷客进行识别。研究发现:两种分类模型对淘宝刷客识别的效果都很理想,其中SVM明显优于KNN,其分类模型对刷客识别的精确率达88%,召回率达100%。 展开更多
关键词 刷单 商品评论 SVM KNN 刷客识别
下载PDF
在线产品虚假评论检测技术研究 被引量:1
12
作者 吕海 王琢 《沈阳理工大学学报》 CAS 2018年第6期81-85,共5页
网上购物平台的商家通过虚假评论对自家商品进行美化,并对竞争商品进行抹黑。目前虚假评论人群组的欺诈特征比单个虚假评论人明显,因此,大量的虚假评论检测方法以对虚假评论人群组检测为主。本文提出一种新的在线产品虚假评论检测方法,... 网上购物平台的商家通过虚假评论对自家商品进行美化,并对竞争商品进行抹黑。目前虚假评论人群组的欺诈特征比单个虚假评论人明显,因此,大量的虚假评论检测方法以对虚假评论人群组检测为主。本文提出一种新的在线产品虚假评论检测方法,该方法采用时间窗口提取时间序列上的评论数据,使时间窗口内的评论数据生成二部图结构;将二部图结构转化为评论人图结构,然后用SCAN算法对评论人图进行聚类,并计算聚类后评论人群组特征;最后使用支持向量机对已标注的评论人群组特征数据训练分类器,并对未标注的进行检测。实验结果表明,该方法可以通过时间窗口对正在发生的虚假评论欺诈活动进行有效检测。 展开更多
关键词 虚假评论 虚假评论人群组 时间窗口 SCAN 支持向量机
下载PDF
虚假评论检测技术综述 被引量:3
13
作者 尤苡名 《计算机系统应用》 2019年第3期1-9,共9页
随着互联网的发展,用户倾向于在购物、旅游、用餐之前参考线上评论.之后,他们也会发表评论来表达自身意见.线上评论越来越具有价值.评论对用户决策的重要导向作用催生了虚假评论.虚假评论,指用户由于利益、个人偏见等因素发布的不符合... 随着互联网的发展,用户倾向于在购物、旅游、用餐之前参考线上评论.之后,他们也会发表评论来表达自身意见.线上评论越来越具有价值.评论对用户决策的重要导向作用催生了虚假评论.虚假评论,指用户由于利益、个人偏见等因素发布的不符合产品真实特性的评论.这些虚假评论语言上模仿真实评论,消费者很难识别出来.国内外学者综合运用自然语言处理技术来研究虚假评论检测问题.从特征工程的角度分析,虚假评论检测方法可以分为三类:基于语言特征和行为特征的方法、基于图结构的方法、基于表示学习的方法.主要描述了检测的一般流程,归纳了三类研究方法常用的特征,比较了方法的优缺点,并且介绍了研究常用的数据集.最后探讨了未来研究方向. 展开更多
关键词 虚假评论 虚假评论检测技术 虚假评论者检测 意见挖掘 自然语言处理
下载PDF
基于特征表现的虚假评论人预测研究 被引量:9
14
作者 聂卉 吴毅骏 《图书情报工作》 CSSCI 北大核心 2015年第10期102-109,共8页
[目的/意义]重点探讨基于特征表现的虚假评论人的预测,目的在于揭示真实网络环境中"网络水军"的特点和行为规律,构建一个简洁清晰、可解释的评论人身份预测模型,为深层次的评论挖掘研究奠定基础。[方法/过程]结合实证分析和... [目的/意义]重点探讨基于特征表现的虚假评论人的预测,目的在于揭示真实网络环境中"网络水军"的特点和行为规律,构建一个简洁清晰、可解释的评论人身份预测模型,为深层次的评论挖掘研究奠定基础。[方法/过程]结合实证分析和机器学习技术,对目标网站"大众点评网"的内部评价机制进行探索,利用因子分析提炼评论人属性及行为表现特征,并在此基础上构建基于Logistic回归的预测模型。[结果/结论]对于目标网站,模型对虚假评论人的分类预测精度达到73.8%,AUC指标达到80.9%。而评论人的贡献度、活跃度以及文字素养被验证与其身份有统计意义上的显著关系,但评论人的层级、情绪以及评价偏差则对其身份预测的影响不显著。实验结论和经验分析基本保持一致,模型能够被合理解释。 展开更多
关键词 虚假评论人 虚假评论 评论人特征
原文传递
基于评论关系图的垃圾评论者检测研究 被引量:3
15
作者 林秀娇 魏晶晶 +1 位作者 刘月 廖祥文 《福州大学学报(自然科学版)》 CAS 北大核心 2015年第2期170-175,共6页
提出一种基于评论关系图的产品垃圾评论者检测方法.该方法考虑了评论者、评论、商店以及回复者之间的关系,构造出四者的评论关系图,根据评论真实度获得评论者的可信度,从而检测出产品垃圾评论者.实验结果表明,与未考虑可信回复者特征的... 提出一种基于评论关系图的产品垃圾评论者检测方法.该方法考虑了评论者、评论、商店以及回复者之间的关系,构造出四者的评论关系图,根据评论真实度获得评论者的可信度,从而检测出产品垃圾评论者.实验结果表明,与未考虑可信回复者特征的识别方法相比,本文方法的准确率提升了4%. 展开更多
关键词 垃圾评论者 评论关系图 可信回复者
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部