期刊文献+
共找到15篇文章
< 1 >
每页显示 20 50 100
AN EFFICIENT APPROACH TO COMMENT SPAM IDENTIFICATION 被引量:1
1
作者 Yang Yuhang Zhao Tiejun Zheng Dequan Yu Hao 《Journal of Electronics(China)》 2009年第5期644-650,共7页
This paper proposes a novel approach to comment spam identification based on content analysis. Three main features including the number of links, content repetitiveness, and text similarity are used for comment spam i... This paper proposes a novel approach to comment spam identification based on content analysis. Three main features including the number of links, content repetitiveness, and text similarity are used for comment spam identification. In practice, content repetitiveness is determined by the length and frequency of the longest common substring. Furthermore, text similarity is calculated using vector space model. The precisions of preliminary experiments on comment spam identification conducted on Chinese and English are as high as 93% and 82% respectively. The results show the validity and language independency of this approach. Compared with conventional spam filtering approaches, our method requires no training, no rule sets and no link relationships. The proposed approach can also deal with new comments as well as existing comments. 展开更多
关键词 comment spam Automatic identification Content analysis BLOG
下载PDF
基于Co-Training的微博垃圾评论识别方法 被引量:3
2
作者 李志欣 兰丹媚 +1 位作者 张灿龙 唐素勤 《计算机工程》 CAS CSCD 北大核心 2018年第7期212-218,共7页
微博上大量的垃圾评论对个人、社会,甚至是对国家都会造成不良影响。为对微博中的垃圾评论进行识别,提出基于协同训练的微博垃圾评论识别方法。定义一种基于规则的识别方法过滤出显式垃圾评论,剩余的评论归为相关评论,构建AdaBoost分类... 微博上大量的垃圾评论对个人、社会,甚至是对国家都会造成不良影响。为对微博中的垃圾评论进行识别,提出基于协同训练的微博垃圾评论识别方法。定义一种基于规则的识别方法过滤出显式垃圾评论,剩余的评论归为相关评论,构建AdaBoost分类器和支持向量机分类器,通过Co-Training算法进行协同训练,判断其是否为垃圾评论,以提高分类精度,节省样本标注工作。实验结果表明,与基于相似度计算的垃圾评论识别方法、基于评论多特征的垃圾评论识别方法相比,该方法具有较好的识别效果。 展开更多
关键词 微博垃圾评论 协同训练 同义词词林 支持向量机 相似度计算
下载PDF
由Logistic回归识别Web社区的垃圾评论 被引量:11
3
作者 何海江 凌云 《计算机工程与应用》 CSCD 北大核心 2009年第23期140-143,共4页
针对Web社区垃圾信息泛滥的问题,采用基于Logistic回归(LR)的分类器区分合法评论和垃圾评论,并和支持向量机(SVM)的性能对比。提出了相关度向量空间模型cVSM作为评论的文档表示模型,讨论了信息增益IG、互信息MI、χ2统计CHI、文档频率D... 针对Web社区垃圾信息泛滥的问题,采用基于Logistic回归(LR)的分类器区分合法评论和垃圾评论,并和支持向量机(SVM)的性能对比。提出了相关度向量空间模型cVSM作为评论的文档表示模型,讨论了信息增益IG、互信息MI、χ2统计CHI、文档频率DF等不同特征抽取方法对模型的影响。实验结果表明,LR的训练时间不到SVM的1/10;DF和IG比MI和CHI表现更好;与传统的向量空间模型相比,使用cVSM显著提高垃圾评论识别能力。 展开更多
关键词 LOGISTIC回归 向量空间模型 博客 垃圾评论 相关度
下载PDF
一种适应短文本的相关测度及其应用 被引量:7
4
作者 何海江 《计算机工程》 CAS CSCD 北大核心 2009年第6期88-90,96,共4页
针对博客社区和BBS论坛充斥Web垃圾信息的问题,提出相关度向量空间模型cVSM,并以此作为评论的特征,采用支持向量机分类算法自动识别垃圾评论。cVSM包括一种适合短文本的相关测度,用于衡量评论和文章的语义相关程度。在中文博客测试集和... 针对博客社区和BBS论坛充斥Web垃圾信息的问题,提出相关度向量空间模型cVSM,并以此作为评论的特征,采用支持向量机分类算法自动识别垃圾评论。cVSM包括一种适合短文本的相关测度,用于衡量评论和文章的语义相关程度。在中文博客测试集和中文BBS测试集上的实验结果表明,相比纯粹使用评论文本特征的方法,应用该模型时F1至少提高6%。 展开更多
关键词 博客 垃圾评论 支持向量机 文本挖掘 相关测度
下载PDF
产品垃圾评论识别研究综述 被引量:1
5
作者 万岩 王雅璐 《北京邮电大学学报(社会科学版)》 2019年第3期71-79,112,共10页
着重梳理当前产品垃圾评论识别的国内外研究,总结研究特点与不足,发掘发展趋势。在中国知网、Web of Science上以'虚假评论''review spam'等为关键词检索并筛选得到54篇国内外相关文献,采用文献分析法对其进行分类分析... 着重梳理当前产品垃圾评论识别的国内外研究,总结研究特点与不足,发掘发展趋势。在中国知网、Web of Science上以'虚假评论''review spam'等为关键词检索并筛选得到54篇国内外相关文献,采用文献分析法对其进行分类分析,重点阐述研究在识别特征和识别方法方面的优化创新,以及针对垃圾评论、垃圾评论发布者、发布群体等不同识别对象的方法差异。研究发现,当前垃圾评论识别的相关成果可以分为基于评论内容的方法和基于评论结构、评论者、被评论产品的方法,在未来的垃圾评论识别中,应根据数据集的特点,提取有效识别特征,选择优化识别方法。 展开更多
关键词 在线评论 垃圾评论识别 文本挖掘 综述
下载PDF
微博垃圾评论检测与预处理技术 被引量:2
6
作者 胡新海 《湖南工程学院学报(自然科学版)》 2014年第3期49-52,共4页
针对发表在微博上评论信息的特点,尤其是那些广大网民用户不愿看到的垃圾评论信息进行了深入研究.归纳了网络上垃圾评论的存在形式和类型,将垃圾评论分为社会网络垃圾评论和普通垃圾评论.为了有效地检测与过滤微博中评论垃圾,提出了一... 针对发表在微博上评论信息的特点,尤其是那些广大网民用户不愿看到的垃圾评论信息进行了深入研究.归纳了网络上垃圾评论的存在形式和类型,将垃圾评论分为社会网络垃圾评论和普通垃圾评论.为了有效地检测与过滤微博中评论垃圾,提出了一种微博垃圾评论数据预处理的过程和方法,将预处理后的评论信息作为分类和检测的基础. 展开更多
关键词 微博 垃圾评论 预处理
下载PDF
基于双卷积神经网络的虚假评论识别 被引量:2
7
作者 杨超 李天卓 +1 位作者 谈森鹏 杨新凯 《计算机与数字工程》 2020年第8期1954-1957,共4页
传统的虚假评论识别方法大多采用机器学习算法,并把虚假评论识别当作一个二分类的任务进行处理,对数据集中的文本数据提取一些关键的特征,并使用机器学习的算法对提取的特征进行训练,从而达到分类的目的。在研究虚假评论特点的基础上,... 传统的虚假评论识别方法大多采用机器学习算法,并把虚假评论识别当作一个二分类的任务进行处理,对数据集中的文本数据提取一些关键的特征,并使用机器学习的算法对提取的特征进行训练,从而达到分类的目的。在研究虚假评论特点的基础上,使用卷积神经网络分别对评论文本数据以及评论者行为数据进行处理,融合了评论文本信息和评论者行为信息,提出了基于双卷积神经网络的虚假评论识别方法,经实验验证该方法对虚假评论的识别有较高的准确率。 展开更多
关键词 虚假评论识别 卷积神经网络 评论内容 评论者行为
下载PDF
基于AdaBoost的微博垃圾评论识别方法 被引量:6
8
作者 黄铃 李学明 《计算机应用》 CSCD 北大核心 2013年第12期3563-3566,共4页
针对微博上存在的大量垃圾评论,提出一种基于AdaBoost的微博垃圾评论识别方法。该方法首先提取表示微博评论的特征值向量,由8个特征值组成,然后通过AdaBoost算法在这些特征上训练出若干个比随机预测好的弱分类器,最后将得到的弱分类器... 针对微博上存在的大量垃圾评论,提出一种基于AdaBoost的微博垃圾评论识别方法。该方法首先提取表示微博评论的特征值向量,由8个特征值组成,然后通过AdaBoost算法在这些特征上训练出若干个比随机预测好的弱分类器,最后将得到的弱分类器加权集合成高精度的强分类器。从实际的热门新浪微博中提取评论数据集进行实验,结果表明所选取的8个特征是有效的,该方法对于微博垃圾评论的识别拥有较高的识别率。 展开更多
关键词 微博 垃圾评论识别 特征值向量 ADABOOST算法 弱分类器
下载PDF
一种应用于博客的垃圾评论识别方法 被引量:7
9
作者 邓冰娜 王煜 刘宇 《郑州大学学报(理学版)》 CAS 北大核心 2011年第1期65-69,74,共6页
针对博客垃圾评论泛滥的问题,提出了一种识别博客垃圾评论的新方法.利用网络常用语对短小评论先进行评论的识别,然后利用改进的相似度公式对评论进行了K轮评论的识别,在每轮识别之后,对主题词进行权重的调整和主题词扩展;待所有评论识... 针对博客垃圾评论泛滥的问题,提出了一种识别博客垃圾评论的新方法.利用网络常用语对短小评论先进行评论的识别,然后利用改进的相似度公式对评论进行了K轮评论的识别,在每轮识别之后,对主题词进行权重的调整和主题词扩展;待所有评论识别完毕,再利用网络常用语和主题词对识别出的垃圾评论进行第二次过滤,过滤出垃圾评论中的合法评论.实验结果表明,利用该方法进行评论识别在一定程度上提高了识别垃圾评论的准确率和召回率. 展开更多
关键词 博客垃圾评论 相似度 语义信息
下载PDF
基于协同训练算法的微博垃圾评论识别
10
作者 曹春萍 杨青林 《智能计算机与应用》 2020年第10期105-107,111,共4页
微博上存在大量垃圾评论,这些垃圾评论会带来不良影响,如何识别垃圾评论就成为人们关注的热门。本文针对监督学习框架下大规模标注数据集难以获得和垃圾评论识别不精准的问题,提出基于半监督协同训练算法的微博垃圾评论识别方法。该方... 微博上存在大量垃圾评论,这些垃圾评论会带来不良影响,如何识别垃圾评论就成为人们关注的热门。本文针对监督学习框架下大规模标注数据集难以获得和垃圾评论识别不精准的问题,提出基于半监督协同训练算法的微博垃圾评论识别方法。该方法从评论文本和评论用户两个视图构建指标体系,每一个视图用7种分类方法挑选出基分类器进行协同训练,以完成对微博垃圾评论的识别。实验结果表明,协同训练算法有更好的识别性能。 展开更多
关键词 微博垃圾评论 半监督 协同训练 分类器
下载PDF
网络课程资源的评论系统构建研究
11
作者 刘燕美 《江苏科技信息》 2016年第33期49-50,共2页
随着计算机用户可以在网络平台下随意发表自己对事物的看法,在线学习平台的评论板块中不断涌现垃圾评论。垃圾评论信息阻碍了学习用户正确的选择课程资源。为了解决垃圾评论的泛滥,文章在认真研究网络课程资源的各项属性特征及评论语料... 随着计算机用户可以在网络平台下随意发表自己对事物的看法,在线学习平台的评论板块中不断涌现垃圾评论。垃圾评论信息阻碍了学习用户正确的选择课程资源。为了解决垃圾评论的泛滥,文章在认真研究网络课程资源的各项属性特征及评论语料库的基础上,构建了针对性强、固定的评论系统细则。这为系统的实现提供了数据来源,提高了评论的准确度,为学习用户推荐高质量的课程资源打下了坚实的理论基础。 展开更多
关键词 网络课程资源 垃圾评论 评论细则 评论系统
下载PDF
基于图书特征及词典的豆瓣图书垃圾评论识别 被引量:1
12
作者 刘高军 印佳明 《计算机技术与发展》 2019年第11期107-112,共6页
随着互联网的普及和便利,现如今国内外点评网站和各类商务网站高速发展,各类评论信息正在不断影响着人们的生活。豆瓣网就是很知名的网络社区,越来越多互联网用户会在豆瓣网上发表对电影、图书和音乐等的评论,同时越来越多的人们会在看... 随着互联网的普及和便利,现如今国内外点评网站和各类商务网站高速发展,各类评论信息正在不断影响着人们的生活。豆瓣网就是很知名的网络社区,越来越多互联网用户会在豆瓣网上发表对电影、图书和音乐等的评论,同时越来越多的人们会在看电影前、看书前或者是听音乐前看看豆瓣上的评分和评论去决定是否去看或听。所以此时垃圾评论的识别就至关重要,因为垃圾评论会影响人们对这个事物真实的看法。文中引入了语义分析、图书特征词典和垃圾评论词典。语义分析有利于检测垃圾评论附加功能,同时会使用权重比例过滤模型检测垃圾评论。实验结果表明,文中方法可以达到85.4%的准确率,能有效准确地识别垃圾评论。 展开更多
关键词 互联网 豆瓣 图书评论 语义分析 垃圾评论检测
下载PDF
网站留言的安全性对策
13
作者 黄叶泉 《现代计算机》 2012年第2期39-40,43,共3页
近年来垃圾广告盛行,使得留言板被大量的垃圾广告淹没而没有办法正常使用,并且耗费管理员大量的维护时间。正常的留言应该保证其留言的畅通,不应被垃圾广告留言而失去它应用的作用。实践验证,提出的垃圾留言的若干防范措施是可行有效的... 近年来垃圾广告盛行,使得留言板被大量的垃圾广告淹没而没有办法正常使用,并且耗费管理员大量的维护时间。正常的留言应该保证其留言的畅通,不应被垃圾广告留言而失去它应用的作用。实践验证,提出的垃圾留言的若干防范措施是可行有效的,然而我们与垃圾留言者的斗争将是一个永久的话题。 展开更多
关键词 垃圾留言 垃圾广告 黑名单
下载PDF
在线评论回报的动态声誉机制研究 被引量:5
14
作者 魏瑾瑞 王金伟 《中国管理科学》 CSSCI CSCD 北大核心 2022年第1期252-262,共11页
当前学界研究主要集中于网络评论的声誉机制或虚假评论的识别策略,好评返现可以看作是声誉的交易(消费者给予好评,商家报以返现),而对此类带有一定贿赂性质的、诱导性的评论的声誉机制研究不多。本文以某网络购物平台2016和2017年两次... 当前学界研究主要集中于网络评论的声誉机制或虚假评论的识别策略,好评返现可以看作是声誉的交易(消费者给予好评,商家报以返现),而对此类带有一定贿赂性质的、诱导性的评论的声誉机制研究不多。本文以某网络购物平台2016和2017年两次追踪调查数据为样本,实证研究了好评返现是如何作用于最终声誉评价的。实证结果发现,好评返现对店铺声誉累积的实际影响并不是完全正向的,而是以店铺初始声誉等级为阈值,对于信誉等级较高的店铺(品牌商家)不敏感,对于信誉等级较低的店铺(新进卖家)比较敏感;商家是否参与好评返现并非内生于店铺的初始信誉评价,而更多的是提升信誉评分或对冲部分负面评论;消费者是否参与好评返现与其行为意愿和态度不存在显著关联,匿名环境往往使消费者更易做出内心并不认同却能获益的行为。 展开更多
关键词 好评返现 虚假评价 声誉机制
原文传递
一种决策树算法对微博垃圾评论的检测 被引量:1
15
作者 胡新海 《内江师范学院学报》 2015年第6期24-27,共4页
微博评论信息的具有发表随意、传播迅速,影响广泛等特点,在给用户带来便捷的同时也吸引大量垃圾制造者的目光,微博也成为垃圾评论和不良信息发布的平台,因此,微博评论必须进行有效的检测与过滤.选取J48决策树文本分类的方法对微博垃圾... 微博评论信息的具有发表随意、传播迅速,影响广泛等特点,在给用户带来便捷的同时也吸引大量垃圾制造者的目光,微博也成为垃圾评论和不良信息发布的平台,因此,微博评论必须进行有效的检测与过滤.选取J48决策树文本分类的方法对微博垃圾评论在常用词表的基础上,选取微博上关注度较高的评论信息作为实验的训练集,以准确度、召回率和查准率等数据验证所选取方法的可靠性,并以实验数据结果验证了方法的有效性. 展开更多
关键词 微博 垃圾评论 决策树 检测
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部