期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
一种对抗社交网络链接作弊的算法 被引量:1
1
作者 申华 《计算机与现代化》 2015年第7期1-4,共4页
随着社交网络的普遍应用,故意构建大量链接关系以提高自身影响力的作弊行为将给社交网络造成极大的安全隐患。针对这种作弊现象,本文首先提出社交网络用户的4类特征,并利用关系强度模型,提出一种信任和非信任同时双向传播的反作弊改进... 随着社交网络的普遍应用,故意构建大量链接关系以提高自身影响力的作弊行为将给社交网络造成极大的安全隐患。针对这种作弊现象,本文首先提出社交网络用户的4类特征,并利用关系强度模型,提出一种信任和非信任同时双向传播的反作弊改进算法。实验表明采用信任及非信任双向传播的反社交网络链接作弊算法具有良好的对抗性能。 展开更多
关键词 社交网络 链接作弊 信任传播 非信任传播
下载PDF
基于链接相似度和作弊系数的Spam网页识别算法
2
作者 陆钊 李石君 《计算机工程与科学》 CSCD 北大核心 2015年第10期1983-1988,共6页
Spam网页主要通过链接作弊手段达到提高搜索排名而获利的目的,根据链接作弊的特征,引入链接相似度和作弊系数两个指标来判定网页作弊的可能性。借鉴BadRank算法思想,从Spam网页种子集合通过迭代计算链接相似度和作弊系数,并根据与种子... Spam网页主要通过链接作弊手段达到提高搜索排名而获利的目的,根据链接作弊的特征,引入链接相似度和作弊系数两个指标来判定网页作弊的可能性。借鉴BadRank算法思想,从Spam网页种子集合通过迭代计算链接相似度和作弊系数,并根据与种子集合的链接指向关系设置权重,将待判定的网页进行度量。最后选取Anti-Trust Rank等算法作对比实验,结果验证了本文算法在准确率和适应性方面优于对比算法。 展开更多
关键词 Spam网页 链接作弊 相似度 作弊系数 权重系数
下载PDF
Co-Training——内容和链接的Web Spam检测方法 被引量:4
3
作者 魏小娟 李翠平 陈红 《计算机科学与探索》 CSCD 2010年第10期899-908,共10页
Web spam是指通过内容作弊和网页间链接作弊来欺骗搜索引擎,从而提升自身搜索排名的作弊网页,它干扰了搜索结果的准确性和相关性。提出基于Co-Training模型的Web spam检测方法,使用了网页的两组相互独立的特征——基于内容的统计特征和... Web spam是指通过内容作弊和网页间链接作弊来欺骗搜索引擎,从而提升自身搜索排名的作弊网页,它干扰了搜索结果的准确性和相关性。提出基于Co-Training模型的Web spam检测方法,使用了网页的两组相互独立的特征——基于内容的统计特征和基于网络图的链接特征,分别建立两个独立的基本分类器;使用Co-Training半监督式学习算法,借助大量未标记数据来改善分类器质量。在WEB SPAM-UK2007数据集上的实验证明:算法改善了SVM分类器的效果。 展开更多
关键词 WEB spam检测方法 内容作弊 链接作弊 Co—Training算法
下载PDF
主题相似度与链接权重相结合的垃圾网页排序检测 被引量:2
4
作者 韦莎 朱焱 《计算机应用》 CSCD 北大核心 2016年第3期735-739,共5页
针对因Web中存在由正常网页指向垃圾网页的链接,导致排序算法(Anti-TrustRank等)检测性能降低的问题,提出了一种主题相似度和链接权重相结合,共同调节网页非信任值传播的排序算法,即主题链接非信任排序(TLDR)。首先,运用隐含狄利克雷分... 针对因Web中存在由正常网页指向垃圾网页的链接,导致排序算法(Anti-TrustRank等)检测性能降低的问题,提出了一种主题相似度和链接权重相结合,共同调节网页非信任值传播的排序算法,即主题链接非信任排序(TLDR)。首先,运用隐含狄利克雷分配(LDA)模型得到所有网页的主题分布,并计算相互链接网页间的主题相似度;其次,根据Web图计算链接权重,并与主题相似度结合,得到主题链接权重矩阵;然后,利用主题链接权重调节非信任值传播,改进Anti-TrustRank和加权非信任值排序(WATR)算法,使网页得到更合理的非信任值;最后,将所有网页的非信任值进行排序,通过划分阈值检测出垃圾网页。在数据集WEBSPAM-UK2007上进行的实验结果表明,与Anti-TrustRank和WATR相比,TLDR的Spam Factor分别提高了45%和23.7%,F1-measure(阈值取600)分别提高了3.4个百分点和0.5个百分点,spam比例(前三个桶)分别提高了15个百分点和10个百分点。因此,主题与链接权重相结合的TLDR算法能有效提高垃圾网页检测性能。 展开更多
关键词 垃圾网页检测 链接作弊 排序算法 主题相似度 非信任值传播
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部