期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
Co-Training——内容和链接的Web Spam检测方法
被引量:
4
1
作者
魏小娟
李翠平
陈红
《计算机科学与探索》
CSCD
2010年第10期899-908,共10页
Web spam是指通过内容作弊和网页间链接作弊来欺骗搜索引擎,从而提升自身搜索排名的作弊网页,它干扰了搜索结果的准确性和相关性。提出基于Co-Training模型的Web spam检测方法,使用了网页的两组相互独立的特征——基于内容的统计特征和...
Web spam是指通过内容作弊和网页间链接作弊来欺骗搜索引擎,从而提升自身搜索排名的作弊网页,它干扰了搜索结果的准确性和相关性。提出基于Co-Training模型的Web spam检测方法,使用了网页的两组相互独立的特征——基于内容的统计特征和基于网络图的链接特征,分别建立两个独立的基本分类器;使用Co-Training半监督式学习算法,借助大量未标记数据来改善分类器质量。在WEB SPAM-UK2007数据集上的实验证明:算法改善了SVM分类器的效果。
展开更多
关键词
WEB
spam检测方法
内容作弊
链接
作弊
Co—Training算法
下载PDF
职称材料
题名
Co-Training——内容和链接的Web Spam检测方法
被引量:
4
1
作者
魏小娟
李翠平
陈红
机构
中国人民大学数据工程与知识工程国家教育部重点实验室
中国人民大学信息学院
出处
《计算机科学与探索》
CSCD
2010年第10期899-908,共10页
基金
国家自然科学基金No.60603046
60673138
+1 种基金
国家高技术研究发展计划(863)No.2008AA01Z120
国家教育部博士点基金No.20090004110002~~
文摘
Web spam是指通过内容作弊和网页间链接作弊来欺骗搜索引擎,从而提升自身搜索排名的作弊网页,它干扰了搜索结果的准确性和相关性。提出基于Co-Training模型的Web spam检测方法,使用了网页的两组相互独立的特征——基于内容的统计特征和基于网络图的链接特征,分别建立两个独立的基本分类器;使用Co-Training半监督式学习算法,借助大量未标记数据来改善分类器质量。在WEB SPAM-UK2007数据集上的实验证明:算法改善了SVM分类器的效果。
关键词
WEB
spam检测方法
内容作弊
链接
作弊
Co—Training算法
Keywords
Web spam detection method; content-based spam; link-based spam; Co-Training;
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
Co-Training——内容和链接的Web Spam检测方法
魏小娟
李翠平
陈红
《计算机科学与探索》
CSCD
2010
4
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部