期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于支持向量机的搜索引擎垃圾网页检测研究 被引量:5
1
作者 贾志洋 李伟伟 +1 位作者 高炜 夏幼明 《云南民族大学学报(自然科学版)》 CAS 2011年第3期173-176,共4页
搜索引擎垃圾网页作弊的检测问题一般被视为一个二元分类问题,基于机器学习的分类算法建立分类器,将网页分成正常网页和垃圾网页2类.现有的基于内容特征的垃圾网页检测模型忽略了网页之间的链接关系,故构建了软间隔支持向量机分类器,以... 搜索引擎垃圾网页作弊的检测问题一般被视为一个二元分类问题,基于机器学习的分类算法建立分类器,将网页分成正常网页和垃圾网页2类.现有的基于内容特征的垃圾网页检测模型忽略了网页之间的链接关系,故构建了软间隔支持向量机分类器,以网页的内容特征作为支持向量,根据网页之间的链接具有相似性的特点定义了惩罚函数,使用样本集学习,得出了线性支持向量机网页分类器,并对分类器的分类效果进行了测试.实验结果表明基于支持向量机的分类器的效果明显好于使用内容特征构建的决策树分类器. 展开更多
关键词 垃圾网页 垃圾网页检测 机器学习 网页分类 支持向量机
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部