期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
3
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
搜索服务中基于云计算的垃圾网页识别研究
1
作者
李艳平
徐雅斌
陈俊伊
《华中科技大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2012年第S1期249-253,共5页
为了快速、有效地对垃圾网页进行识别,提出了一种基于云计算平台的垃圾网页识别方案.在Hadoop分布式平台下构建一个基于页面内容和连接结构的支持向量机分类器,对垃圾网页进行识别,通过对数据进行分析.结果表明:垃圾网页的识别准确率较...
为了快速、有效地对垃圾网页进行识别,提出了一种基于云计算平台的垃圾网页识别方案.在Hadoop分布式平台下构建一个基于页面内容和连接结构的支持向量机分类器,对垃圾网页进行识别,通过对数据进行分析.结果表明:垃圾网页的识别准确率较高,处理时间随着集群节点数的增加而明显减少.
展开更多
关键词
搜索服务
垃圾网页识别
支持向量机
云计算
HADOOP
MAPREDUCE
原文传递
搜索引擎应对垃圾网页的技术研究
2
作者
李驰
李林
《电脑知识与技术(过刊)》
2015年第9X期20-22,共3页
介绍了常见的垃圾网页作弊方式。并对垃圾网页的识别方式进行了详细分析,包括基于网页内容的垃圾网页识别技术、基于链接结构来识别垃圾网页的Trust Rank算法以及目前比较流行的用于垃圾页面识别的机器学习分类法。其中采用Trust Rank...
介绍了常见的垃圾网页作弊方式。并对垃圾网页的识别方式进行了详细分析,包括基于网页内容的垃圾网页识别技术、基于链接结构来识别垃圾网页的Trust Rank算法以及目前比较流行的用于垃圾页面识别的机器学习分类法。其中采用Trust Rank算法与机器学习分类法来识别垃圾网页具有一定的通用性且具有与作弊方式无关的特性。最后提出了一些基于用户行为模式来识别垃圾网页的新思路。
展开更多
关键词
搜索引擎
垃圾
网页
网页
作弊方式
垃圾网页识别
下载PDF
职称材料
基于改进的LogitBoost算法的垃圾网页检测研究
3
作者
周爽
王洪钰
+2 位作者
李晓
孙磊
庞建萍
《科技视界》
2015年第27期29-30,共2页
实现垃圾网页的有效检测可以有效提高搜索引擎检索质量,促使网页的设计向着面向用户的方向发展。由于垃圾网页是面向搜索引擎设计的,正常网页是面向用户设计的,因而两者在特征方面存在众多区别,通过机器学习方法可以根据垃圾网页与正常...
实现垃圾网页的有效检测可以有效提高搜索引擎检索质量,促使网页的设计向着面向用户的方向发展。由于垃圾网页是面向搜索引擎设计的,正常网页是面向用户设计的,因而两者在特征方面存在众多区别,通过机器学习方法可以根据垃圾网页与正常网页在特征方面的不同对垃圾网页进行有效识别。通过对常见单分类器和集成学习分类器处理垃圾网页数据集的对比实验,发现集成学习方法 logitboost较为突出,所得结果明显优于单一分类器和常用集成学习算法,所得结果也更接近真实值,并通过对logitboost所用的预处理方法和基分类器进行改进,发现用resample对垃圾网页进行预处理,以REPTree算法为基分类器的logitboost算法对垃圾网页数据集的分类有较高的精确度。
展开更多
关键词
垃圾网页识别
集成学习
WEKA
logitboost
下载PDF
职称材料
题名
搜索服务中基于云计算的垃圾网页识别研究
1
作者
李艳平
徐雅斌
陈俊伊
机构
北京信息科技大学计算机学院
北京信息科技大学网络文化与数字传播北京市重点实验室
出处
《华中科技大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2012年第S1期249-253,共5页
文摘
为了快速、有效地对垃圾网页进行识别,提出了一种基于云计算平台的垃圾网页识别方案.在Hadoop分布式平台下构建一个基于页面内容和连接结构的支持向量机分类器,对垃圾网页进行识别,通过对数据进行分析.结果表明:垃圾网页的识别准确率较高,处理时间随着集群节点数的增加而明显减少.
关键词
搜索服务
垃圾网页识别
支持向量机
云计算
HADOOP
MAPREDUCE
Keywords
search service
spam page identification
support vector machines
cloud computing
Hadoop
MapReduce
分类号
N55 [自然科学总论]
原文传递
题名
搜索引擎应对垃圾网页的技术研究
2
作者
李驰
李林
机构
四川大学锦城学院计算机科学与软件工程系
出处
《电脑知识与技术(过刊)》
2015年第9X期20-22,共3页
文摘
介绍了常见的垃圾网页作弊方式。并对垃圾网页的识别方式进行了详细分析,包括基于网页内容的垃圾网页识别技术、基于链接结构来识别垃圾网页的Trust Rank算法以及目前比较流行的用于垃圾页面识别的机器学习分类法。其中采用Trust Rank算法与机器学习分类法来识别垃圾网页具有一定的通用性且具有与作弊方式无关的特性。最后提出了一些基于用户行为模式来识别垃圾网页的新思路。
关键词
搜索引擎
垃圾
网页
网页
作弊方式
垃圾网页识别
Keywords
search engine
web spam
web page cheating mode
web spam identification
分类号
TP393.092 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于改进的LogitBoost算法的垃圾网页检测研究
3
作者
周爽
王洪钰
李晓
孙磊
庞建萍
机构
山东师范大学信息科学与工程学院
出处
《科技视界》
2015年第27期29-30,共2页
基金
2014年度国家级大学生创新训练项目(201401223)
文摘
实现垃圾网页的有效检测可以有效提高搜索引擎检索质量,促使网页的设计向着面向用户的方向发展。由于垃圾网页是面向搜索引擎设计的,正常网页是面向用户设计的,因而两者在特征方面存在众多区别,通过机器学习方法可以根据垃圾网页与正常网页在特征方面的不同对垃圾网页进行有效识别。通过对常见单分类器和集成学习分类器处理垃圾网页数据集的对比实验,发现集成学习方法 logitboost较为突出,所得结果明显优于单一分类器和常用集成学习算法,所得结果也更接近真实值,并通过对logitboost所用的预处理方法和基分类器进行改进,发现用resample对垃圾网页进行预处理,以REPTree算法为基分类器的logitboost算法对垃圾网页数据集的分类有较高的精确度。
关键词
垃圾网页识别
集成学习
WEKA
logitboost
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
搜索服务中基于云计算的垃圾网页识别研究
李艳平
徐雅斌
陈俊伊
《华中科技大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2012
0
原文传递
2
搜索引擎应对垃圾网页的技术研究
李驰
李林
《电脑知识与技术(过刊)》
2015
0
下载PDF
职称材料
3
基于改进的LogitBoost算法的垃圾网页检测研究
周爽
王洪钰
李晓
孙磊
庞建萍
《科技视界》
2015
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部