-
题名基于网页挖掘的网页作弊检测技术
- 1
-
-
作者
焉凯
聂韶华
-
机构
莱芜职业技术学院信息工程系
临沂大学教育学院
-
出处
《韶关学院学报》
2020年第9期18-23,共6页
-
基金
山东省高等学校实验技术研究项目(2018-494).
-
文摘
搜索引擎模仿了社会网络研究的技术,在商业上取得了收益.商业机构为了经济利益,利用网页作弊获得较高的用户点击率.网页作弊严重影响用户获取的信息,浪费了用户时间.采用数据挖掘技术来发现网页中的作弊方法,包括基于内容的网页作弊、基于链接的网页作弊和基于隐藏技术的网页作弊.借助常规统计和语言特征分析,分析了基于内容的网页作弊检测技术;通过比较3种典型的基于网页排名的算法,即TrustRank算法、类似BadRank算法和Truncated PageRank算法的区别,分析了基于链接的网页作弊检测技术,从基于搜索引擎的访问率、源网页概率和短期导航率着手,分析了基于用户行为的网页作弊检测技术.
-
关键词
网页作弊
搜索引擎
网页作弊分类
作弊检测技术
-
Keywords
web page cheating
search engine cheating
web page cheating classification
cheating detection
-
分类号
TP393.0
[自动化与计算机技术—计算机应用技术]
-