-
题名基于统计机器学习的互联网暗链检测方法
被引量:5
- 1
-
-
作者
孟池洁
王伟
耿光刚
-
机构
中国科学院计算机网络信息中心
中国互联网络信息中心
-
出处
《计算机应用研究》
CSCD
北大核心
2015年第9期2779-2783,共5页
-
基金
国家自然科学基金资助项目(61375039
61005029)
中国科学院计算机网络信息中心"一三五"规划重点培育方向专项基金资助项目(CNIC_PY_1402)
-
文摘
互联网搜索引擎排名算法中,外部链接是一个重要因素,而利用链接作弊现象普遍存在于互联网中。暗链是链接作弊其中的一种手段,难以检测和清除,被称为"网络牛皮癣"。为了维护公平的搜索引擎排名机制,保证搜索结果质量,针对暗链这种作弊手段,提出了一种基于机器学习的互联网暗链检测方法,该方法结合网页源码锚文本的特征检测暗链。给出了相关性能分析,在真实的网络环境下的实验验证表明了所提出的方法可行有效。该研究为搜索引擎打击链接隐藏的作弊行为提供了理论和实践支撑。
-
关键词
暗链
链接隐藏方式
锚文本
机器学习
文本分类
-
Keywords
hidden hyperlink
hyperlink hiding techniques
anchor text
machine learning
text classification
-
分类号
TP393.08
[自动化与计算机技术—计算机应用技术]
-
-
题名二阶离散隐马尔科夫模型的严格定义及等价性质
被引量:2
- 2
-
-
作者
孙颖华
杨卫国
-
机构
江苏大学理学院
-
出处
《纯粹数学与应用数学》
2015年第4期380-386,共7页
-
基金
国家自然科学基金(11071104)
-
文摘
隐马氏模型作为一种具有双重随机过程的统计模型,具有可靠的概率统计理论基础和强有力的数学结构,已被广泛应用于语音识别、生物序列分析、金融数据分析等领域.由于传统的一阶隐马氏模型无法表示更远状态距离间的依赖关系,就可能会忽略很多有用的统计特征,故有人提出二阶隐马氏模型的概念,但此概念并不严格.本文给出二阶离散隐马尔科夫模型的严格定义,并研究了二阶离散隐马尔科夫模型的两个等价性质.
-
关键词
二阶隐马尔科夫模型
观测链
隐藏链
-
Keywords
second-order hidden Markov model
observation chain
hidden chain
-
分类号
O211.62
[理学—概率论与数理统计]
-
-
题名利用ASP实现Web网站的“反爬行”应用
- 3
-
-
作者
谭明金
俞海英
沈鑫剡
-
出处
《电脑编程技巧与维护》
2011年第1期86-88,共3页
-
文摘
提出并实现了一种便捷有效的Web站点"反爬行"方法,并给出了实例。通过隐藏网页之间的链接关系,以及随机显示网页的文件名和存储位置等信息,实现了Web站点的"反爬行"应用。这种方法不仅有效,而且简单易行。
-
关键词
Web反爬行
链接隐藏
URL模糊
ASP网页
-
分类号
TP393.092
[自动化与计算机技术—计算机应用技术]
-