-
题名海量数据干扰下的危险Web数据挖掘技术研究
被引量:6
- 1
-
-
作者
王曙霞
熊曾刚
-
机构
湖北工程学院计算机与信息科学学院
-
出处
《微电子学与计算机》
CSCD
北大核心
2016年第2期87-91,共5页
-
文摘
提出一种海量数据干扰下基于自组织映射的危险web数据挖掘算法,通过海量数据的预测值与实际值之间的误差对其中的干扰数据进行判断和排除,在此基础上,通过自组织特征映射网络对危险web数据进行挖掘,介绍了自组织特征映射网络及输出层竞争的详细过程,确定一个可形成映射的网络,将待挖掘危险web数据看作是输入向量输入自组织映射网络中,在输出图上产生相应的胜出点,将相似的输入向量汇聚在映射图的相邻区域,与该区域距离较远的胜出点对应的输入向量则可被判断是危险web数据.仿真实验结果表明,采用所提算法对海量数据干扰下的危险web数据进行挖掘,不仅具有很高的挖掘效率,而且在挖掘精度上也有很高的性能.
-
关键词
海量数据
干扰
危险web数据
挖掘
-
Keywords
huge amounts of data
interference
dangerous web data
mining
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-