-
题名基于SAE-LBP的网页分类研究
被引量:4
- 1
-
-
作者
江国荐
顾乃杰
张旭
任开新
-
机构
中国科学技术大学计算机科学技术学院
中国科学技术大学安徽省计算与通信软件重点实验室
中国科学技术大学先进技术研究院
-
出处
《小型微型计算机系统》
CSCD
北大核心
2016年第4期738-742,共5页
-
基金
安徽省自然科学基金项目(1408085MKL06)资助
-
文摘
在网页分类技术中,SVM、BP神经网络和Naive Bayes等传统分类器主要采用了信息增益、互信息和最大熵等模型选取特征.随着深度学习的发展,深层次地选取特征的方法正在被广泛研究.结合稀疏自动编码器(SAE)和LBP神经网络,提出一种基于SAE-LBP的网页分类器.根据网页文本的半结构化特征,改进了文本特征表示的权重计算.针对网页文本的稀疏性,采用SAE对网页文本进行特征选取.还提出一种基于学习率自动调整的LBP神经网络,有效地降低了训练时间.实验表明,相对于传统的BP神经网络,基于SAE-LBP的网页分类器的分类正确率提升了5.19%,时间性能提升了83.86%.
-
关键词
SAE
LBP
网页分类
深度学习
神经网络
-
Keywords
SAE
LBP
webpage classification
deep learning
neural networks
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-