-
题名Web网页文本特征选择方法研究
被引量:4
- 1
-
-
作者
李会
王立峰
-
机构
齐齐哈尔大学通信学院
东北林业大学机电工程学院
-
出处
《计算机工程与设计》
CSCD
北大核心
2010年第16期3724-3727,共4页
-
基金
黑龙江省教育厅科学技术研究基金项目(11541399)
-
文摘
提出了一种用于文本分类的特征选择方法。计算文本的特征值,每个特征值被赋予一个权重值,权重值的大小表示文本特征的重要程度,权重值最大的特征为决定性特征,决定性特征能代表某一类;通过构造树结构模型来消除噪音文本,同时还可以降低计算复杂度;最后改进该算法,动态的检测相对于当前节点的最佳节点更有利于进行特征选择。实验结果表明,该方法具有较高的分类精度,且计算成本较低,符合规模Web自动分类的需要。
-
关键词
特征选择
文本分类
噪音文本
WEB
决定性特征
-
Keywords
feature selection
text classification
noise text
web
determinant feature
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-