-
题名单路径层次化网页分类算法
- 1
-
-
作者
彭小刚
傅向华
-
机构
深圳大学信息工程学院(软件学院)
-
出处
《计算机工程与设计》
CSCD
北大核心
2008年第9期2356-2358,2362,共4页
-
基金
国家自然科学基金项目(60673122)
深圳大学科研启动基金项目(2006046)
-
文摘
网页自动分类是解决互联网信息检索困难的有效方法。虽然有很多自动分类算法和系统,但是大部分此类算法注重如何将网页准确分到某个独立的类别里面,却忽略类别之间所组成的体系结构本身也具备的一些隐藏分类信息。同时,一般的分类算法每次分类都需要搜索所有的类别。针对这些缺点,提出了一种基于结构的单路径层次化网页分类算法,该分类方法利用类别之间具有树状结构这一特点,对类别中存在父子关系的类别间进行信息传递,使得每次分类只需要搜索树中一条路径而不用遍历所有树节点。实验结果证明,这种单路径搜索技术与相关的算法相比,在减少搜索节点的同时可以提高6%的准确度。
-
关键词
网页分类
层次结构
信息提取
单路径
类别信息树
特征传递
-
Keywords
webpageclassification
hierarchical classification
information retrieval
single-path
category informationtree
feature propagation
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-