-
题名增量式关键资源页面判定树
- 1
-
-
作者
黄天强
胡斌
李峰
卓月明
蔡国民
颜一鸣
-
机构
吉首大学信息管理与工程学院
中南大学信息科学与工程学院
-
出处
《情报学报》
CSSCI
北大核心
2009年第3期469-474,共6页
-
基金
湖南省教育厅科学研究项目(2007C525)
湖南省教育科学规划课题(XJK06BJGl03)
湖南省大学生研究性学习与创新性实验项目.
-
文摘
本文针对互联网上信息的日益海量增长的情况,在评述前期算法的基础上,提出了一种关键资源页面判定树的增量式更新算法。新算法使用Web页面的链接分析方法,选择合适的Web页面属性,并基于反例的统计信息来构造判定树的测试属性值,采用ID5R算法来处理训练样本不断增长的关键资源页面判定的机器学习任务。同时设计了适合于该算法的剪枝策略,它通过引入并实时更新反例样本比率并在其值低于抑制因子时停止分裂的办法,避免了树的过度增长与抗嗓能力差、泛化情况糟糕的情况。实验表明增量式更新算法能更高效地生成关键资源页面判定树。最后讨论了该算法的应用领域。
-
关键词
关键资源页面
判定树
增量式更新
-
Keywords
key resource pages, decision tree, incremental updating
-
分类号
F270
[经济管理—企业管理]
TP393.092
[自动化与计算机技术—计算机应用技术]
-