期刊文献+

基于数据库抽样的海量数据分类算法研究 被引量:1

Research on Classification Calculation Way of a Great Amount of Data According to the Database Sampling
下载PDF
导出
摘要 本文对目前比较优秀的各种分类方法进行了介绍、分析和比较。在此基础上,借鉴决策树方法的快速分类特性,提出了一种基于数据库抽样的海量数据分类算法,给出了算法的设计思想和实现原理,并对多处理环境下的优化进行了探讨。实验研究表明,该算法可以明显提高海量数据库的分类效率。 In this paper, some excellent classifying methods are introduced and analyzed first. Then the quick classifying character of decision tree method is used for reference, and a mass data classification algorithm is proposed based on database sampling. Both the designing thoughts and implementation principle of the algorithm are given. The optimization of the algorithm is also discussed in multi-processor environment. An example shows that, this classifying algorithm can improve the efficiency of classification in mass database.
作者 李雪婵
出处 《计算机科学》 CSCD 北大核心 2008年第6期299-300,F0003,共3页 Computer Science
关键词 分类 算法 海量数据 数据库 Classification,Algorithm,Mass data,Database
  • 相关文献

参考文献5

二级参考文献17

  • 1Ma Xiaoqiang,香港大学技术报告,1996年
  • 2Han J,Proceedings of ACM SIGMOD International Conference’96 on Management of Data (SIGMOD’96),1996年
  • 3Cheung D,Proceedings of the International Conference’96 on Data Engineering (ICDE’96),1996年
  • 4Han Jiawei,Proceedings of the International Conference’96 on Data Mining and Knowledge Discovery (KDD’96),1996年,250页
  • 5Lu Hongjun,IEEE Trans Knowl Data Eng,1996年,8卷,6期,957页
  • 6Wang Shan,计算机世界,1996年,7卷,28期,101页
  • 7Guo Yibin,PC World China(in Chinese),1996年,26页
  • 8Jia Hong,中国计算机用户,1996年,6页
  • 9Han J,Proceedings of 1995 International Conference on Very Large Data Bases (VLDB’95),1995年,420页
  • 10Han J,Proceedings of the 4th International Conference on Information and Knowledge Management (CIKM’95),1995年,19页

共引文献353

同被引文献19

引证文献1

二级引证文献1

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部