期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于分布式数据仓库的分类分析研究 被引量:10
1
作者 李伟卫 李梅 +1 位作者 张阳 申爱丽 《计算机应用研究》 CSCD 北大核心 2013年第10期2936-2939,2943,共5页
针对GAC-RDB分类算法只能应用于单机版数据仓库的局限性,为了能够更方便、快捷地在云计算平台上开展数据挖掘工作,基于分布式数据仓库HBase,结合GAC-RDB分类算法的实现机理,制定适合分布式平台的运行策略,使用原生HiveQL语言提出了一种... 针对GAC-RDB分类算法只能应用于单机版数据仓库的局限性,为了能够更方便、快捷地在云计算平台上开展数据挖掘工作,基于分布式数据仓库HBase,结合GAC-RDB分类算法的实现机理,制定适合分布式平台的运行策略,使用原生HiveQL语言提出了一种分布式GAC-RDB分类算法。实验显示,随着集群中节点的不断增加,算法的运行时间稳步下降。结果表明,在保证算法准确率的前提下,分布式数据仓库能够有效提高GACRDB分类算法的扩展性和运行效率,相对于MapReduce框架,HiveQL语言降低了对数据挖掘从业人员的技术要求,更大程度地减少了算法的开发时间,为挖掘海量数据提供了新的解决方案。 展开更多
关键词 数据挖掘 分布式数据仓库 分类分析 GAC—RDB HADOOP HBASE Hive
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部