摘要
云计算模式解决了大规模数据存储和计算能力上存在的瓶颈,为大规模数据挖掘技术提供了理想的计算模式和技术手段。分析Hadoop云计算平台的数据存储和计算模型,在云计算模式的基础上,实现云计算平台上Web文本数据的贝叶斯分类模型。对于大规模数据挖掘中的数据存储和计算的问题和难点,提出一种高效、低成本的解决方案。
The cloud computing model solves the bottleneck in the storage and computing power of largescale data, and provides an ideal computing model and the technical means for large-scale data mining. Analyzes the data storage and computing model in Hadoop. Based on the cloud com- puting model, establishes the Bayesian classification model for the Web text data on cloud computing platform. And proposes the economical and efficient solutions to solve the problems of storage and computing power for large-scale data.
出处
《现代计算机》
2012年第17期7-11,共5页
Modern Computer
关键词
云计算
朴素贝叶斯
文本数据分类
Cloud Computing
Navve Bayes
Text Data Classification