移动数据具有数量庞大、类型多样、时效性强和高价值等特点.移动通信数据是一种重要的移动数据,对高效地存储和访问移动通信数据进行研究,并在此基础上更加有效地开展移动数据挖掘的相关研究,具有重大现实意义.当前,使用并行数据挖掘技...移动数据具有数量庞大、类型多样、时效性强和高价值等特点.移动通信数据是一种重要的移动数据,对高效地存储和访问移动通信数据进行研究,并在此基础上更加有效地开展移动数据挖掘的相关研究,具有重大现实意义.当前,使用并行数据挖掘技术进行数据挖掘得到普遍认可,但并行数据挖掘技术需要较高的硬件成本,并行算法代码调试和优化较为困难.为此提出大规模移动通信数据的单机实现MCDS(mobile communication data processing system).MCDS基于GraphChi,改进了数据格式、分片机制、数据分片换入换出机制.实验结果验证了MCDS的有效性,为移动数据挖掘提供了切实可行的实验环境.展开更多
文摘移动数据具有数量庞大、类型多样、时效性强和高价值等特点.移动通信数据是一种重要的移动数据,对高效地存储和访问移动通信数据进行研究,并在此基础上更加有效地开展移动数据挖掘的相关研究,具有重大现实意义.当前,使用并行数据挖掘技术进行数据挖掘得到普遍认可,但并行数据挖掘技术需要较高的硬件成本,并行算法代码调试和优化较为困难.为此提出大规模移动通信数据的单机实现MCDS(mobile communication data processing system).MCDS基于GraphChi,改进了数据格式、分片机制、数据分片换入换出机制.实验结果验证了MCDS的有效性,为移动数据挖掘提供了切实可行的实验环境.