云数据的划分存储和查询研究

Research on Partition Storage and Query of Cloud Data

导出

摘要随着网络数据、生产数据的大幅增长,数据存储和查询面临着严峻的挑战.数据划分技术可将海量数据分布存储在多台机器中,既能解决单机存储容量问题,也能通过划分区间来缩小数据查询范围.为此,研究了海量数据背景下数据划分存储和查询的方法,设计了将海量数据按角度和距离值计算其所属数据区间,并分布存储到该区间对应的机器文件中,从而实现了大数据量的文件以小数据量的文件存储,使得查询数据时可以先通过索引表找到所属的数据区间其所在文件,再进行查询即可,这样缩小了数据查询范围,而且还可以通过多机器协同查询,加快查询速度.对采用以上方法划分存储的数据进行了Top-K查询,验证了方法的有效性. With the increase of network data and production data, data storage and query are facing severe challenges. Data partitioning technology can be stored in a large number of data storage in a number of machines, both to solve the problem of single storage capacity, but also through the division of the range to narrow the range of data query. Therefore, on the background of data partitioning method for massive data storage and query, designed the massive data according to the angle and distance calculation in the data range, and stored in the distribution of the interval corresponding to the machine file, in order to achieve a large amount of data files with a small amount of data file storage, query the data can first find the index table by the interval data file, and then you can query, thus reducing the scope of data query, but also through multi robot collaborative query speed up queries. By using the above method to partition the data stored in the top-K query, the validity of the method is verified.

作者邵秀丽耿梅洁孟凤娇王志刚

机构地区南开大学计算机与控制工程学院天津港(集团)有限公司

出处《南开大学学报（自然科学版）》 CAS CSCD 北大核心 2017年第3期1-8,共8页 Acta Scientiarum Naturalium Universitatis Nankaiensis

基金天津市自然科学基金(14ZCZDGX00032 14ZXDZGX00867 15ZXDSGX00090 15ZXHLGX00360 15ZXH LGX00380)

关键词云数据划分存储 TOP-K查询索引表 cloud data partition storage top-K query index table

分类号 TP391.7 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献4

1姜奇平.大数据时代到来[J].互联网周刊,2012(2):6-6. 被引量：59
2贾婷,魏祖宽,唐曙光,金在弘.一种面向并行空间查询的数据划分方法[J].计算机科学,2010,37(8):198-200. 被引量：12
3朱恺力.运用模糊数学对计算机性能的评价[J].经营管理者,2010(10X):286-287. 被引量：1
4蒋雄飞,张登银,居悌.基于线索树的IP电话系统寻址[J].计算机工程,2001,27(1):46-47. 被引量：1

二级参考文献17

1陈东升.消费行为的模糊数学模型[J].经济经纬,2004,21(4):21-22. 被引量：4
2冯玉才,万春.基于集群的数据库系统原型DMC[J].计算机工程与科学,2005,27(3):56-57. 被引量：3
3徐顼,方永锋,张忠辅,封志宏,吴长虹.基于模糊数学的计算机性能评价和销售预测的研究[J].甘肃联合大学学报（自然科学版）,2007,21(2):15-17. 被引量：2
4张登银张小英.IP电话技术原理与应用[M].北京:人民邮电出版社,2000..
5Michael J M,Steve D,Bruce M G.Towards a HPC Framework for Integrated Processing of Geographical Data:Encapsulating the Complexity of Parallel Algorithms[J].Trans in GIS,2000,4(3):245-262.
6杨冬青,马秀莉,唐世渭,等.数据库系统概念[M].北京:机械工业出版社,2006.
7An N,Lu R,Qian L.A Siuasubramaniam,T Keefe.Storing Spatial Data On a Network of Workstations[J].Cluster Computing,1999:259-270.
8Guttman A.R-trees:A Dynamic Index Structure for Spatial Searching[C] ∥Proc.ACM SIGMOD Int'1 Conf on Management of Data.1984:47-57.
9Bohm C,Berchtold S,Keim D A.Searching in Hingh-dimensionalSpaces-index Structures for Improving the Performance of Multimedia Databases[J].ACM Computing Surveys,2001,33(3):322-373.
10Wang Shaowen,Armstrong M P.A Quadtree Approach to Domain Decomposition for Spatial Interpolation in Grid Computing Environments[J].Parallel Computing,2003,29:1481-1504.

共引文献69

1张逸,贾金玺.中国视频网站十年进化史[J].编辑之友,2015(4):11-16. 被引量：15
2王结臣,王豹,胡玮,张辉.并行空间分析算法研究进展及评述[J].地理与地理信息科学,2011,27(6):1-5. 被引量：29
3熊晶,郭磊,高峰.基于JPPF的分布式并行检索系统研究[J].计算机技术与发展,2012,22(1):79-82. 被引量：3
4齐琳,沈婕,郭立帅,周侗.面向D-TIN并行构建的动态条带数据划分方法与实验分析[J].地球信息科学学报,2012,14(1):55-61. 被引量：6
5莫展宏.基于云计算的社会化云营销[J].商场现代化,2012(14):32-32. 被引量：3
6张云鹏.生物信息学研究方法探讨[J].黑龙江科技信息,2012(30):41-41.
7虞俊杰.互联网信息可信性评价能力培养[J].图书馆建设,2012(12):92-95. 被引量：2
8乔朝飞.大数据及其对测绘地理信息工作的启示[J].测绘通报,2013(1):107-109. 被引量：50
9赵宏卫.法人领域公共服务数据门户的研究[J].信息安全与通信保密,2013,11(5):44-48.
10王艳,刘明菲.试论社会化媒体下的云营销[J].商业时代,2013(20):32-33. 被引量：1

1朱长武,戴上平,刘智.基于遗传算法的Web集群负载均衡方法[J].广西师范大学学报（自然科学版）,2006,24(4):239-242. 被引量：5
2陈广胜,程逸群,景维鹏.基于KD树划分的云计算DBSCAN优化算法[J].计算机工程,2017,34(4):21-27. 被引量：6
3尹莹.计算机通信网络中容量与流量分配的优化分析[J].通讯世界,2017,23(10):112-112.
4吕维体.云计算环境下的分布存储关键技术[J].通讯世界,2017,23(11):85-86.
5黄玉峰.Web服务器群集网络负载均衡的应用与研究[J].电脑编程技巧与维护,2017(11):83-84. 被引量：1
6荣银超.乒乓球推挡侧身击球路径规划仿真研究[J].计算机仿真,2017,34(5):230-233.
7桑亚群.无线网络系统对恶意数据优化检测仿真研究[J].计算机仿真,2017,34(6):306-309. 被引量：2
8余思嘉.一种基于编码的局域网文件存储系统[J].工业控制计算机,2017,30(6):90-92.
9马发民,王锦彪,张林.基于分段距离和子序列匹配的飞机故障检测[J].计算技术与自动化,2017,36(2):29-32. 被引量：1
102017年中国工业机器人行业发展趋势分析[J].智能城市,2017,3(4):21-21. 被引量：1

南开大学学报（自然科学版）

2017年第3期

浏览历史

内容加载中请稍等...

云数据的划分存储和查询研究

参考文献4

二级参考文献17

共引文献69

相关作者

相关机构

相关主题

浏览历史