基于Hadoop的海量共现矩阵生成方法被引量：13

A Method for Generating Co-occurrence Matrix of Mass Data Based on Hadoop

下载PDF

导出

摘要海量数据的处理分析是当前信息处理技术的热点之一,介绍开源并行系统Hadoop的体系结构以及基于Hadoop的MapReduce编程框架,并在Hadoop基础上提出一种通过多重MapReduce操作,实现海量共现矩阵的生成方法。 Mass data processing is a focal point of information techniques. This paper introduces architecture of open source parallel system - Hadoop, analyzes the MapReduce programming framework based on Hadoop, and proposes a method for generating co - occurrence matrix of mass data through multiple MapReduce operations.

作者杨代庆张智雄

机构地区中国科学院国家科学图书馆中国科学技术信息研究所

出处《现代图书情报技术》 CSSCI 北大核心 2009年第4期23-26,共4页 New Technology of Library and Information Service

基金国家"十一五"科技支撑计划子课题"网络科技信息监测与评价"(项目编号:2006BAH03B05)的研究成果之一

关键词 HADOOP MAPREDUCE 共现矩阵开源软件 Hadoop MapReduce Co - occurrence matrix Open - source - software

分类号 TP182 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献8

1HDFS Architecture [ EB/OL ]. [ 2008 - 12 - 10 ]. http ://hadoop. apache. org/core/docs/current/hdfs_design. html.
2Hadoop Cluster Setup [ EB/OL]. [ 2008 - 12 - 15 ]. http://hadoop. apache. org/core/docs/current/clustcr_setup. html.
3HadoopMapReduce [ EB/OL]. [ 2008 - 12 - 16 ]. http://wiki. apache. org/hadoop/HadoopMapReduce.
4Distributed Computing with Linux and Hadoop. [ EB/OL]. [2009 - 01 -101. http ://www. ibm. com/developerworks/linux/library/l - hadoop/index. html.
5Hbase [ EB/OL ]. [ 2009 - 01 - 10 ]. http ://hadoop. apache. org/ hbase/.
6Hive[ EB/OL]. [2009 -01 - 15 ]. http://hadoop. apache. org/hive/.
7Pig [ EB/OL ]. [ 2009 - 01 - 15 ]. http ://hadoop. apache. org/pig/.
8CloudBase [ EB/OL ]. [ 2009 - 01 - 16 ]. http ://sourceforge. net/ projects/cloudbase/.

同被引文献120

1张石磊,武装.一种基于Hadoop云计算平台的聚类算法优化的研究[J].计算机科学,2012,39(S2):115-118. 被引量：29
2周锋,李旭伟.一种改进的MapReduce并行编程模型[J].科协论坛（下半月）,2009(2):65-66. 被引量：14
3田国良.公益性服务还是市场化运作——数字图书馆运行模式选择[J].情报资料工作,2005,26(1):75-77. 被引量：12
4马亮,陈群秀,蔡莲红.一种改进的自适应文本信息过滤模型[J].计算机研究与发展,2005,42(1):79-84. 被引量：18
5卢丽君,廖明生,张路.分布式并行计算技术在遥感数据处理中的应用[J].测绘信息与工程,2005,30(3):1-3. 被引量：20
6张治木,蔡寅峰.基于TIN和格网的DEM表面建模的比较[J].铜业工程,2005(2):8-10. 被引量：9
7胡鹏,李圣权,亢江妹.空间数据问题与GIS发展的思考[J].武汉大学学报（信息科学版）,2005,30(9):796-800. 被引量：4
8曾湘琼.试论制约数字信息长期保存的软瓶颈[J].图书馆学研究,2005(12):56-58. 被引量：6
9谢晓专.网络信息资源组织模式研究[J].图书情报工作,2006,50(1):64-67. 被引量：10
10刘以安,羊斌.关联规则挖掘中对Apriori算法的一种改进研究[J].计算机应用,2007,27(2):418-420. 被引量：53

引证文献13

1安俊秀.基于服务器集群的云检索系统的研究与示范[J].计算机科学,2010,37(7):179-182. 被引量：7
2詹恒飞,杨岳湘,方宏.Nutch分布式网络爬虫研究与优化[J].计算机科学与探索,2011,5(1):68-74. 被引量：21
3李克然,刘东苏,邓媛.电子商务环境下海量数据存储模型[J].情报杂志,2010,29(B12):133-134. 被引量：3
4李成华,张新访,金海,向文.MapReduce:新型的分布式并行计算编程模型[J].计算机工程与科学,2011,33(3):129-135. 被引量：111
5王晟,赵壁芳.云计算中MapReduce技术研究[J].通信技术,2011,44(12):159-161. 被引量：9
6杨玲,李仁发,唐卓.基于MapReduce的单源最短路径算法研究[J].微计算机信息,2011,27(12):97-99. 被引量：5
7张广弟,汪秀兵,胡亚磊.基于hadoop的DEM格网建立研究[J].科技视界,2012(28):95-95. 被引量：1
8朱贤军,李敬兆.无加密模式下对云数据的隐私保密[J].计算机技术与发展,2013,23(6):126-128. 被引量：2
9陈传夫,钱鸥,代钰珠.大数据时代的数字图书馆建设研究[J].图书情报工作,2014,58(7):40-45. 被引量：144
10蒋波涛,王艳东.基于MapReduce的地图代数并行计算方法[J].测绘地理信息,2014,39(3):51-55. 被引量：3

二级引证文献310

1杨德英.大数据时代高校数字图书馆建设研究[J].产业科技创新,2020(13):33-34. 被引量：3
2张毅强.互联网的发展与我国数字图书馆信息资源建设策略研究[J].区域治理,2018,0(34):68-68.
3孙骎童.关于集群虚拟机资源调度专利申请分析[J].军民两用技术与产品,2018,0(16):198-198.
4李艳平,徐雅斌,陈俊伊.搜索服务中基于云计算的垃圾网页识别研究[J].华中科技大学学报（自然科学版）,2012,40(S1):249-253.
5江小平,李成华,向文,张新访.云计算环境下朴素贝叶斯文本分类算法的实现[J].计算机应用,2011,31(9):2551-2554. 被引量：21
6李绍松,尹栋,慕德俊,戴冠中.基于FPGA可扩展的Mapreduce架构设计与实现[J].计算机技术与发展,2012,22(2):103-106. 被引量：1
7赵菲,王强.可信云平台服务技术研究[J].信息安全与通信保密,2012,10(3):84-86. 被引量：5
8郝玉龙,孙阳,李冰.基于云计算的卫星地面应用系统设计[J].计算机应用与软件,2012,29(4):216-219. 被引量：7
9马媛.基于Hadoop的云计算平台安全机制研究[J].信息安全与通信保密,2012,10(6):89-92. 被引量：22
10焦改香.试谈社会信息意识的形成条件和影响因素[J].地震科技情报,2000(2):11-12.

1黄永勤.国外大数据研究热点及发展趋势探析[J].情报杂志,2014,33(6):99-104. 被引量：33
2吴冬梅.基于云计算的图书馆信息化建设[J].图书馆学刊,2013,35(8):115-117. 被引量：7
3陈勇钢,李存金.3D打印技术的多学科研究特征分析[J].科技管理研究,2017,37(1):55-58. 被引量：1
4邓仲华,宋秀芬.基于知识图谱的国内外大数据研究对比分析[J].信息资源管理学报,2015,5(4):89-97. 被引量：9
5陈国兰.基于关键词聚类的国内知识转移研究可视化分析[J].农业图书情报学刊,2014,26(12):55-59.
6姜春林,杜维滨,李江波.CSSCI文献数据共现矩阵的软件实现[J].情报理论与实践,2008,31(6):937-940. 被引量：6
7吕小萍,石晓敬,王晓洁.国内心血管疾病期刊论文文献计量分析[J].信息资源管理学报,2016,6(3):85-90.
8黄永勤.国外大数据研究热点的可视化探析[J].信息管理（上海）,2013(5):1-9. 被引量：1
9皇甫青红,华薇娜,刘艳华,殷之明.国际数字图书馆领域研究热点及作者团体分析——基于共词分析和社会网络分析[J].情报杂志,2013,32(1):118-123. 被引量：30
10虞为,陈俊鹏.基于MapReduce的书目数据关联匹配研究[J].现代图书情报技术,2013(9):15-22. 被引量：10

现代图书情报技术

2009年第4期

浏览历史

内容加载中请稍等...

基于Hadoop的海量共现矩阵生成方法被引量：13

参考文献8

同被引文献120

引证文献13

二级引证文献310

相关作者

相关机构

相关主题

浏览历史

基于Hadoop的海量共现矩阵生成方法 被引量：13

参考文献8

同被引文献120

引证文献13

二级引证文献310

相关作者

相关机构

相关主题

浏览历史

基于Hadoop的海量共现矩阵生成方法被引量：13