期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于改进Simhash的虚拟机镜像去重方法 被引量:4
1
作者 张灿阳 刘晓洁 《四川大学学报(自然科学版)》 CAS CSCD 北大核心 2020年第1期57-65,共9页
在云环境中,传统意义上的物理服务器正在逐渐被各式虚拟机所取代,云数据中心中托管的虚拟机镜像所占用的存储空间急剧增长,如何高效地管理这些镜像文件已成为云计算研究热点之一.由于虚拟机镜像内部存在大量空白重复数据块,这在一定程... 在云环境中,传统意义上的物理服务器正在逐渐被各式虚拟机所取代,云数据中心中托管的虚拟机镜像所占用的存储空间急剧增长,如何高效地管理这些镜像文件已成为云计算研究热点之一.由于虚拟机镜像内部存在大量空白重复数据块,这在一定程度上导致了镜像内部冗余率较高.其次,不同的虚拟机镜像可能运行了相同的操作系统和应用程序,使得镜像之间同样存在较多的重复数据.针对海量虚拟机镜像,传统的去重策略将产生巨大的时间开销,同时会消耗巨大的内存空间和CPU资源,影响数据中心的性能.提出一种基于改进Simhash算法的海量虚拟机镜像多级去重方法,将一个完整的镜像文件分割为操作系统镜像段和应用数据镜像段,同时提取各部分的特征值,利用DBSCAN(density-based spatial clustering of applications with noise)聚类算法完成对镜像段的分组,将相似度较高的镜像段聚为一类,从而将全局去重分解为规模较小且重复率较高的分组内部去重,实现了指纹索引数据完全存放于内存中的重复数据删除,大幅减少了磁盘I/O次数,达到缩短去重时间的目的. 展开更多
关键词 云计算 重复数据删除 改进simhash算法 虚拟机镜像
下载PDF
基于MapReduce的输电监测数据智能检索模型 被引量:2
2
作者 赵松燕 曲朝阳 +4 位作者 郭晓利 余通 黎新 谢铭 余福 《电力系统保护与控制》 EI CSCD 北大核心 2023年第22期177-187,共11页
随着新型电力系统发展,输电监测文本数据呈现出体量大、增速快等特点,且因行业数据传输协议私有化,导致数据检索性能低,影响输电线路实时决策分析。因此提出了基于MapReduce的输电监测数据智能检索模型。首先,改进了SimHash算法,实现输... 随着新型电力系统发展,输电监测文本数据呈现出体量大、增速快等特点,且因行业数据传输协议私有化,导致数据检索性能低,影响输电线路实时决策分析。因此提出了基于MapReduce的输电监测数据智能检索模型。首先,改进了SimHash算法,实现输电线路在线监测文本数据检索向量的高效提取。并引入多属性决策以及综合评分机制,实现目标数据的精准检索,提升数据的检索精度及查全率。其次,针对数据体量大、增速快的特点,设计了基于MapReduce的电力数据检索模型。最后,通过电网实例对比分析,验证了所提方法的检索精度、查全率及检索效率。 展开更多
关键词 新型电力系统 输电线路数据 改进simhash 智能检索 MAPREDUCE
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部