期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
基于Ceph存储的数据均衡分布算法
1
作者 苗宇豪 范中磊 +1 位作者 张墨翟 杨柳 《微电子学与计算机》 2024年第3期90-97,共8页
针对Ceph分布式存储系统中可扩展哈希下的受控复制(Controlled Replication Under Scalable Hashing,CRUSH)数据分布算法导致设备间存储数据容量之差达到40%,进而在数据量大、高并发情况下“热点”成为系统性能瓶颈的问题,本文对CRUSH... 针对Ceph分布式存储系统中可扩展哈希下的受控复制(Controlled Replication Under Scalable Hashing,CRUSH)数据分布算法导致设备间存储数据容量之差达到40%,进而在数据量大、高并发情况下“热点”成为系统性能瓶颈的问题,本文对CRUSH算法进行深入研究,设计并实现了Writing_Balance算法来对数据分布进行性能优化,以达到消除“热点”所导致的负载失衡以及磁盘利用率过高的问题。通过实验发现,Writing_Balance算法可使“热点”的PG数量分布优化率较之前提升4.4%;磁盘利用率稳定性提高了3%左右;并且在较小输入key空间下对于数据整体均衡度优化也有明显的提升。 展开更多
关键词 Ceph分布式存储 数据分布均衡 可扩展哈希下的受控复制 数据分布算法
下载PDF
基于网络集群系统的并行数据库中数据均衡分布研究 被引量:1
2
作者 杨全胜 徐宏炳 王能斌 《计算机科学》 CSCD 北大核心 2001年第8期32-35,共4页
Base on the character of the cluster of workstation(COW)and the latest development of the parallel computer,this paper analyzes the data deflexion problem in data distributing of parallel DB in COW. On the basis of th... Base on the character of the cluster of workstation(COW)and the latest development of the parallel computer,this paper analyzes the data deflexion problem in data distributing of parallel DB in COW. On the basis of this analysis,we get a dynamic data balanced distributing algorithm which has adaptability. 展开更多
关键词 网络集群系统 并行数据 数据均衡分布 信息处理
下载PDF
一种适用于不均衡数据分布的数据表索引方法
3
作者 牛立强 《新一代信息技术》 2022年第5期56-58,共3页
本文提出的部分索引是一种新的数据库表索引创建方法,它对表中索引列的所有数据值进行统计,将其分为高频数据值和非高频数据值,部分索引仅对非高频数据值创建索引,并将所有高频数据值放入索引开头的高频数据块中.部分索引方法适用于索... 本文提出的部分索引是一种新的数据库表索引创建方法,它对表中索引列的所有数据值进行统计,将其分为高频数据值和非高频数据值,部分索引仅对非高频数据值创建索引,并将所有高频数据值放入索引开头的高频数据块中.部分索引方法适用于索引列数据不均衡分布的场景,可以为SQL查询提供更合理的执行策略.本文具体介绍了部分索引的原理、创建方法以及部分索引场景下SQL语句的执行流程. 展开更多
关键词 表索引 均衡数据分布 部分索引 数据
下载PDF
多子域隔离学习组合决策用于不均衡样本 被引量:2
4
作者 靳燕 彭新光 《计算机应用》 CSCD 北大核心 2016年第9期2475-2480,共6页
为进一步弱化数据不均衡对分类算法的束缚,从数据集区域分布特性着手,提出了不均衡数据集上基于子域学习的复合分类模型。子域划分阶段,扩展支持向量数据描述(SVDD)算法给出类的最小界定域,划分出域内密集区与域外稀疏区。借鉴不同类存... 为进一步弱化数据不均衡对分类算法的束缚,从数据集区域分布特性着手,提出了不均衡数据集上基于子域学习的复合分类模型。子域划分阶段,扩展支持向量数据描述(SVDD)算法给出类的最小界定域,划分出域内密集区与域外稀疏区。借鉴不同类存在相似样本的类重叠概念,对边界样本进行搜索,组合构成重叠域。子域清理阶段,基于邻近算法(KNN)的邻近性假设,结合不同域的密疏程度,设置样本有效性参数,对域内样本逐个检测以清理噪声。各子域隔离参与分类建模,按序组合产生出用于不均衡数据集的复合分类器CCRD。在相似算法对比以及代价敏感Meta Cost对比中,CCRD对正类的正确分类改善明显,且未加重负类误判;在SMOTE抽样比较中,CCRD改善了负类的误判情形,且未影响正类的正确分类;在五类数据集的逐个比较中,CCRD分类性能均有提升,在Haberman_sur的正类分类性能提升上尤为明显。结果表明,基于子域学习的复合分类模型的分类性能较好,是一种研究不均衡数据集的较有效的方法。 展开更多
关键词 均衡数据集区域分布 支持向量数据描述 稀疏域与重叠域 子域隔离学习 复合分类器
下载PDF
Load-balancing data distribution in publish/subscribe mode
5
作者 李凯 汪芸 +1 位作者 殷奕 袁飞飞 《Journal of Southeast University(English Edition)》 EI CAS 2014年第4期428-433,共6页
To improve data distribution efficiency a load-balancing data distribution LBDD method is proposed in publish/subscribe mode.In the LBDD method subscribers are involved in distribution tasks and data transfers while r... To improve data distribution efficiency a load-balancing data distribution LBDD method is proposed in publish/subscribe mode.In the LBDD method subscribers are involved in distribution tasks and data transfers while receiving data themselves.A dissemination tree is constructed among the subscribers based on MD5 where the publisher acts as the root. The proposed method provides bucket construction target selection and path updates furthermore the property of one-way dissemination is proven.That the average out-going degree of a node is 2 is guaranteed with the proposed LBDD.The experiments on data distribution delay data distribution rate and load distribution are conducted. Experimental results show that the LBDD method aids in shaping the task load between the publisher and subscribers and outperforms the point-to-point approach. 展开更多
关键词 data distribution publish/subscribe mode load balance dissemination tree
下载PDF
簇特征加权的模糊紧致散布聚类算法
6
作者 周媛 束星玮 王蕾 《信息与控制》 CSCD 北大核心 2018年第6期722-729,共8页
针对非均衡数据聚类问题,提出了簇特征加权的模糊紧致散布聚类算法.指出了模糊紧致散布聚类算法中模糊隶属度表达式的不足之处,给出了簇特征加权模糊紧致散布聚类算法中样本隶属度的计算公式和各属性对不同类的权重计算公式,并讨论了样... 针对非均衡数据聚类问题,提出了簇特征加权的模糊紧致散布聚类算法.指出了模糊紧致散布聚类算法中模糊隶属度表达式的不足之处,给出了簇特征加权模糊紧致散布聚类算法中样本隶属度的计算公式和各属性对不同类的权重计算公式,并讨论了样本隶属度和属性权重的调整方法.分别将所提算法和模糊紧致散布聚类算法及两种加权聚类算法用于经典数据集.实验结果证明本文算法相对于其它3个算法对分布不均衡的数据划分有更高的准确性和合理性. 展开更多
关键词 簇特征加权 模糊紧致 模糊散布 聚类 分布均衡数据
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部