-
题名DM数据库中大规模数据智能自适应压缩算法
被引量:3
- 1
-
-
作者
郭威
方宽
黄慧欣
林俊
-
机构
广东电网有限责任公司信息中心
广东工业大学自动化学院
-
出处
《科学技术与工程》
北大核心
2018年第3期285-290,共6页
-
文摘
DM数据库中存在大量冗余数据,需对其进行压缩处理。传统数据压缩算法大多只追求高压缩率,不能保证数据的完整性;且适用范围小。为此,提出一种新的DM数据库中大规模数据智能自适应压缩算法。给出算法涉及的相关术语,介绍了智能自适应最优消零压缩算法的压缩原理,给出位数因子、编码长度、最优位数因子、最短编码长度以及编码因子的计算过程。在不同时刻对采集的DM数据库中的数据进行排列,通过自适应最优消零压缩算法原理求出数据序列最小编码长度和对应的最优位数因子;依据最优位数因子完成对数据序列的消零计算与编码,删除时间冗余,获取压缩后数据。实验结果表明,所提算法压缩效率高,在保证压缩比的同时,能够保证压缩后数据的完整性,且适用范围广。
-
关键词
dm数据库
大规模
数据
自适应
压缩
-
Keywords
dm database large scale data adaptive compression
-
分类号
TP393.06
[自动化与计算机技术—计算机应用技术]
-
-
题名大数据条件下自适应Huffman算法潜在问题初探
被引量:1
- 2
-
-
作者
蒋刚
肖建
-
机构
西南交通大学计算机与通信工程学院
西南交通大学电气工程学院
-
出处
《信息与电子工程》
2005年第1期28-31,共4页
-
文摘
介绍了自适应Huffman编码算法的原理。根据当前计算机的发展趋势,针对用自适应Huffman编码算法实现大型数据压缩时潜在两类溢出问题,分别从软件和硬件的角度提出了相应的解决方案。用Visual C++编程进行了试验,试验结果较好地验证了理论分析,并表明该解决方案具有较强的可行性和实用性。
-
关键词
计算机科学技术基础学科
自适应
HUFFMAN编码
大型数据压缩
溢出
软件
硬件
-
Keywords
basic subject of computer science and technology: self-adaptive: Huffman coding
large scale data compression: overflow: software
hardware
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-
-
题名达梦数据库中大规模数据可扩展并行算法
被引量:4
- 3
-
-
作者
王建永
林俊
黄杰韬
方宽
-
机构
广东电网有限责任公司信息中心
广东电网有限责任公司东莞供电局
广东工业大学计算机学院
-
出处
《科学技术与工程》
北大核心
2019年第7期134-138,共5页
-
文摘
达梦(DM)数据库中的数据规模大且维度复杂,为了在有限的条件下尽可能满足用户对DM数据库功能的需求,提出一种新的DM数据库中大规模数据可扩展并行算法。不可扩展并行算法包括朴素并行、典型并行与逻辑并行三种处理规则,新算法将这三种处理规则结合起来实现数据自主运算,令每个运算节点均拥有三种处理模式,采用有向图将大规模数据划分为局部数据,并分配到处理器上,通过设置数据处理优先等级,完成流水线形式的数据处理过程,赋予并行算法强大的可扩展性。实验结果表明,新算法具有较强的可扩展性,负债均衡能力强。
-
关键词
dm数据库
大规模数据
可扩展
并行算法
流水线
-
Keywords
dm database
large scale data
scalable
parallel algorithm
pipeline
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-