期刊文献+
共找到42篇文章
< 1 2 3 >
每页显示 20 50 100
文本压缩技术综述 被引量:13
1
作者 方世强 李远清 胡刚 《工业工程》 2002年第2期15-18,共4页
概述了数据压缩的起源及分类 ,并且对其中的一个重要组成部分———文本压缩的各种压缩算法 :Huffman编码 ,算术编码 ,LZ系统算法等进行分析和讨论 。
关键词 数据压缩 文本压缩 呋夫曼算法 算术编码 LZ系列算法 信息处理 图像处理
下载PDF
中文文本压缩的自适应算法 被引量:4
2
作者 贺前华 徐秉铮 彭磊 《中文信息学报》 CSCD 1993年第3期46-54,共9页
本文初步分析了中文文本的存储结构特征,并将其应用于文本压缩,对LZW(Lemple Ziv Welch)算法进行了两方面的改进:1、采用变码长编码,对短文本的压缩有显著的效果;2、建立—删除规则,当码本加满以后对码本进行删除整理,使编码过程一直能... 本文初步分析了中文文本的存储结构特征,并将其应用于文本压缩,对LZW(Lemple Ziv Welch)算法进行了两方面的改进:1、采用变码长编码,对短文本的压缩有显著的效果;2、建立—删除规则,当码本加满以后对码本进行删除整理,使编码过程一直能够积累输入文本的相关信息,对较长文本,其压缩效果比基本LZM算法有显著改善。 展开更多
关键词 文本压缩 中文文本 自适应算法
下载PDF
LZSS文本压缩算法实现与研究 被引量:7
3
作者 王平 茅忠明 《计算机工程》 CAS CSCD 北大核心 2001年第8期22-24,共3页
设计实现了LZSS压缩算法,为了适合于中文压缩,作者对其进行了改进,通过测试证明改进是有效的,相比于标准LZSS12压缩算法,压缩比有了很大幅度的提高,对于中文文本长文件,其最大压缩比已达到20左右,对于英文文本文件... 设计实现了LZSS压缩算法,为了适合于中文压缩,作者对其进行了改进,通过测试证明改进是有效的,相比于标准LZSS12压缩算法,压缩比有了很大幅度的提高,对于中文文本长文件,其最大压缩比已达到20左右,对于英文文本文件的压缩效果也好于LZSS12算法;同时,得出了LZSS算法的极限压缩率,有重要的实际应用价值。 展开更多
关键词 汉字编码 文本压缩算法 LZSS 汉字信息处理 数据压缩
下载PDF
基于LZ77算法的藏文文本压缩算法设计与实现 被引量:1
4
作者 边巴旺堆 武强 +2 位作者 米玛加措 马元强 桑珠 《西藏大学学报(社会科学版)》 CSSCI 2010年第5期50-55,共6页
随着信息量的不断增加,用计算机处理的文本文件越来越大,需要对庞大的藏文文本进行数字化处理,如何节约资源对藏文文本进行高效压缩显得极为重要。项目在LZ77算法基础上结合藏文的特点和当前文本压缩的技术主流完成了关于藏文文本压缩... 随着信息量的不断增加,用计算机处理的文本文件越来越大,需要对庞大的藏文文本进行数字化处理,如何节约资源对藏文文本进行高效压缩显得极为重要。项目在LZ77算法基础上结合藏文的特点和当前文本压缩的技术主流完成了关于藏文文本压缩的设计和实现工作,按照藏文特点有效的提高了藏文文本压缩率。这种压缩算法是针对藏文特点的两个子算法和目前主流的LZ77压缩算法合成的。 展开更多
关键词 藏文 文本压缩 LZ77算法
下载PDF
基于BWT的文本压缩算法研究 被引量:1
5
作者 李彦军 苏红旗 +2 位作者 杨峰 李述迪 姚书科 《计算机技术与发展》 2009年第5期89-92,共4页
为了理解高效的文本压缩算法,探究文本压缩的原理和意义,对基于BWT的字符串轮转理论进行了深入的理解;游程编码作为一种简单有效的压缩方式,在数据压缩中有十分广泛的应用,文本压缩的研究对于多媒体的压缩研究有着十分重要的意义。把BW... 为了理解高效的文本压缩算法,探究文本压缩的原理和意义,对基于BWT的字符串轮转理论进行了深入的理解;游程编码作为一种简单有效的压缩方式,在数据压缩中有十分广泛的应用,文本压缩的研究对于多媒体的压缩研究有着十分重要的意义。把BWT结合游程编码对选定的文本信息进行了压缩比较,实验证明了该算法的高效性和实用性。同时对基于BWT压缩算法的发展趋势进行了展望及分析。 展开更多
关键词 BWT 压缩算法 文本压缩 游程编码
下载PDF
中文文本压缩的 LZSSCH 算法 被引量:12
6
作者 华强 《中文信息学报》 CSCD 北大核心 1998年第1期50-56,共7页
本文结合中文的特点,从建模编码、自适应索引扩位和最大索引位长等方面对LZSS算法进行了修改,得到的LZSSCH算法对以中文为主的中西文混合文本文件的压缩比平均与LZSS算法高出约8%,而其压缩和扩展速度以及可执行程序... 本文结合中文的特点,从建模编码、自适应索引扩位和最大索引位长等方面对LZSS算法进行了修改,得到的LZSSCH算法对以中文为主的中西文混合文本文件的压缩比平均与LZSS算法高出约8%,而其压缩和扩展速度以及可执行程序的大小均与LZSS算法相当。算法无须任何预处理。 展开更多
关键词 数据压缩 LZSS算法 中文文本压缩 LZSSCH算法
下载PDF
大学英语移动学习系统中的文本压缩技术研究 被引量:3
7
作者 胡顺 覃基笙 《科技通报》 北大核心 2012年第6期146-148,共3页
为了节约大学英语移动学习系统中的网络开销成本,提出一种适合当前网络传输状况的文本传输算法就变得十分必要。结合当前的无损压缩算法,采取三重压缩:基于固定字典的文本一次压缩,基于哈弗曼的二次压缩算法,基于编码固定位长算法的三... 为了节约大学英语移动学习系统中的网络开销成本,提出一种适合当前网络传输状况的文本传输算法就变得十分必要。结合当前的无损压缩算法,采取三重压缩:基于固定字典的文本一次压缩,基于哈弗曼的二次压缩算法,基于编码固定位长算法的三次压缩。这种算法可有效节约通讯成本,而且在移动客户端可以拥有高效的解压缩效率。 展开更多
关键词 移动学习系统 文本压缩 大学英语
下载PDF
中西文文本压缩的LZWCH算法 被引量:7
8
作者 华强 《计算机工程与应用》 CSCD 北大核心 1999年第3期22-23,35,共3页
该文根据中文文本的特征对LZW算法从哈希函数、基本码集和更新策略三方面进行修改,得到的LZWCH算法对以中文为主的中西混合文本的压缩比平均比LZW算法高出约16%,压缩和扩展速度也提高约4%,其可执行程序的大小亦与L... 该文根据中文文本的特征对LZW算法从哈希函数、基本码集和更新策略三方面进行修改,得到的LZWCH算法对以中文为主的中西混合文本的压缩比平均比LZW算法高出约16%,压缩和扩展速度也提高约4%,其可执行程序的大小亦与LZW相当。LZWCH无须任何预处理,并可用于压缩其它非拼音文字文本文件。 展开更多
关键词 数据压缩 LZWCH算法 文本压缩 汉字信息处理
下载PDF
汉语文本压缩研究及其应用 被引量:9
9
作者 王忠效 《中文信息学报》 CSCD 北大核心 1997年第3期57-64,共8页
汉语文本压缩至今很少受到重视,然而,作为许多计算机应用系统的支撑技术,其重要性毋庸置疑。本文结合汉语文本的特征对现行文本压缩技术进行评述,指出汉语文本理论上可能获得的平均压缩比率(〉3.9)及现行压缩算法所能达到的水... 汉语文本压缩至今很少受到重视,然而,作为许多计算机应用系统的支撑技术,其重要性毋庸置疑。本文结合汉语文本的特征对现行文本压缩技术进行评述,指出汉语文本理论上可能获得的平均压缩比率(〉3.9)及现行压缩算法所能达到的水平(1.6左右)。此外,讨论了汉语文本压缩的研究方向以及几种典型的应用。 展开更多
关键词 汉语文本压缩 算术编码 数据压缩
下载PDF
通用简易中文文本压缩方法研究 被引量:1
10
作者 游荣彦 李吉桂 《华南师范大学学报(自然科学版)》 CAS 2001年第2期84-88,共5页
该文把GB2 312 - 80的汉字转换为从 0至 6767的短整型数 ,这些短整型数据有一个共同的存储特点 :它们的 2字节中的高 3位 (称为冗余位 )皆为 0 .删除冗余位而重组其余位即可形成压缩文本 .这种压缩方法显然是简单、快捷、容易实现和对GB... 该文把GB2 312 - 80的汉字转换为从 0至 6767的短整型数 ,这些短整型数据有一个共同的存储特点 :它们的 2字节中的高 3位 (称为冗余位 )皆为 0 .删除冗余位而重组其余位即可形成压缩文本 .这种压缩方法显然是简单、快捷、容易实现和对GB2 312 - 展开更多
关键词 文本压缩 LZ算法 按位与运算 汉字数值化 短整型数据 冗余位 无损压缩
下载PDF
在文本压缩中联合使用LZSS和LZW 被引量:3
11
作者 华强 《计算机应用与软件》 CSCD 北大核心 2002年第1期60-62,共3页
本文分析了LZ77和LZ78算法在文本压缩中各自的长处和不足,以它们的实用算法LZSS和LZW的中文文本改进算法LZSSCH和LZWCH为基础,设计了联合使用LZ77和LZ78原理的LZSWCH算法。算法具有良好的通用性、实时性,对9个各种长度的样本文本文件取... 本文分析了LZ77和LZ78算法在文本压缩中各自的长处和不足,以它们的实用算法LZSS和LZW的中文文本改进算法LZSSCH和LZWCH为基础,设计了联合使用LZ77和LZ78原理的LZSWCH算法。算法具有良好的通用性、实时性,对9个各种长度的样本文本文件取得的压缩比均高于LZSS和LZW,高出幅度分别达到6~19%。算法无须任何预处理,并可用于压缩其它文字的文本文件。 展开更多
关键词 数据压缩 LZSS LZW 文本压缩 数据结构
下载PDF
基于邻接矩阵全文索引模型的文本压缩技术 被引量:1
12
作者 陶晓鹏 胡运发 《中文信息学报》 CSCD 北大核心 2004年第1期33-41,共9页
基于不定长单词的压缩模型的压缩效率高于基于字符的压缩模型 ,但是它的最优符号集的寻找算法是NP完全问题 ,本文提出了一种基于贪心算法的计算最小汉字平均熵的方法 ,发现一个局部最优的单词表。这种方法的关键是将文本的邻接矩阵索引... 基于不定长单词的压缩模型的压缩效率高于基于字符的压缩模型 ,但是它的最优符号集的寻找算法是NP完全问题 ,本文提出了一种基于贪心算法的计算最小汉字平均熵的方法 ,发现一个局部最优的单词表。这种方法的关键是将文本的邻接矩阵索引作为统计基础 ,邻接矩阵全文索引是论文 [9]提出的一种新的全文索引模型 ,它忠实地反映了原始文本 ,很利于进行原始文本的初步统计 ,因此算法效率得以提高 ,其时间复杂度与文本的汉字种数成线性关系 ,能够适应在线需要。并且 ,算法生成的压缩模型的压缩比是 0 4 7,比基于字的压缩模型的压缩效率提高 2 5 %。 展开更多
关键词 计算机应用 中文信息处理 邻接矩阵 文本压缩 压缩模型 基于不定长单词的Huffman编码
下载PDF
论文本压缩技术的发展 被引量:1
13
作者 张进 《情报理论与实践》 CSSCI 北大核心 1996年第3期42-46,19,共6页
张进(武汉大学图书情报学院湖北430072)论文本压缩技术的发展AbstractAfterclasifyingthecurrentful-textcompressionmethods,theanthorpre-sen... 张进(武汉大学图书情报学院湖北430072)论文本压缩技术的发展AbstractAfterclasifyingthecurrentful-textcompressionmethods,theanthorpre-sentsmodifiedHufmanc... 展开更多
关键词 文本压缩 情报检索系统 数据库 计算机
下载PDF
一种用于藏英文混合文本压缩的改进LZW算法 被引量:1
14
作者 李加才让 安见才让 《软件工程》 2017年第6期5-7,4,共4页
随着藏文信息处理技术的发展,藏文压缩也成了必不可少的一门研究内容。但是目前的研究成果只有一个,然而现实环境中需要一个适应于不同场合的藏文文本压缩技术。该文根据藏文文本的特点,提出两种改进的LZW数据压缩算法对藏英文混合文本... 随着藏文信息处理技术的发展,藏文压缩也成了必不可少的一门研究内容。但是目前的研究成果只有一个,然而现实环境中需要一个适应于不同场合的藏文文本压缩技术。该文根据藏文文本的特点,提出两种改进的LZW数据压缩算法对藏英文混合文本进行数据压缩并无损解压。通过实验结果表明,该算法是一个适应于不同场合的文本压缩技术。 展开更多
关键词 LZW算法 藏文 英文 文本压缩
下载PDF
汉字文本压缩的研究
15
作者 王世卿 《计算机应用与软件》 CSCD 1995年第5期1-4,共4页
本文讨论了文本压缩的几种模式及常用技术,介绍了两种新的文本压缩方法——算术编码法和LZ字典压缩方法。分析了中、英文文本之间的不同,提出了几种适合于汉字文本压缩的技术。
关键词 文本压缩 自适应编码 汉字信息处理 词典压缩
下载PDF
基于互关联后继树的文本压缩 被引量:2
16
作者 申晓霞 胡运发 《计算机工程与应用》 CSCD 北大核心 2007年第6期168-170,共3页
主要提出了使用互关联后继树来实现文本压缩的方法。利用互关联后继树的检索功能可以方便地查找最长匹配串,从而达到更好的文本压缩效果。从实验结果上来看,这种方法压缩率高于LZW,有好的实用性。
关键词 互关联后继树 LZW 文本压缩
下载PDF
一种Symbian S60数据库应用中的文本压缩方法
17
作者 包长明 陈继忠 付萍 《计算机应用与软件》 CSCD 北大核心 2012年第5期181-183,共3页
为了提高Symbian S60数据库中文本数据存储的效率,同时使数据库应用具有良好的响应速度,在研究该类数据库的特点和"字典码"压缩算法的基础上,提出通过提取隐含在"字典码"压缩算法压缩的文件中的字典并独立存储和维... 为了提高Symbian S60数据库中文本数据存储的效率,同时使数据库应用具有良好的响应速度,在研究该类数据库的特点和"字典码"压缩算法的基础上,提出通过提取隐含在"字典码"压缩算法压缩的文件中的字典并独立存储和维护,实现对数据库记录级的文本压缩。该方法只有在用户用到数据库记录数据时,相应记录中被压缩的数据才被解压缩,因此数据库的响应速度快,内存占用也更少,开始运行软件时数据库加载也更快。该方法在数据记录短,文本数据量大的数据库应用中更具有优势。 展开更多
关键词 SYMBIAN S60 数据库 文本压缩 智能手机 字典码
下载PDF
Web开发者需要了解的文本压缩
18
作者 Colt McAnlis 《程序员》 2014年第1期124-126,共3页
互联网上绝大多数文本数据都由HTML、JavaScript和CSS写成。这些格式大多不能采用有损压缩,因而其压缩率通常不及可失真图片或视频。开发者如何有效缩减WebApplier,又不至于大动干戈呢?本文将介绍一系列方法和流程。
关键词 开发者 文本压缩 JAVASCRIPT WEB HTML 文本数据 有损压缩 互联网
下载PDF
中文文本简易压缩与即时加密研究 被引量:1
19
作者 游荣彦 《计算机工程与设计》 CSCD 北大核心 1999年第6期41-45,共5页
基于位处理技术,提出一个简易快捷的中文文本压缩方法,针对既要压缩又要加密的常见情况,给出同时完成两项任务的新方法,此法的关键是在压缩文尚未形成之前,交换被压缩数据的位(bits)。这种把压缩与加密合于一体的做法,可明... 基于位处理技术,提出一个简易快捷的中文文本压缩方法,针对既要压缩又要加密的常见情况,给出同时完成两项任务的新方法,此法的关键是在压缩文尚未形成之前,交换被压缩数据的位(bits)。这种把压缩与加密合于一体的做法,可明显减少时间开销,增强压缩密文的安全性。 展开更多
关键词 文本加密 C++语言 中文文本压缩 信息处理
下载PDF
中文文本自适应压缩模型
20
作者 鲍敢峰 刘宗田 《电子学报》 EI CAS CSCD 北大核心 1997年第8期45-47,共3页
自然语言文本的压缩是数据压缩的重要应用领域.文本压缩的关键在于构造适当的模型.本文介绍的压缩模型是一种基于知识的主动模型,它具有中文字词识别、自适应调整,以及自适应学习的能力.试验表明,该模型取得了良好的压缩效果.
关键词 文本压缩 自适应压缩模型 数据压缩
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部