基于变长编码集合扩展的中文文本压缩算法被引量：2

Compression Algorithm for Unfixed Length Encoding Set Expansion

下载PDF

导出

摘要为了获取压缩中文文本的高压缩比 ,变长编码集合扩展的中文文本压缩算法依据中文语言文字的特点 ,以不等长高概率汉字串为单位 ,定义固定字典集 ,同时寻求高压缩率的匹配方式进行编码 .算法的编码转换过程适应了自然语言中的部分马尔可夫过程 ,相对于不同文本长度及文体风格压缩比分布均衡 . In order to get high compression ratio for a compresed Chinese text, the compression algorithm for unfixed length encoding set expansion encodes the text by matching for high compression ratio, based on a set of fixed dictionaries that comprise unfixed length and high frequency Chinese character strings following features of the Chinese language. This algorithm fits the Chinese character string as Markov message source. It also suits different lengths and the language style of the source data. This algorithm can result in higher compression ratio.

作者刘来旸樊孝忠李淑芳

机构地区北京理工大学计算机科学与工程系

出处《北京理工大学学报》 EI CAS CSCD 北大核心 2001年第4期480-484,共5页 Transactions of Beijing Institute of Technology

关键词中文文本数据压缩压缩算法无损压缩变长编码集合压缩率编码转换 Chinese text data compression compression algorithm lossless compression

分类号 TP391.1 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献3

1华强.中文文本压缩的 LZSSCH 算法[J].中文信息学报,1998,12(1):50-56. 被引量：12
2吴乐南，数据压缩的原理与应用，1995年
3冯志伟，中文信息处理与汉语研究，1992年

二级参考文献6

1吴军，电子学报，1996年，24卷，10期
2王忠效，计算机研究与发展，1996年，33卷，5期
3吴乐南，数据压缩的原理与应用，1995年
4侯阳，数据压缩的原理及应用，1994年
5贺前华，中文信息学报，1993年，7卷，3期
6徐秉铮，华南理工大学学报，1989年，17卷，3期

共引文献11

1常为领,方滨兴,云晓春,王树鹏,余翔湛.一种支持ANSI编码的中文文本压缩算法[J].中文信息学报,2010,24(5):96-105. 被引量：5
2郑翠芳.几种常用无损数据压缩算法研究[J].计算机技术与发展,2011,21(9):73-76. 被引量：46
3王忠效,范植华.汉语文本动态字母表0阶模型算术编码[J].中文信息学报,2000,14(1):39-47. 被引量：1
4华强.LZ77和LZ78在数据压缩中的组合带参运用[J].小型微型计算机系统,2000,21(2):211-215. 被引量：6
5王平,茅忠明.中文文本的LZSS算法实现及研究[J].微电子学与计算机,2001,18(2):14-17. 被引量：4
6游荣彦,李吉桂.通用简易中文文本压缩方法研究[J].华南师范大学学报（自然科学版）,2001,33(2):84-88. 被引量：1
7王平,茅忠明.LZSS文本压缩算法实现与研究[J].计算机工程,2001,27(8):22-24. 被引量：7
8华强.在文本压缩中联合使用LZSS和LZW[J].计算机应用与软件,2002,19(1):60-62. 被引量：3
9曾党泉.基于PDC编码的中文文本压缩算法[J].计算机工程与应用,2015,51(17):205-209. 被引量：1
10闫亮,李永斌.计算机网络传输中有效压缩数据的方法研究[J].通讯世界,2016,22(8):20-21. 被引量：1

同被引文献6

1[3]袁枚,袁文.数据压缩技术及其应用.北京:电子工业出版社,1995
2白跃彬,刘轶,郑守淇,侯宗浩.远程访问安全认证方案的设计与分析[J].西安交通大学学报,2001,35(8):829-833. 被引量：5
3王平,茅忠明.LZSS文本压缩算法实现与研究[J].计算机工程,2001,27(8):22-24. 被引量：7
4吕勇.解决网络传输安全问题的基本技术[J].飞行器测控学报,2001,20(3):90-94. 被引量：2
5钱桂琼,杨泽明,许榕生.计算机取证的研究与设计[J].计算机工程,2002,28(6):56-58. 被引量：55
6赵小敏,侯强,陈庆章.系统日志的安全管理方案与分析处理策略[J].计算机工程与科学,2003,25(3):44-47. 被引量：10

引证文献2

1何昭青.运用Huffman编码进行数据压缩的新算法[J].科学技术与工程,2008,8(16):4531-4535. 被引量：4
2黄文,文春生,欧红星.分布式网络系统日志的安全性研究[J].零陵学院学报,2004,25(3):66-68. 被引量：2

二级引证文献6

1杨卫平,黄烟波,段丹青,黄伟平.基于协议分析的网络入侵动态取证系统设计[J].计算机技术与发展,2006,16(4):215-217. 被引量：5
2段丹青,杨卫平,黄伟平.计算机入侵动态取证技术研究[J].湖南公安高等专科学校学报,2005,17(6):67-70.
3朱为朝,王福龙,黎志光.一种新的基于零树小波的图像压缩编码算法[J].广东工业大学学报,2009,26(1):33-35. 被引量：1
4卢小杰,沈炜,高其涛,凡颖.可中断的非对称数据流压缩算法研究与应用[J].工业控制计算机,2013,26(5):70-71. 被引量：1
5陈耀立,金敏.GPS数据的纯数字化协同压缩算法[J].计算机与现代化,2014(8):101-105. 被引量：1
6黄燕,李祥.基于FPGA的传感器数据采集及数据压缩传输系统的研究[J].信息与电脑（理论版）,2010(12):150-150.

1徐祥生.基于校园网的无线覆盖和接入的建设方法探讨[J].安阳工学院学报,2012,11(6):52-54.
2卢志翔,蒙丽莉.文本分类中特征项权重算法的改进[J].柳州师专学报,2011,26(4):128-131. 被引量：1
3付欢,龙海南,韩晓霞.基于冗余字典的高光谱图像的稀疏分解[J].河北软件职业技术学院学报,2013,15(4):53-55.
4版块导读[J].中国信息界,2005(9):11-11.
5张伟伟,王俊,秦琳琳,吴刚.一种基于能量和位置的LEACH协议优化[J].计算机仿真,2010,27(3):136-139. 被引量：3
6石君.来之不易的注射器[J].科学启蒙,2014(6):20-23. 被引量：1
7邬皓天.微博在网络营销中的应用[J].河南科技,2012,31(6):16-17. 被引量：2
8刘博涵.好玩的文字[J].小学生导刊（中年级版）,2013(5):46-46.
9满载亲情爱普生墨仓式L455打印机[J].新潮电子,2015,0(8):96-96.
10魏威,林腾.我想长高点儿！[J].博物,2005(7):12-13.

北京理工大学学报

2001年第4期

浏览历史

内容加载中请稍等...

基于变长编码集合扩展的中文文本压缩算法被引量：2

参考文献3

二级参考文献6

共引文献11

同被引文献6

引证文献2

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

基于变长编码集合扩展的中文文本压缩算法 被引量：2

参考文献3

二级参考文献6

共引文献11

同被引文献6

引证文献2

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

基于变长编码集合扩展的中文文本压缩算法被引量：2