-
题名基于邻接矩阵全文索引模型的文本压缩技术
被引量:1
- 1
-
-
作者
陶晓鹏
胡运发
-
机构
复旦大学计算机系
-
出处
《中文信息学报》
CSCD
北大核心
2004年第1期33-41,共9页
-
文摘
基于不定长单词的压缩模型的压缩效率高于基于字符的压缩模型 ,但是它的最优符号集的寻找算法是NP完全问题 ,本文提出了一种基于贪心算法的计算最小汉字平均熵的方法 ,发现一个局部最优的单词表。这种方法的关键是将文本的邻接矩阵索引作为统计基础 ,邻接矩阵全文索引是论文 [9]提出的一种新的全文索引模型 ,它忠实地反映了原始文本 ,很利于进行原始文本的初步统计 ,因此算法效率得以提高 ,其时间复杂度与文本的汉字种数成线性关系 ,能够适应在线需要。并且 ,算法生成的压缩模型的压缩比是 0 4 7,比基于字的压缩模型的压缩效率提高 2 5 %。
-
关键词
计算机应用
中文信息处理
邻接矩阵
文本压缩
压缩模型
基于不定长单词的huffman编码
-
Keywords
computer application
Chinese information processing
adjacent matrix
text compression
compression model
huffman coding based on length changed words
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名采用多级查找表的定/变长解码引擎
被引量:2
- 2
-
-
作者
黎文
李蜀雄
朱维乐
-
机构
电子科技大学电子技术系
-
出处
《信号处理》
CSCD
2000年第B12期1-7,共7页
-
文摘
本文讨论了采用查找表的PVLD的设计和优化,并推导出求LUT表项数的具体公式.同时,本文在充分考查了FLD和VLD的内部联系的基础上,设计了一种定/变长引擎,利用其中的两个桶形移位器,将定长解码器和变长解码器统一在同一电路中,可根据需要解相应长度的定长码或变长码,而且还能处理具有多个Huffman变长码表的情况.本文最后给出了实验结果.
-
关键词
多级查找表
定长解码
变长解码
huffman编码
-
Keywords
FVLD Multi-leve LUT CPLD MPEG DIgital VIdeo
-
分类号
TN919.81
[电子电信—通信与信息系统]
-