期刊文献+

中文全文检索系统中的压缩模型和模式匹配技术 被引量:5

The Compression Scheme and Pattern Matching for Chinese Text
下载PDF
导出
摘要 本文给出了一种适用中文全文检索系统的压缩模型 ,使传统的LZW模型能适用于大字符集语言源文本。方法的关键是通过引入切割标记控制字典多叉树的节点的无限扩大。对文件的检索直接在压缩文件上进行 ,因而可较大地提高检索效率。 We propose an efficient compression scheme for Chinese text which is based on the useful LZW method.The general purpose compression utilities is not suited for Chinese text for its large alphabet.The key technique in our scheme is“Chinese words segment signs”which could reduce the size of the tree dictionary.The retrieve of the document is processed in the compressed file directly,therefore,allowing faster search at the same time.
出处 《中文信息学报》 CSCD 北大核心 2000年第4期42-47,共6页 Journal of Chinese Information Processing
基金 国家 8 6 3项目!(86 3- 30 6 -ZD0 3- 0 4- 1)
关键词 模式匹配 LZW模型 中文全文检索系统 压缩模型 data compression pattern matching full text retrieve
  • 相关文献

参考文献2

  • 1Gu H Y,Computer Processing Chinese Oriental Languages,1997年,10卷,3期,321页
  • 2Chang H K,Computer Processing Chinese Oriental Languages,1993年,7卷,2期,257页

同被引文献15

引证文献5

二级引证文献57

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部