期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
邮件内容过滤的中文编码盲识别算法 被引量:1
1
作者 祝佳 李生红 李建华 《计算机工程与应用》 CSCD 北大核心 2005年第10期131-133,共3页
邮件内容过滤是信息安全领域的重点课题。文章着重介绍了一种中文文本编码自动识别算法,可以对目前互联网通信所使用的各种常用中文编码(GB2312,GBK,BIG5,UNICODE)进行盲识别,基本解决乱码问题,从而降低邮件内容过滤系统的虚警和漏警率... 邮件内容过滤是信息安全领域的重点课题。文章着重介绍了一种中文文本编码自动识别算法,可以对目前互联网通信所使用的各种常用中文编码(GB2312,GBK,BIG5,UNICODE)进行盲识别,基本解决乱码问题,从而降低邮件内容过滤系统的虚警和漏警率,提高其处理范围。 展开更多
关键词 中文编码 邮件过滤 高频字符 GB2312 gbk BIG5 unicode UTF
下载PDF
浅谈CALIS联机编目系统中的字符集问题 被引量:5
2
作者 王燕 陈金莉 《图书情报工作》 CSSCI 北大核心 2005年第10期114-118,共5页
介绍目前主要的中文编码系统,如GB2312、GBK、Unicode、BIG5等,并形象地解释这些字符集之间的包容关系,指出由于应用程序的运行环境不同,导致字符集之间转码出现问题;深入分析CALIS联机编目系统中遇到的字符集问题,包括检索、显示、排... 介绍目前主要的中文编码系统,如GB2312、GBK、Unicode、BIG5等,并形象地解释这些字符集之间的包容关系,指出由于应用程序的运行环境不同,导致字符集之间转码出现问题;深入分析CALIS联机编目系统中遇到的字符集问题,包括检索、显示、排序、著录繁体字、异体字、小语种时的问题,并提出相应的解决方案。 展开更多
关键词 中文编码系统 unicode gbk 简繁体
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部