期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
多字节编码和基于ISO10646的编辑器设计与实现
1
作者 陈景春 蒋尚佳 《计算机应用》 CSCD 1996年第4期14-17,共4页
本文论述了基于ISO10646的编辑器VI/EX的设计与实现。首先对通用多八位编码字符集(UCS)的体系结构及其编码体制作了简要介绍,然后描述了编辑器VI/EX的总体设计。
关键词 iso10646 编辑器 编码 设计 操作系统
下载PDF
一个基于多代码页的中文屏幕实时解释引擎的设计 被引量:2
2
作者 李培峰 朱巧明 钱培德 《中文信息学报》 CSCD 北大核心 2005年第5期90-96,共7页
目前,在计算机中汉字有多种代码页,汉字的多代码页并存现象将长期存在。为了实现汉字多代码页并存,需要汉字代码页自动识别技术的支撑。屏幕实时解释引擎是目前各种在线字典、词典以及教学软件的核心技术,此技术目前存在不能跨代码页,... 目前,在计算机中汉字有多种代码页,汉字的多代码页并存现象将长期存在。为了实现汉字多代码页并存,需要汉字代码页自动识别技术的支撑。屏幕实时解释引擎是目前各种在线字典、词典以及教学软件的核心技术,此技术目前存在不能跨代码页,取词不全面、不正确等缺陷。本文主要针对以上情况,描述了采用汉字内码的代码页自动识别技术以及优化的自动屏幕取词技术的中文屏幕实时解释引擎的系统架构,并阐述了数据词典的设计以及在设计中采用的关键技术。对五百万汉字样本的测试中,应用此引擎的在线词典对有意义短字符串(不包括单字)代码页的识别率可以达到99%以上。 展开更多
关键词 计算机应用 中文信息处理 汉字代码页自动识别 屏幕取词 iso10646
下载PDF
探讨民文版图书馆自动化软件本地化的支持
3
作者 于志敏 《和田师范专科学校学报》 2011年第1期202-203,共2页
Interlib系统采用的是基于Unicode4.0字符编码标准,实现了Windows平台下的网络环境中少数民族文字的显示技术、多编码转换技术和民文文字存储技术,并在此基础上实现并促进少数民族文字信息处理的标准化。本文主要阐述了新疆维吾尔自治... Interlib系统采用的是基于Unicode4.0字符编码标准,实现了Windows平台下的网络环境中少数民族文字的显示技术、多编码转换技术和民文文字存储技术,并在此基础上实现并促进少数民族文字信息处理的标准化。本文主要阐述了新疆维吾尔自治区图书馆所选用的图书馆自动化软件Interlib系统在处理少数民族文字获得本地化支持方面所做具体工作。 展开更多
关键词 UNICODE iso10646 国际编码标准 INTERLIB系统 少数民族
下载PDF
CMCC数据库的汉字缺失现象及其解决方案
4
作者 陈万福 《中华医学图书情报杂志》 CAS 2007年第4期61-64,共4页
总结了《中文生物医学期刊数据库》(CMCC)的汉字缺失现象及其成因,提议:在逐步更新数据库时,立即使用GBK扩充汉字批量替换大部分缺失汉字;安装微软GB18030支持包及Surrogate更新,升级数据库的开发和应用平台,使之完全支持GB18030大字符... 总结了《中文生物医学期刊数据库》(CMCC)的汉字缺失现象及其成因,提议:在逐步更新数据库时,立即使用GBK扩充汉字批量替换大部分缺失汉字;安装微软GB18030支持包及Surrogate更新,升级数据库的开发和应用平台,使之完全支持GB18030大字符集;将来采用ISO10646为构建CMCC数据库的中文字符编码标准,从而完全支持7万字以上的SuperCJK超大字符集等。 展开更多
关键词 中文生物医学期刊数据库 汉字缺失 GB18030 iso10646
下载PDF
基于支持4字节编码汉字的数字化及全文检索发布系统
5
作者 朱人杰 蒋贤春 郑珑 《数字图书馆论坛》 2007年第5期60-67,共8页
全文数字化是信息资源建设的方向,研究型资源的全文化检索尤其重要。计算器现有系统能处理的汉字,对于中文古籍、辞书、人名地名系统、报刊出版远不够用。几年前,国际标准ISO/IEC10646:2003(即Unicode4.0)编码汉字字符集已经拥... 全文数字化是信息资源建设的方向,研究型资源的全文化检索尤其重要。计算器现有系统能处理的汉字,对于中文古籍、辞书、人名地名系统、报刊出版远不够用。几年前,国际标准ISO/IEC10646:2003(即Unicode4.0)编码汉字字符集已经拥有7万余汉字,但其中有4万2千多个汉字是4字节编码,在应用领域的处理方面有一定难度。文章介绍中易公司处理4字节编码汉字的技术成果,并结合在古籍数字化项目中的实际应用,着重说明用自行开发的7万汉字的应用系统,支持数字化工程和全文检索发布的技术特点,强调超大字符集、XML开放数据等标准技术的应用等。通过实践,总结出一套基于支持超大字符集4字节编码汉字的数字化的应用技术,以及信息全文检索发布的可行方法,解决了古籍和文献的数字化工程中的技术难点。 展开更多
关键词 超大字符集 古籍 数字化 全文检索 iso10646-2003 XML
下载PDF
信息时代中汉字的标准化和共通化(三) 被引量:1
6
作者 冯志伟 《术语标准化与信息技术》 1997年第3期31-34,共4页
关键词 汉字编码字符集 标准化 信息时代 汉字信息处理 源字符集 中国大陆 点阵字 汉字标准 通信子集 ISO/IEC10646
下载PDF
中国华诚集团常州华诚信息技术公司中国科学院软件研究所联合推出“华诚”大字符集终端
7
作者 龚滨良 《计算机工程》 CAS CSCD 北大核心 1998年第12期42-42,共页
[本刊讯]正当中国特色的信息处理设备—中西文终端竞争激烈、新品迭出之际,为解决长期困扰汉字业务系统中冷僻汉字使用问题,常州华诚信息技术公司和中科院软件研究所共同研制“华诚”大字符集终端,为我国信息应用又添补了一个实用的... [本刊讯]正当中国特色的信息处理设备—中西文终端竞争激烈、新品迭出之际,为解决长期困扰汉字业务系统中冷僻汉字使用问题,常州华诚信息技术公司和中科院软件研究所共同研制“华诚”大字符集终端,为我国信息应用又添补了一个实用的国有品牌产品。目前当公安、银行、海关、保险等处理人名、地名业务时,常迅GB2312中没有的汉字,传统终端只能通过造字方式解决这个问题,因造了繁琐,容量有限,造字内码随机性,无法交换,不利于系统应用.“华诚”大字符集终端使用的GBK大字符集,向下与现行GB2312—80内码体系兼容,具有20902个汉字,支持ISO10646标准CJK汉字的两字节体系、码长较短、利于存储,提高通信、 展开更多
关键词 信息技术 大字符集 软件研究所 中国科学院 iso10646标准 中西文终端 GB2312 中国特色 信息处理设备 常州
全文增补中
基于ISO/IEC10646的多文种信息处理技术 被引量:1
8
作者 崔冠亚 《解放军外国语学院学报》 CSSCI 1996年第5期113-116,共4页
基于ISO/IEC10646的多文种信息处理技术崔冠亚一、多八位的字符编码结构,是处理多文种字符与符号的良好基础代码是信息技术的基础。面对浩瀚的表意文字,现有的代码体系却往往力不从心。以现有的西文系统为基础开发的中文... 基于ISO/IEC10646的多文种信息处理技术崔冠亚一、多八位的字符编码结构,是处理多文种字符与符号的良好基础代码是信息技术的基础。面对浩瀚的表意文字,现有的代码体系却往往力不从心。以现有的西文系统为基础开发的中文系统或多文种系统,由于受到种种制约... 展开更多
关键词 多文种处理 ISO/IEC10646 信息处理技术 多文种信息处理 计算机输入 计算机世界 通用多八位编码字符集 代码体系 计算机系统 信息技术
下载PDF
维哈柯文数字化综合应用系统研究
9
作者 张东升 殷建民 《信息技术与标准化》 2011年第6期64-68,共5页
介绍了维哈柯文数字化综合应用系统的研究背景、研究内容、系统结构和设计方案。提出了一种各类资源实现数字化的技术方案。实现了资源的数字化处理,使其实现上网浏览和查询。
关键词 维哈柯文 ISO/IEC10646 数字化
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部