期刊文献+
共找到40篇文章
< 1 2 >
每页显示 20 50 100
语句拼音-汉字转换的智能处理机制分析 被引量:13
1
作者 章森 宗成庆 +1 位作者 陈肇雄 黄河燕 《中文信息学报》 CSCD 北大核心 1998年第2期37-43,共7页
语句拼音-汉字转换是中文信息处理研究的一个重要方面,是键盘汉字输入和语音输入的核心技术,其主要特征是对动态输入的拼音串进行词法分析,给出所有可能的汉语句子,然后对这些汉语句子根据上下文环境进行句法分析和语义分析,动态... 语句拼音-汉字转换是中文信息处理研究的一个重要方面,是键盘汉字输入和语音输入的核心技术,其主要特征是对动态输入的拼音串进行词法分析,给出所有可能的汉语句子,然后对这些汉语句子根据上下文环境进行句法分析和语义分析,动态调整句子中的字词,输出最佳结果。近年来,语句拼音-汉字转换系统大量应用了人工智能技术和机器翻译的理论,以期提高系统转换的准确率和增强系统的智能处理功能。本文分析了语句拼音-汉字转换系统所采用的核心技术,即知识支持、自动分词和动态调整等,讨论了语句拼音-汉字转换的处理方法和过程,知识库的组成结构,用于拼音串自动分词的算法和实现,音字转换中动态调整的概率模型等,本文还分析了现有语句拼音-汉字转换系统在拼音串自动分词和音字转换的动态调整中发生错误的原因。 展开更多
关键词 自动分词 中文信息处理 人工智能 拼音-汉字转换
下载PDF
智能拼音-汉字转换系统实现研究 被引量:2
2
作者 万建成 万芳 孙英明 《山东大学学报(工学版)》 CAS 2002年第5期420-426,共7页
本拼音 -汉字智能转换系统的主要特征 ,是利用扩充的LR句法分析和基于二元语义的类属语义分析方法消除同音词的歧义干扰 ,提高转换的正确率 针对汉语语法特征 ,阐述了汉语语法分析中的两种回溯 ,并扩展了传统LR分析方法 ,提高了语法分... 本拼音 -汉字智能转换系统的主要特征 ,是利用扩充的LR句法分析和基于二元语义的类属语义分析方法消除同音词的歧义干扰 ,提高转换的正确率 针对汉语语法特征 ,阐述了汉语语法分析中的两种回溯 ,并扩展了传统LR分析方法 ,提高了语法分析的完备性 为有效地实施语义分析 ,探讨了所使用的类属及类属关系 ,它以一种简单而有效的方式建立、维护和使用句法和语义知识 随着句法和语义知识的不断丰富完善 。 展开更多
关键词 智能拼音-汉字转换系统 语法分析 语义分析 类属关系 汉语自然语言处理 LR分析方法
下载PDF
IBM大型机与小型机间汉字转换解决方案 被引量:2
3
作者 翟凌慧 马少平 《中文信息学报》 CSCD 北大核心 2001年第6期59-64,共6页
本文描述了在IBM的大型机ES/90 0 0 (基于MVS/VSE操作系统 )与小型机RS/60 0 0 (基于AIX操作系统 )间通过CICS传输中文数据存在的数据转换问题 ,分析了汉字E BCDIC码与汉字ASCII码单纯通过CICS配置不能正确转换的原因 ,给出了两种解决方... 本文描述了在IBM的大型机ES/90 0 0 (基于MVS/VSE操作系统 )与小型机RS/60 0 0 (基于AIX操作系统 )间通过CICS传输中文数据存在的数据转换问题 ,分析了汉字E BCDIC码与汉字ASCII码单纯通过CICS配置不能正确转换的原因 ,给出了两种解决方案 :第一种方案通过CICS程序、JAVA程序、CICS配置结合实现汉字转换 ;第二种方案只通过JA VA程序。 展开更多
关键词 汉字转换 CICS Java EBCDIC IBM ES/9000 RS/6000 中文数据传输 数据转换
下载PDF
利用vc^(++)实现汉字转换unicode码的技术研究 被引量:2
4
作者 王聪 赵鹏飞 +1 位作者 刘宇 杨之文 《现代商贸工业》 2009年第10期264-265,共2页
Unicode作为一种国际标准字符集,为世界上绝大多数已知的字符集定义了唯一的二进制16位数值,以满足跨语言、跨平台进行文本转换、处理的要求,避免了不同编码系统互相冲突的问题。应用unicode码转换实现基于AT指令的中文短信的发送和读... Unicode作为一种国际标准字符集,为世界上绝大多数已知的字符集定义了唯一的二进制16位数值,以满足跨语言、跨平台进行文本转换、处理的要求,避免了不同编码系统互相冲突的问题。应用unicode码转换实现基于AT指令的中文短信的发送和读写。对手机中文输入法的发展具有一定的理论价值和现实意义。 展开更多
关键词 UNICODE码 VC++ 汉字转换
下载PDF
基于概率潜在语义分析优化拼音汉字转换 被引量:1
5
作者 郑叶清 刘功申 《信息技术》 2016年第11期33-37,41,共6页
文中拼音汉字转换在中文处理中有诸多应用。文中提出基于概率潜在语义获取拼音汉字转换过程之中文本所存在的潜在语义知识,从而将长距离的语义知识与拼音汉字转换模型相结合,提升汉字转换准确率;同时在实验中研究引入更多文本知识增强... 文中拼音汉字转换在中文处理中有诸多应用。文中提出基于概率潜在语义获取拼音汉字转换过程之中文本所存在的潜在语义知识,从而将长距离的语义知识与拼音汉字转换模型相结合,提升汉字转换准确率;同时在实验中研究引入更多文本知识增强模型性能,优化了拼音汉字转换模型应用效果。 展开更多
关键词 概率潜在语义分析 拼音汉字转换 统计语言模型
下载PDF
汉语音节→汉字转换中的动态语境学习
6
作者 罗小强 王仁华 《计算机研究与发展》 EI CSCD 北大核心 1994年第11期39-43,共5页
本文从语言使用的局部性原理出发,引入动态语境网的概念,提出了在汉语音节→汉字转换中的动态语境学习方法,有效地提高了音节汉字的转换正确率。
关键词 汉语音节 汉字转换 动态语境学习 信息处理
下载PDF
海峡两岸农产品物流信息的汉字转换系统的研究 被引量:1
7
作者 侯济恭 王维龙 《农业网络信息》 2014年第7期5-9,64,共6页
分析大陆和台湾的在农业方面的语言差异、简繁体的编码问题和两岸文字的语义差别,在此基础上提出两岸文字转化的规则。研究中文分词、多目标字词消歧和人工辅助转换等主要转换技术,重点研究语境模糊匹配消歧,即设立语境库并通过语境模... 分析大陆和台湾的在农业方面的语言差异、简繁体的编码问题和两岸文字的语义差别,在此基础上提出两岸文字转化的规则。研究中文分词、多目标字词消歧和人工辅助转换等主要转换技术,重点研究语境模糊匹配消歧,即设立语境库并通过语境模糊匹配算法,来减少单字转换时出现的歧义现象。采用双数组Trie树的索引结构和逆向最大匹配的分词算法、KMP模式匹配算法等,提出面向两岸农产品物流信息的汉字转换系统设计方案,并在基于物联网的海峡两岸农产品物流商务平台中予以实现,取得较好效果。 展开更多
关键词 海峡物流 信息翻译 汉字转换 农产品 中文分词
下载PDF
扩展词组数最小法的假名汉字转换
8
作者 中岛晃 河野胜也 《中文信息学报》 CSCD 北大核心 1998年第4期30-38,共9页
本文描述了改进后的“词组最小法”、并提出了新算法。它被名为“扩展词组最小法”。重新定义了句子中词组的计算方法。为了实现此目标,从始读到句子假名的全部读入,将词库查询及语法检查的结果以“树”型数据加以保留。采用上述算法... 本文描述了改进后的“词组最小法”、并提出了新算法。它被名为“扩展词组最小法”。重新定义了句子中词组的计算方法。为了实现此目标,从始读到句子假名的全部读入,将词库查询及语法检查的结果以“树”型数据加以保留。采用上述算法后,以假名文字为单位的变换率可达95.8%;以词组为单位的变换率可达88.9%。 展开更多
关键词 词法分析 词组数最小法 假名汉字转换 文字处理
下载PDF
用网络[定向图]实现形态素之间的接续提高假名汉字转换的用户操作性能
9
作者 中岛晃 河野胜也 《中文信息学报》 CSCD 北大核心 2001年第3期57-64,共8页
本文描述了把扩展句节数最小法进行形态素解析的结果登录在网络 [定向图 ]上 ,并把这个网络 [定向图 ]保留在计算机的内存中直到修改操作结束 ,实现了在不同句节切分的各种选择候补中取出所需候补。再根据所选候补去检索网络 [定向图 ]... 本文描述了把扩展句节数最小法进行形态素解析的结果登录在网络 [定向图 ]上 ,并把这个网络 [定向图 ]保留在计算机的内存中直到修改操作结束 ,实现了在不同句节切分的各种选择候补中取出所需候补。再根据所选候补去检索网络 [定向图 ]上的路径 ,就可以得到符合操作者意图的全句的转换结果 ,从而使日文汉字输入时所需的假名汉字转换操作简单易行 ,提高了操作性能。 展开更多
关键词 网络定向图 扩展向节数最小法 假名汉字转换 汉字输入法
下载PDF
自动分词拼音汉字转换系统
10
《中国科技产业》 1995年第3期60-60,共1页
关键词 自动分词 拼音汉字转换系统 转换 汉字操作系统
下载PDF
一种简便的阿拉伯数字/汉字转换算法模型
11
作者 封方初 《电脑开发与应用》 2008年第2期75-75,共1页
关键词 阿拉伯数字 算法模型 汉字转换 十进制数字 简便 数字表示 人民币 币值
下载PDF
INFORMIX—4GL阿拉伯数字到汉字转换的程序实现
12
作者 马其林 《电脑技术信息》 1999年第2期38-39,共2页
关键词 INFORMIX-4GL 阿拉伯数字 汉字转换程序 银行
下载PDF
基于汉字简繁转换的汉日神经机器翻译数据增强研究
13
作者 张津一 高忠辉 郭聪 《人工智能与机器人研究》 2023年第2期69-76,共8页
本文提出了一种基于汉字简繁转换的神经机器翻译(Neural Machine Translation, NMT)数据增强方法,旨在通过利用简繁转换表将源端文字替换为目标端文字,从而融合汉字简繁转换信息,并提高翻译质量。本文将此方法应用于汉日机器翻译任务,... 本文提出了一种基于汉字简繁转换的神经机器翻译(Neural Machine Translation, NMT)数据增强方法,旨在通过利用简繁转换表将源端文字替换为目标端文字,从而融合汉字简繁转换信息,并提高翻译质量。本文将此方法应用于汉日机器翻译任务,实验结果表明此方法是一种有效的数据增强方法,可以显著地提高汉日机器翻译质量。 展开更多
关键词 神经机器翻译 简繁汉字转换 数据增强 汉日翻译
下载PDF
拼音到汉字自动转换技术的改进与实现 被引量:4
14
作者 刘佳 韩秀玲 《科学技术与工程》 2007年第24期6348-6352,共5页
拼音到汉字转换一直是中文信息处理研究的一个重要方面。在前人的基础上改进了他们所使用的数据平滑算法,给出了两种应用于不同场合的公式,使得在结果中能够得到不同要求的解。同时,给出了利用隐马尔可夫模型(HMM)来设计实现这样一种转... 拼音到汉字转换一直是中文信息处理研究的一个重要方面。在前人的基础上改进了他们所使用的数据平滑算法,给出了两种应用于不同场合的公式,使得在结果中能够得到不同要求的解。同时,给出了利用隐马尔可夫模型(HMM)来设计实现这样一种转换,并且利用Viterbi算法来对模型进行求解的设计细节与方法。最后利用随意选择的语料库来对计算机进行训练学习并给出了测试结果,同时分析了错误结果的原因。 展开更多
关键词 拼音汉字转换 隐马尔可夫模型 VITERBI 语料库学习 数据平滑
下载PDF
用过滤器实现Web网站汉字简繁体自动转换 被引量:1
15
作者 张震 张曾科 《中文信息学报》 CSCD 北大核心 2001年第1期53-58,共6页
本文对网络上汉字的显示与传输进行了研究 ,提出一种新的在Web服务器端直接解决汉字繁简体内码转换的方案 ,使得只有一种内码的中文主页也可以自动地对不同内码浏览器提供支持 ,而不必要求客户端安装软件。
关键词 WEB 汉字内码 ISAPI 过滤器 汉字简繁体自动转换 内码转换 动态网页
下载PDF
C#中数字到汉字货币格式转换类的设计与实现
16
作者 张更路 张霞 赵良君 《电脑知识与技术》 2006年第12期143-143,171,共2页
本文对财务报表中数字金额转换为自由格式汉字表示的难点及算法做了具体分析,并给出了完整的C#中数字到汉字货币格式转换类的设计代码及应用示例。
关键词 财务报表 C# 汉字货币格式转换
下载PDF
韩国一机构开发韩文汉字转换软件
17
《海外华文教育动态》 2016年第8期122-122,共1页
韩国传统文化研究会下设的东洋古典数字化研究所近日发布了名为“汉字路”的转换韩文中汉字的软件。
关键词 汉语教学 海外文化 教育动态 韩文汉字转换软件
原文传递
利用SQL SERVER实现拼音简码自动转换汉字 被引量:1
18
作者 姚刚 高勇 《漯河职业技术学院学报》 2010年第2期9-10,共2页
在管理系统的开发中如何发挥程序优势,使用户汉字数据的输入更加简单,是程序员面临的一个新课题。本文利用SQL SERVER的排序规则,通过在SQL SERVER中自定义函数实现了拼音简码自动转换汉字的功能。
关键词 排序规则 SQL SERVER 拼音转换汉字
下载PDF
面向信息系统跨平台轻量应用的汉字编码转换程序 被引量:1
19
作者 葛光富 《计算机系统应用》 2020年第7期251-255,共5页
国标码如GB18030是我国的汉字编码国家标准,UTF-8是国际字符编码,在国际化的今天这些编码方式在中文信息环境中同时存在并有着不少的使用.为兼容与已有系统的如文本、协议的汉字交互处理,新开发的信息系统必然需要将上述形式编码的汉字... 国标码如GB18030是我国的汉字编码国家标准,UTF-8是国际字符编码,在国际化的今天这些编码方式在中文信息环境中同时存在并有着不少的使用.为兼容与已有系统的如文本、协议的汉字交互处理,新开发的信息系统必然需要将上述形式编码的汉字进行编码转换.本文介绍了常用的汉字编码,并详细说明了一种面向信息系统轻量应用的汉字编码转换程序,该程序支持跨操作系统平台复用. 展开更多
关键词 信息系统 跨平台 轻量 汉字编码转换 国标码
下载PDF
UNIX操作系统下汉字内码转换
20
作者 卢胜利 《电脑技术信息》 2000年第12期42-43,共2页
本文介绍了unix操作系统下由于终端汉字内码设置问题赞成汉字不能正确识别的解决方法。
关键词 银行 储蓄 汉字内码转换 操作系统 UNIX
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部