期刊文献+
共找到33篇文章
< 1 2 >
每页显示 20 50 100
音字转换中的机器学习研究 被引量:7
1
作者 王晓龙 王开铸 +1 位作者 孙希文 王英伟 《计算机学报》 EI CSCD 北大核心 1993年第5期370-377,共8页
本文提出了音字转换学习系统的模型,给出了它所采用的三种机器学习形式:单词学习,规则学习,参数修正学习、单词以及规则的自动获取用于确定的推理机制,而非确定规则的自动获取以及可信度函数的自适应调整主要用于概率推理上,基于上述学... 本文提出了音字转换学习系统的模型,给出了它所采用的三种机器学习形式:单词学习,规则学习,参数修正学习、单词以及规则的自动获取用于确定的推理机制,而非确定规则的自动获取以及可信度函数的自适应调整主要用于概率推理上,基于上述学习机制所进行的数万字的学习实验结果表明,机器学习在改进音字转换的系统性能(如正确率、通用性等)上,具有相当好的效果,目前已经在语句级声音输入、键盘输入等汉字系统上实用。 展开更多
关键词 机器学习 信息处理 转换
下载PDF
基于支持向量机的音字转换模型 被引量:6
2
作者 姜维 关毅 +1 位作者 王晓龙 刘秉权 《中文信息学报》 CSCD 北大核心 2007年第2期100-105,共6页
针对N-gram在音字转换中不易融合更多特征,本文提出了一种基于支持向量机(SVM)的音字转换模型,有效提供可以融合多种知识源的音字转换框架。同时,SVM优越的泛化能力减轻了传统模型易于过度拟合的问题,而通过软间隔分类又在一定程度上克... 针对N-gram在音字转换中不易融合更多特征,本文提出了一种基于支持向量机(SVM)的音字转换模型,有效提供可以融合多种知识源的音字转换框架。同时,SVM优越的泛化能力减轻了传统模型易于过度拟合的问题,而通过软间隔分类又在一定程度上克服小样本中噪声问题。此外,本文利用粗糙集理论提取复杂特征以及长距离特征,并将其融合于SVM模型中,克服了传统模型难于实现远距离约束的问题。实验结果表明,基于SVM音字转换模型比传统采用绝对平滑算法的Trigram模型精度提高了1.2%;增加远距离特征的SVM模型精度提高1.6%。 展开更多
关键词 人工智能 自然语言处理 支持向量机 转换 粗糙集理论 远距离特征
下载PDF
基于转移的音字转换纠错规则获取技术 被引量:4
3
作者 关毅 王晓龙 张凯 《计算机研究与发展》 EI CSCD 北大核心 1999年第3期268-273,共6页
文中描述了一种在音字转换系统中从规模不限的在线文本中自动获取纠错规则的机器学习技术.该技术从音字转换结果中自动获取误转换结果及其相应的上下文信息,从而生成转移规则集.该转移规则集应用于音字转换的后处理模块,使音字转换... 文中描述了一种在音字转换系统中从规模不限的在线文本中自动获取纠错规则的机器学习技术.该技术从音字转换结果中自动获取误转换结果及其相应的上下文信息,从而生成转移规则集.该转移规则集应用于音字转换的后处理模块,使音字转换系统的转换正确率进一步提高,并使系统具备了很强的灵活性和可扩展性. 展开更多
关键词 转换 纠错规则 机器学习 信息处理
下载PDF
一种基于单字统计二元文法的自组词音字转换算法 被引量:6
4
作者 赵以宝 孙圣和 《电子学报》 EI CAS CSCD 北大核心 1998年第10期55-59,共5页
音字转换在语音识别和汉字语句键盘输入方面都占有很重要的地位.现在比较流行的方法是基于大语料统计的Markov模型的音字转换方法其中基于单字N元文法的音字转换算法具有数据量少、算法简单的优点.但转换准确率却较低;而基于词N元文法... 音字转换在语音识别和汉字语句键盘输入方面都占有很重要的地位.现在比较流行的方法是基于大语料统计的Markov模型的音字转换方法其中基于单字N元文法的音字转换算法具有数据量少、算法简单的优点.但转换准确率却较低;而基于词N元文法的音字转换算法则正好相反本文在基于单字统计Bigram算法的基础上提出了一种自组词的音字转换方法,不仅具有单字Brgram方法的占空间少的优点.而且又可充分利用基于词Bigram算法的优点,实验表明该方法容易实现而且具有较高的转换准确率. 展开更多
关键词 转换 二元文法 自组词 识别
下载PDF
解决多音字字-音转换的一种统计学习方法 被引量:10
5
作者 张子荣 初敏 《中文信息学报》 CSCD 北大核心 2002年第3期39-45,共7页
字 -音转换是语音合成系统中的一个重要模块 ,其中多音词和以单字词形式存在的多音字读音的确定一直是个没有很好解决的问题。本文通过对大量标注有正确拼音的语料的统计 ,指出着重解决 4 1个重点多音字和 2 2个重点多音词就可基本解决... 字 -音转换是语音合成系统中的一个重要模块 ,其中多音词和以单字词形式存在的多音字读音的确定一直是个没有很好解决的问题。本文通过对大量标注有正确拼音的语料的统计 ,指出着重解决 4 1个重点多音字和 2 2个重点多音词就可基本解决字 -音转换的问题。本文采用基于扩展的随机复杂度的随机决策列表方法自动提取多音字 (词 )的读音规则 ,将字 -音转换的错误率由 8 8‰降低到 4 4‰。规则的训练和测试的材料的标注是一个耗费人力和时间的工作 ,而训练材料的数量和质量又直接影响最终的结果。本文提出一种半自动的语料标注流程 。 展开更多
关键词 统计学习方法 随机决策列表 -转换 语言合成系统 规则
下载PDF
利用语言模型实现音字转换的高效解码算法 被引量:2
6
作者 黄顺珍 方棣棠 《深圳大学学报(理工版)》 EI CAS 2000年第4期27-32,共6页
介绍利用语言模型实现音字转换的一种高效解码算法 ,涉及到零概率重估、路径剪枝和多音字处理等技术 。
关键词 语言模型 n-gram模型 转换 解码算法 零概率重估 路径剪枝 处理
下载PDF
统计与规则相结合的计算机音字相互转换技术 被引量:3
7
作者 王轩 王晓龙 藏晓莉 《哈尔滨工业大学学报》 EI CAS CSCD 北大核心 1997年第4期1-4,共4页
本文介绍了一种利用马尔克夫统计文法和自然语言理解技术相结合的计算语言模型进行汉语音节到汉字的机器自动相互转换技术。该技术集成了统计文法和句法分析方法各自的优点,可以实用于计算机大规模真实文本的音字相互转换,并且具有处理... 本文介绍了一种利用马尔克夫统计文法和自然语言理解技术相结合的计算语言模型进行汉语音节到汉字的机器自动相互转换技术。该技术集成了统计文法和句法分析方法各自的优点,可以实用于计算机大规模真实文本的音字相互转换,并且具有处理语言深度递归现象和远距离约束关系的能力。通过对从两千万语料随机抽取的一百六十万平衡语料的测试表明,音字转换正确率为带声调94.77%,无声调89.05%,字音转换正确率为99%。此项技术已被应用到大词表非特定人孤立词语音识别系统和中文WINDOWS95、WINDOS NT的智能语句输入法上。 展开更多
关键词 相互转换 语言模型 识别 统计 规则
下载PDF
基于混合字词网格的汉语音字转换问题的求解 被引量:5
8
作者 章森 《计算机学报》 EI CSCD 北大核心 2007年第7期1145-1153,共9页
汉语音字转换是中文键盘输入、汉语语音识别和中文信息处理的基础,也是一个非常具有挑战性的问题.文中分析了汉语音字转换的研究现状和存在的问题,提出了基于混合字词网格的汉语音字转换方法,给出了系统实现的架构,研究了混合2-gram模... 汉语音字转换是中文键盘输入、汉语语音识别和中文信息处理的基础,也是一个非常具有挑战性的问题.文中分析了汉语音字转换的研究现状和存在的问题,提出了基于混合字词网格的汉语音字转换方法,给出了系统实现的架构,研究了混合2-gram模型的有关问题以及字词网格的求解算法,最后讨论了自动预测与系统学习功能的实现.在此基础上设计了原型系统并与Windows XP上的微软拼音输入系统进行了比较,在拼音到汉字的自动转换正确率方面有显著的提高. 展开更多
关键词 汉语转换 n-gram语言模型 MARKOV模型 词网格 用户行为
下载PDF
语音识别音字转换中的快速容错算法 被引量:5
9
作者 李明琴 王作英 陆大■ 《中文信息学报》 CSCD 北大核心 2002年第5期38-43,共6页
本文研究了汉语连续语音识别音字转换中的容错算法,以纠正声学识别的替代、插入、删除错误。为了解决容错算法的计算量问题,本文提出了两种快速算法。一是针对单独出现错误的快速容错算法;二是针对关键词的快速容错算法。快速算法有效... 本文研究了汉语连续语音识别音字转换中的容错算法,以纠正声学识别的替代、插入、删除错误。为了解决容错算法的计算量问题,本文提出了两种快速算法。一是针对单独出现错误的快速容错算法;二是针对关键词的快速容错算法。快速算法有效地限制了容错算法的搜索空间,提高了计算效率。快速容错算法应用在电话对话系统中,字正确率从78.97%提高到86.68%,关键词检测正确率从80.56%提高到88.52%,并且算法运算时间满足实时性要求。 展开更多
关键词 识别 转换 快速容错算法 稳健语识别 口语对话系统 关键词检测 搜索空间
下载PDF
基于级联重排序的汉语音字转换 被引量:1
10
作者 李鑫鑫 王轩 +1 位作者 姚霖 关键 《自动化学报》 EI CSCD 北大核心 2014年第4期624-634,共11页
N元语言模型是解决汉字音字转换问题最常用的方法.但在解析过程中,每一个新词的确定只依赖于前面的邻近词,缺乏长距离词之间的句法和语法约束.我们引入词性标注和依存句法等子模型等来加强这种约束关系,并采用两个重排序方法来利用这些... N元语言模型是解决汉字音字转换问题最常用的方法.但在解析过程中,每一个新词的确定只依赖于前面的邻近词,缺乏长距离词之间的句法和语法约束.我们引入词性标注和依存句法等子模型等来加强这种约束关系,并采用两个重排序方法来利用这些子模型提供的信息:1)线性重排序方法,采用最小错误学习方法来得到各个子模型的权重,然后产生候选词序列的概率;2)采用平均感知器方法对候选词序列进行重排序,能够利用词性、依存关系等复杂特征.实验结果显示,两种方法都能有效地提高词N元语言模型的性能.而将这两种方法进行级联,即首先采用线性重排序方法,然后把产生的概率作为感知器重排序方法的初始概率时性能取得最优. 展开更多
关键词 汉语转换 重排序 最小错误学习 感知器方法
下载PDF
大规模文本计算机音字相互转换技术的研究 被引量:4
11
作者 王轩 王晓龙 《计算机研究与发展》 EI CSCD 北大核心 1998年第5期417-421,共5页
文中介绍了一种利用马尔可夫统计文法和自然语言理解技术相结合的计算语言模型进行汉语音节到汉字的机器自动相互转换技术.该技术集成了统计文法和句法分析方法各自的优点,可以实用于计算机大规模真实文本的音字相互转换,并且具有处... 文中介绍了一种利用马尔可夫统计文法和自然语言理解技术相结合的计算语言模型进行汉语音节到汉字的机器自动相互转换技术.该技术集成了统计文法和句法分析方法各自的优点,可以实用于计算机大规模真实文本的音字相互转换,并且具有处理语言深度递归现象和远距离约束关系的能力.其音字转换算法已被应用到大词表非特定人孤立词语音识别系统和中文WIN-DOWS95、WINDOWSNT4.0的智能语句输入法上. 展开更多
关键词 相互转换 语言模型 计算机 自然语言处理
下载PDF
汉语文本读入中音字转换的知识集成模型和时间同步搜索算法 被引量:1
12
作者 徐近霈 高枚 《中文信息学报》 CSCD 1994年第1期33-44,共12页
本文提出一种集成声学和语言学(特别是词间近邻关联和远邻语法规则)知识的组合概率模型,以及将这一模型用于音字转换过程的时间同步的动态规划搜索算法,并实验验证了所提模型和搜索算法的有效性。
关键词 汉语文本读入 转换 知识集成
下载PDF
一种基于相似度的汉语语言模型平滑技术及其在音字转换中的应用
13
作者 肖镜辉 王晓龙 刘秉权 《高技术通讯》 CAS CSCD 北大核心 2006年第2期127-132,共6页
针对汉语语言模型中的数据稀疏问题,利用词语语义信息,将词语相似度同back-off平滑技术相结合,提出一种基于词语相似度的汉语语言模型平滑技术,并且设计了一种能够自动优化模型中各项参数的迭代算法,最后,将这种平滑技术由低阶语... 针对汉语语言模型中的数据稀疏问题,利用词语语义信息,将词语相似度同back-off平滑技术相结合,提出一种基于词语相似度的汉语语言模型平滑技术,并且设计了一种能够自动优化模型中各项参数的迭代算法,最后,将这种平滑技术由低阶语言模型推广到高阶语言模型中,将上述技术应用到音字转换领域。实验表明,这项技术使语言模型的性能获得了较大的提高,并有效地降低了音字转换系统的错误率。 展开更多
关键词 数据稀疏 语言模型 平滑 转换 知网
下载PDF
基于语言模型的一种音字转换高效解码算法
14
作者 张志强 张太红 +1 位作者 吴倩 于志敏 《智能计算机与应用》 2016年第5期38-41,共4页
音字转换是汉语言信息处理的一个重要方面,在语音识别、汉语拼音输入等方面都有广泛的应用。本文首先回顾了词树的理论知识,然后对词树进行求解,最后对词树进行剪枝,随之,对产生的多音字进行处理。基于上面的理论,提出了一种基于... 音字转换是汉语言信息处理的一个重要方面,在语音识别、汉语拼音输入等方面都有广泛的应用。本文首先回顾了词树的理论知识,然后对词树进行求解,最后对词树进行剪枝,随之,对产生的多音字进行处理。基于上面的理论,提出了一种基于语言模型实现音字转换的高效解码算法,这种算法涉及到零概率重估、路径剪枝和多音字处理等多项技术,实验结果表明这种算法可以达到97.78%的准确率,与以往的算法相比,效果比较显著。 展开更多
关键词 语言模型 n-gram模型 转换
下载PDF
汉语音字转换中同音字(词)的概率后处理 被引量:3
15
作者 唐武 杨行峻 郭进 《中文信息学报》 CSCD 1992年第2期52-57,共6页
本文论述了一种新的汉语音字转换的概率后处理算法,该算法用字(词)相对于前后向拼音的条件概率代替常见的字(词)相对于前后向汉字的条件概率,极大地压缩了数据空间,提高了查找效率,使概率后处理的实时应用更趋于现实。该方法也可应用于... 本文论述了一种新的汉语音字转换的概率后处理算法,该算法用字(词)相对于前后向拼音的条件概率代替常见的字(词)相对于前后向汉字的条件概率,极大地压缩了数据空间,提高了查找效率,使概率后处理的实时应用更趋于现实。该方法也可应用于汉字印刷体和手写体的图形识别的后处理过程。 展开更多
关键词 汉语转换 概率后处理
下载PDF
语句级拼音┐汉字转换系统的设计与实现 被引量:2
16
作者 殷峰 何克抗 《计算机研究与发展》 EI CSCD 北大核心 1997年第5期340-345,共6页
本文系统介绍了拼音-汉字转换系统的设计与实现方法.系统主要由拼音自动分词子系统和语法分析子系统两部分组成.拼音自动分词子系统是在书面汉语自动分词系统基础上根据音字转换的特点和要求建造的.语法分析子系统是由词法分析、短... 本文系统介绍了拼音-汉字转换系统的设计与实现方法.系统主要由拼音自动分词子系统和语法分析子系统两部分组成.拼音自动分词子系统是在书面汉语自动分词系统基础上根据音字转换的特点和要求建造的.语法分析子系统是由词法分析、短语分析和句法分析三部分组成,语法分析采取关键词驱动的自底向上分析策略.由于汉语句子的构造原则与词组一致,因此语法分析是以短语分析为主。 展开更多
关键词 转换 自动分词 语法规则 计算机应用
下载PDF
音字转换系统中字词频的智能调整 被引量:1
17
作者 钟文青 徐秉铮 《华南理工大学学报(自然科学版)》 EI CAS CSCD 1995年第10期57-61,共5页
音字转换是汉字的语音输入系统的一个主要组成部分,音字转换的速度和准确性直接影响整个系统的性能。本文提出在音字转换过程中利用字词的概率统计信息(即字词频)进行辅助判决的方法,优化字词的选择,提高音字转换的速度。考虑到人... 音字转换是汉字的语音输入系统的一个主要组成部分,音字转换的速度和准确性直接影响整个系统的性能。本文提出在音字转换过程中利用字词的概率统计信息(即字词频)进行辅助判决的方法,优化字词的选择,提高音字转换的速度。考虑到人们用词的时变性,提出一种在使用过程中对字词频进行智能调整的算法,并引入遗忘机制以适应字词频的减量变化。该方法应用于实际系统中可减少选字时间40%,提高输入速度约20% 展开更多
关键词 语言处理 人工智能 转换系统 汉语 识别
下载PDF
音字转换中分层解码模型的研究与改进 被引量:2
18
作者 张顺昌 孙乐 《中文信息学报》 CSCD 北大核心 2009年第6期79-85,共7页
音字转换是中文信息处理领域的一个重要研究方向,在语音识别、中文拼音输入中都有广泛应用。该文对音字转换中的拼音流切分歧义问题做了分析与研究,发现传统的分层隐马尔可夫解码模型在解决这个问题时存在缺陷,提出了利用语言模型知识... 音字转换是中文信息处理领域的一个重要研究方向,在语音识别、中文拼音输入中都有广泛应用。该文对音字转换中的拼音流切分歧义问题做了分析与研究,发现传统的分层隐马尔可夫解码模型在解决这个问题时存在缺陷,提出了利用语言模型知识辅助拼音流切分来改进已有的分层模型的思想。实验表明,与传统方法相比,该文的方法可以将首字准确率提高3%。 展开更多
关键词 人工智能 自然语言处理 转换 HMM模型 中文信息处理 切分歧义
下载PDF
统计语言模型及汉语音字转换的一些新结果 被引量:17
19
作者 郭进 《中文信息学报》 CSCD 1993年第1期18-27,共10页
汉语音字转换是一个重要而困难的问题。语料库语言学为我们提供了新思路。作者们通过建立统计语言模型,将基于语料库的方法与传统的基于规则的方法结合,研制了THED新一代音字转换系统。该系统对随机抽取的新华社新闻语料有不低于95%的... 汉语音字转换是一个重要而困难的问题。语料库语言学为我们提供了新思路。作者们通过建立统计语言模型,将基于语料库的方法与传统的基于规则的方法结合,研制了THED新一代音字转换系统。该系统对随机抽取的新华社新闻语料有不低于95%的带调音节和国标汉字的转换正确率。本文侧重报道该系统在汉语音字转换方面及与此相关的汉语切词和词性标注方面的一些实验结果,也简要介绍该系统在语料库应用方面的一些思路。 展开更多
关键词 汉语 转换 统计语言模型
下载PDF
音字转换智能系统的设计和实践
20
作者 王晓龙 王开铸 《中文信息》 1990年第2期9-12,共4页
关键词 转换 智能系统
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部