期刊文献+
共找到237篇文章
< 1 2 12 >
每页显示 20 50 100
维吾尔语连续语音识别技术研究 被引量:2
1
作者 冯丽娟 吾守尔.斯拉木 《现代计算机》 2010年第1期4-7,共4页
维吾尔语连续语音识别技术研究主要阐述维吾尔语连续语音的识别技术,主要包括声学模型和语言模型。在声学模型中,主要介绍基于隐马尔可夫模型(Hidden Markov Model,HMM)的维吾尔语连续语音识别声学建模。在语言模型中,主要对比基于文法... 维吾尔语连续语音识别技术研究主要阐述维吾尔语连续语音的识别技术,主要包括声学模型和语言模型。在声学模型中,主要介绍基于隐马尔可夫模型(Hidden Markov Model,HMM)的维吾尔语连续语音识别声学建模。在语言模型中,主要对比基于文法和基于统计这两种方法的优劣。 展开更多
关键词 维吾尔语连续语音识别 声学模型 语言模型 隐马尔可夫(HMM)
下载PDF
基于隐马尔可夫模型的维吾尔语连续语音识别系统 被引量:17
2
作者 那斯尔江.吐尔逊 吾守尔.斯拉木 《计算机应用》 CSCD 北大核心 2009年第7期2009-2011,2025,共4页
维吾尔语是黏着性语言,利用丰富的词缀可以用同样的词干产生超大词汇,给维吾尔语语音识别的研究工作带来了很大困难。结合维吾尔语自身特点,建立了维吾尔语连续语音语料库,利用HTK(HMMToolK it)工具实现了基于隐马尔可夫模型(HMM)的维... 维吾尔语是黏着性语言,利用丰富的词缀可以用同样的词干产生超大词汇,给维吾尔语语音识别的研究工作带来了很大困难。结合维吾尔语自身特点,建立了维吾尔语连续语音语料库,利用HTK(HMMToolK it)工具实现了基于隐马尔可夫模型(HMM)的维吾尔语连续语音识别系统。在声学层,选取三音子作为基本的识别单元,建立了维吾尔语的三音子声学模型,并使用决策树、三音子绑定、修补哑音、增加高斯混合分量等方法提高模型的识别精度。在语言层,使用了适合于维吾尔语语音特征的基于统计的二元文法语言模型。最后,利用该系统进行了维吾尔语连续语音识别实验。 展开更多
关键词 维吾尔语 连续语音 语音识别 HMM的工具包
下载PDF
面向大词汇量的维吾尔语连续语音识别研究 被引量:7
3
作者 努尔麦麦提.尤鲁瓦斯 吾守尔.斯拉木 《计算机工程与应用》 CSCD 2013年第9期115-119,共5页
近年来大词汇量连续语音识别技术得到了迅速的发展,国内外研究机构加大了对汉语和英语语音识别技术的研究,然而,维吾尔语语音识别技术的研究工作最近才起步。建立了面向大词汇量的维吾尔语语音语料库,研究了维吾尔语声学模型和语言模型... 近年来大词汇量连续语音识别技术得到了迅速的发展,国内外研究机构加大了对汉语和英语语音识别技术的研究,然而,维吾尔语语音识别技术的研究工作最近才起步。建立了面向大词汇量的维吾尔语语音语料库,研究了维吾尔语声学模型和语言模型建模技术、解码技术,进行了面向大词汇量的维吾尔语连续语音识别实验。对维吾尔语大词汇量连续语音识别技术进一步发展中存在的问题进行了讨论。 展开更多
关键词 维吾尔语 语音语料库 大词汇 识别技术
下载PDF
维吾尔语连续语音识别声学模型优化研究 被引量:4
4
作者 努尔麦麦提.尤鲁瓦斯 吾守尔.斯拉木 《计算机工程与应用》 CSCD 2013年第2期145-147,共3页
综合了语音识别中常用的高斯混合模型和人工神经网络框架优点的Tandem特征提取方法应用于维吾尔语声学模型训练中,经过一系列后续处理,将原始的MFCC特征转化为Tandem特征,以此作为基于隐马尔可夫统计模型的语音识别系统的输入,并使用最... 综合了语音识别中常用的高斯混合模型和人工神经网络框架优点的Tandem特征提取方法应用于维吾尔语声学模型训练中,经过一系列后续处理,将原始的MFCC特征转化为Tandem特征,以此作为基于隐马尔可夫统计模型的语音识别系统的输入,并使用最小音素错误区分性训练准则训练声学模型,进而完成在测试集上的识别实验。实验结果显示,Tandem区分性训练方法使识别系统的单词错误率比原先的基于最大似然估计准则的系统相对减少13%。 展开更多
关键词 维吾尔语 语音识别 最小音素错误 Tandem特征
下载PDF
基于子字单元的维吾尔语语音识别研究 被引量:5
5
作者 薛化建 董兴华 +2 位作者 周喜 吐尔洪.吾司曼 李晓 《计算机工程》 CAS CSCD 北大核心 2011年第20期208-210,共3页
为提高维吾尔语语音识别的识别率,在分析维吾尔语特点的基础上,设计一种基于子字单元的维吾尔语语音识别总体结构,指出维吾尔语单词的发音模型,给出构建子字发音字典的方法,及其以子字单元为基础构建语言模型与声学模型的方法。在一个... 为提高维吾尔语语音识别的识别率,在分析维吾尔语特点的基础上,设计一种基于子字单元的维吾尔语语音识别总体结构,指出维吾尔语单词的发音模型,给出构建子字发音字典的方法,及其以子字单元为基础构建语言模型与声学模型的方法。在一个语音库上进行实验,采用一种非监督的词切分方法对维吾尔语单词进行词切分,生成子字。实验结果表明,基于子字单元的维吾尔语语音识别可以获得更好的识别结果。 展开更多
关键词 维吾尔语 词切分 子字单元 隐马尔科夫模型 连续语音识别
下载PDF
基于卷积神经网络的维吾尔语语音识别 被引量:11
6
作者 梁玉龙 屈丹 +1 位作者 李真 张文林 《信息工程大学学报》 2017年第1期44-50,共7页
为有效减少模型训练参数,降低维吾尔语语音识别词错误率,提出了基于卷积神经网络的维吾尔语语音识别。该方法将局部连接、权值共享以及池化有机结合,极大减少了模型训练参数。同时结合maxout和dropout算法,克服模型训练中数据稀疏的问题... 为有效减少模型训练参数,降低维吾尔语语音识别词错误率,提出了基于卷积神经网络的维吾尔语语音识别。该方法将局部连接、权值共享以及池化有机结合,极大减少了模型训练参数。同时结合maxout和dropout算法,克服模型训练中数据稀疏的问题,进一步提高识别率。THUYG-20维吾尔语语音数据库的实验结果表明,相比传统的基于高斯混合模型隐马尔可夫模型的语音识别系统和基于深度神经网络的语音识别系统,基于卷积神经网络语音识别系统使维吾尔语语音识别错误率分别降低了15.97%和2.55%。 展开更多
关键词 卷积神经网络 语音识别 特征空间最大似然线性回归特征 最大输出 维吾尔语
下载PDF
维吾尔语音节语音识别与识别基元的研究 被引量:7
7
作者 王昆仑 《计算机科学》 CSCD 北大核心 2003年第7期182-184,共3页
This paper solves the recognition problems of the Vowel Consonant and efficiency syllable of Uighurspeech, which is based on the Center-Distance Continuance Probability Model and Uighur speech database. And it an-alyz... This paper solves the recognition problems of the Vowel Consonant and efficiency syllable of Uighurspeech, which is based on the Center-Distance Continuance Probability Model and Uighur speech database. And it an-alyzes the result of recognition,brings forward the rationality that Uighur syllable is used as the base element ofrecognition and the difficulties we find in this study. This paper also gives the method of how to solve these problems. 展开更多
关键词 语音识别 语音识别基元 维吾尔语音节 维吾尔语
下载PDF
基于HTK的维吾尔语连续语音声学建模 被引量:12
8
作者 陶梅 吾守尔.斯拉木 那斯尔江.吐尔逊 《中文信息学报》 CSCD 北大核心 2008年第5期56-59,共4页
维吾尔语属于阿勒泰语系突厥语族,是黏着性语言。本文根据维吾尔语的特点,分析设计了维吾尔语语音识别系统的总体结构,讨论了维吾尔语最佳识别基元的选择方法,提出建立基于决策树聚类的上下文相关模型,并采用混合高斯分布(GMD)拟合观测... 维吾尔语属于阿勒泰语系突厥语族,是黏着性语言。本文根据维吾尔语的特点,分析设计了维吾尔语语音识别系统的总体结构,讨论了维吾尔语最佳识别基元的选择方法,提出建立基于决策树聚类的上下文相关模型,并采用混合高斯分布(GMD)拟合观测概率分布,优化维吾尔语连续语音中HMM模型系统以提高识别性能。最后给出实验对比,得出结论,为今后维吾尔语连续语音识别研究提供依据。 展开更多
关键词 人工智能 自然语言处理 维吾尔语 混合高斯分布 HMM 连续语音识别
下载PDF
基于CDCPM的维吾尔语非特定人语音识别 被引量:4
9
作者 王昆仑 《计算机研究与发展》 EI CSCD 北大核心 2001年第10期1242-1245,共4页
现代维吾尔语语音识别研究尚处于起始阶段 ,在此介绍了基于中心距离连续概率模型 ( CDCPM)的维吾尔语非特定人语音识别 .CDCPM用中心距离正态 ( CDN)分布描述模型特征空间 ,去掉了 HMM的状态转移概率矩阵 A,对 HMM进行了简化和改进 .在... 现代维吾尔语语音识别研究尚处于起始阶段 ,在此介绍了基于中心距离连续概率模型 ( CDCPM)的维吾尔语非特定人语音识别 .CDCPM用中心距离正态 ( CDN)分布描述模型特征空间 ,去掉了 HMM的状态转移概率矩阵 A,对 HMM进行了简化和改进 .在维吾尔语综合语音库上进行的实验表明 :恰当地估计模型状态数和模型混合密度数 ,当模型数为 5 2 5个 ,模型状态数为 16,混合密度数为 2 4 ,维吾尔语非特定人语音识别首选正识率达到97.90 % (集内 )和 94 .76% (集外 ) ,取得了较好的识别效果 .同时 ,指出了进一步开展维吾尔语语音识别研究的几个问题 . 展开更多
关键词 维吾尔语 语音识别 中心距离连续概率模型 CDCPM
下载PDF
南疆维吾尔语语音识别研究与实现 被引量:2
10
作者 吴刚 吐尔洪江 《塔里木大学学报》 2012年第3期51-55,共5页
该研究以南疆维吾尔语语音为研究对象,分析了维吾尔语语音的发音特点,采集语音后对其进行预处理,提取Mel倒谱系数作为特征参数,实现了基于动态时间规整算法的南疆维吾尔语非特定人语音的识别。该识别方法在MATLAB上进行了仿真实验,测试... 该研究以南疆维吾尔语语音为研究对象,分析了维吾尔语语音的发音特点,采集语音后对其进行预处理,提取Mel倒谱系数作为特征参数,实现了基于动态时间规整算法的南疆维吾尔语非特定人语音的识别。该识别方法在MATLAB上进行了仿真实验,测试样本420个,识别正确394个,识别正确率为93.8%,实验结果表明该识别方法对南疆维吾尔语语音识别效果较好,这为进一步研究大词汇量连续语音的维吾尔语语音识别提供了借鉴意义。 展开更多
关键词 维吾尔语 语音识别 动态时间规整
下载PDF
维吾尔语语音识别语料库中的OOV研究 被引量:4
11
作者 张小燕 宿建军 +1 位作者 薛化建 王磊 《计算机工程与设计》 CSCD 北大核心 2012年第2期772-776,共5页
鉴于维吾尔语丰富的形态变化产生大量单词引起的集外词(out of vocabulary,OOV)问题,为了定量研究OOV对维吾尔语语音识别的影响,采用控制语料库测试集OOV的算法及最佳文本挑选算法对不同OOV的测试集进行实验,算法通过Python语言实现。... 鉴于维吾尔语丰富的形态变化产生大量单词引起的集外词(out of vocabulary,OOV)问题,为了定量研究OOV对维吾尔语语音识别的影响,采用控制语料库测试集OOV的算法及最佳文本挑选算法对不同OOV的测试集进行实验,算法通过Python语言实现。应用该算法进行电话语音库的文本转写,构建了维吾尔语的电话语音库。实验结果表明,该控制测试集OOV的方法能够有效地提高维吾尔语语音识别率。 展开更多
关键词 维吾尔语 集外词 语料库 文本挑选 语音识别
下载PDF
基于迁移学习的低资源度维吾尔语语音识别 被引量:6
12
作者 王俊超 黄浩 +1 位作者 徐海华 胡英 《计算机工程》 CAS CSCD 北大核心 2018年第10期281-285,291,共6页
语音识别中通常需要用较大的数据量来训练声学模型,而使用资源匮乏的维吾尔语数据训练的深度神经网络声学模型性能较差。针对该问题,根据深度神经网络模型能够进行迁移学习的特点,提出用少量维吾尔语数据重新训练由其他资源丰富语料训... 语音识别中通常需要用较大的数据量来训练声学模型,而使用资源匮乏的维吾尔语数据训练的深度神经网络声学模型性能较差。针对该问题,根据深度神经网络模型能够进行迁移学习的特点,提出用少量维吾尔语数据重新训练由其他资源丰富语料训练而成的基础声学模型,从而构建一个性能更好的维吾尔语声学模型。实验结果表明,相比于基线系统迁移学习的训练方法,该方法能够显著提高维吾尔语的语音识别率。 展开更多
关键词 语音识别 声学模型 维吾尔语 低资源度 深度神经网络 迁移学习
下载PDF
采用原子表示模型的维吾尔语语音情感识别 被引量:3
13
作者 塔什甫拉提·尼扎木丁 梁瑞宇 +1 位作者 谢跃 赵力 《信号处理》 CSCD 北大核心 2020年第1期9-17,共9页
针对现有的基于表示学习的语音情感计算算法中存在着限制条件单一的问题,且没有证明它们的有效性,提出了一种采用原子表示模型的语音情感识别算法。通过引入一个新的条件,称为原子分类条件。在这种条件下,对正确识别新的测试情感样本有... 针对现有的基于表示学习的语音情感计算算法中存在着限制条件单一的问题,且没有证明它们的有效性,提出了一种采用原子表示模型的语音情感识别算法。通过引入一个新的条件,称为原子分类条件。在这种条件下,对正确识别新的测试情感样本有较好的效果。现有的基于表示的分类算法以单一的稀疏表示方法为主,而提出的算法可以结合稀疏表示模型和其他的表示模型。该算法能够放宽适用条件的范围,使得原子表示模型适应更多分类任务。采集并建立了维吾尔语语音情感数据库。在该情感数据库上,分析维吾尔语情感语音的基本声学特征。通过对情感特征空间进行原子表示的映射变换,可以有效表示情感特征空间。经实验结果证明所提出的方法优于传统的方法,在维吾尔语情感语音数据库上达到了64. 17%识别率。 展开更多
关键词 语音情感识别 维吾尔语 原子表示模型 情感声学特征
下载PDF
基于DDBHMM的维吾尔语语音声学层识别系统研究 被引量:2
14
作者 吾守尔.斯拉木 刘俊 王飞飞 《新疆大学学报(自然科学版)》 CAS 2010年第4期381-386,共6页
采用基于段长分布的非齐次隐马尔可夫模型(DDBHMM)进行维吾尔语声学建模。在新语料下由于总词汇量的成倍增加导致识别时间倍增,为缩短识别时间将耗时最长的概率计算部分采用多线程机制优化了识别模块,同时加入了端点检测进行控制,并相... 采用基于段长分布的非齐次隐马尔可夫模型(DDBHMM)进行维吾尔语声学建模。在新语料下由于总词汇量的成倍增加导致识别时间倍增,为缩短识别时间将耗时最长的概率计算部分采用多线程机制优化了识别模块,同时加入了端点检测进行控制,并相继设计了录音模块、特征提取模块、波形显示及结果输出显示模块等,对这些模块进行集成界面化后产生了一个基于DDBHMM的维吾尔语连续语音声学层实时识别系统,并对系统进行了测试及验证. 展开更多
关键词 语音识别 维吾尔语 DDBHMM 多线程
下载PDF
基于DNN-HMM和RNN的维吾尔语语音识别 被引量:4
15
作者 阿地力江·阿布都尼亚孜 米吉提·阿不里米提 艾斯卡尔·艾木都拉 《现代电子技术》 2021年第17期90-94,共5页
基于深层神经网络(DNN)的语音识别模型不仅在单个语言上表现出色,而且在多语言信息处理领域也表现出了优异的能力。随着语音数据量的增加,高斯混合模型(GMM)在有效提升大词汇量连续语音识别系统性能以及识别效果上被神经网络(NN)模型超... 基于深层神经网络(DNN)的语音识别模型不仅在单个语言上表现出色,而且在多语言信息处理领域也表现出了优异的能力。随着语音数据量的增加,高斯混合模型(GMM)在有效提升大词汇量连续语音识别系统性能以及识别效果上被神经网络(NN)模型超越。文中采用Kaldi开源语音识别平台,结合RNN语言模型和DNN模型的三种损失函数,即最大互信息量(MMI)、最小贝叶斯风险(sMBR)和最小因素错误率(MPE),在维吾尔语语料库(THUYG-20公开语料库)测试数据上分别取得了16.73%,16.55%和15.95%的词错误率。相比高斯混合模型的词错误率分别降低了2.88%,3.06%和3.66%。深层神经网络在资源匮乏的少数民族语言以及多语言信息处理上有更强的能力。 展开更多
关键词 维吾尔语语音识别 RNN语言模型 DNN-HMM 声学模型 判别式训练 损失函数 Kaldi
下载PDF
端到端维吾尔语语音识别研究 被引量:2
16
作者 丁枫林 郭武 孙健 《小型微型计算机系统》 CSCD 北大核心 2020年第1期19-23,共5页
近几年来,基于端到端模型的语音识别系统因其相较于传统混合模型的结构简洁性和易于训练性而得到广泛的应用,并在汉语和英语等大语种上取得了显著的效果.本文将自注意力机制和链接时序分类损失代价函数相结合,将这种端到端模型应用到维... 近几年来,基于端到端模型的语音识别系统因其相较于传统混合模型的结构简洁性和易于训练性而得到广泛的应用,并在汉语和英语等大语种上取得了显著的效果.本文将自注意力机制和链接时序分类损失代价函数相结合,将这种端到端模型应用到维吾尔语语音识别上.考虑到维吾尔语属于典型的黏着语,其丰富的构词形式使得维吾尔语的词汇量异常庞大,本文引入字节对编码算法进行建模单元的生成,从而获得合适的端到端建模输出单元.在King-ASR450维吾尔语数据集上,提出的算法明显优于基于隐马尔可夫模型的经典混合系统和基于双向长短时记忆网络的端到端模型,最终识别词准确率为91.35%. 展开更多
关键词 语音识别 维吾尔语 端到端 自注意力 字节对编码 链接时序分类
下载PDF
基于双向改进门控循环单元维吾尔语语音识别 被引量:2
17
作者 李连振 米吉提·阿不里米提 +1 位作者 郑方 艾斯卡尔·艾木都拉 《计算机仿真》 北大核心 2022年第11期275-279,共5页
为了能够提升语音识别的准确率,并有效降低训练模型的复杂度,提出了一种双向改进门控循环单元的声学模型语音识别方法。模型上移除重置门,在状态更新过程中采用ReLU激活函数并与前馈连接采用的BN算法有效结合,改进的模型可以降低模型的... 为了能够提升语音识别的准确率,并有效降低训练模型的复杂度,提出了一种双向改进门控循环单元的声学模型语音识别方法。模型上移除重置门,在状态更新过程中采用ReLU激活函数并与前馈连接采用的BN算法有效结合,改进的模型可以降低模型的计算复杂度,加快模型收敛;采用双向的结构不仅可以有效帮助模型捕捉到过去和未来的语义时序信息,而且可以有效提升识别准确率。在THUYG-20维吾尔语数据集上实验结果表明,与基线传统深度神经网络进行对比,基于双向改进门控循环单元网络词错误率下降2.34%;与标准双向长短期记忆网络(LSTM)比较每个迭代周期平均训练时间减少13.4%。 展开更多
关键词 维吾尔语 语音识别 声学模型 门控循环单元
下载PDF
基于CNN-HMM和RNN的维吾尔语语音识别 被引量:3
18
作者 穆凯代姆罕·伊敏江 艾斯卡尔·艾木都拉 米吉提·阿不里米提 《现代电子技术》 2021年第11期172-176,共5页
神经网络模型的发展给资源匮乏语言的语音及语言信息处理带来新的机遇,基于神经网络的少数民族语言的语音识别系统效率及准确率比传统方法有了很大提高。对于大词汇量语音识别系统,适当选择声学模型和语言模型很重要。对较小的维吾尔语... 神经网络模型的发展给资源匮乏语言的语音及语言信息处理带来新的机遇,基于神经网络的少数民族语言的语音识别系统效率及准确率比传统方法有了很大提高。对于大词汇量语音识别系统,适当选择声学模型和语言模型很重要。对较小的维吾尔语语料库(THUYG公开语料库)进行了深入研究,采用Kaldi开源语音识别平台将深度的CNN-HMM作为声学模型,通过理论分析和对比实验,分别在N-gram和RNN两种语言模型上进行对比实验。实验结果表明,基于神经网络RNN语言模型的系统有更好的识别效果,提升了维吾尔语语音识别准确率,并将词错误率降到15.06%。 展开更多
关键词 语音识别 维吾尔语 声学模型 语言模型 CNN-HMM N-GRAM语言模型 循环神经网络 Kaldi
下载PDF
说话人自适应技术在维吾尔语语音识别中的应用研究 被引量:4
19
作者 努尔麦麦提.尤鲁瓦斯 张力文 吾守尔.斯拉木 《中文信息学报》 CSCD 北大核心 2016年第3期79-84,共6页
该文针对维吾尔语说话人之间的发音差异会在一定程度上影响维吾尔语语音识别系统的性能这一情况研究了说话人自适应技术,将目前较为常用的MLLR和MAP以及MLLR和MAP相结合的自适应方法应用于维吾尔语连续语音识别的声学模型训练中,并用这... 该文针对维吾尔语说话人之间的发音差异会在一定程度上影响维吾尔语语音识别系统的性能这一情况研究了说话人自适应技术,将目前较为常用的MLLR和MAP以及MLLR和MAP相结合的自适应方法应用于维吾尔语连续语音识别的声学模型训练中,并用这三种方法自适应后的声学模型分别在测试集上进行识别实验。实验结果表明MLLR、MAP以及MAP+MLLR自适应方法使基线识别系统的单词错误识别率分别降低了0.6%、2.34%和2.57%。 展开更多
关键词 维吾尔语 语音识别 说话人自适应 MLLR MAP
下载PDF
维吾尔语广播新闻连续语音敏感词检索系统 被引量:2
20
作者 木合塔尔.沙地克 李晓 布合力齐姑丽.瓦斯力 《计算机系统应用》 2012年第3期29-35,71,共8页
首先介绍语音信号来源于新疆人民广播电台维吾尔语新闻的敏感词语音语料库的建设。然后用该语料库进行基于HMM的模型训练。模型训练中详细介绍识别基元端点检测、特征提取、矢量量化、码本构建、HMM模型训练过程和结果。最后用该语料库... 首先介绍语音信号来源于新疆人民广播电台维吾尔语新闻的敏感词语音语料库的建设。然后用该语料库进行基于HMM的模型训练。模型训练中详细介绍识别基元端点检测、特征提取、矢量量化、码本构建、HMM模型训练过程和结果。最后用该语料库和HMM训练模型对维吾尔语广播新闻连续语音信号进行敏感词检索,并对检索结果进行分析。 展开更多
关键词 语音语料库 敏感词检索 维吾尔语 单词分割 连续语音识别
下载PDF
上一页 1 2 12 下一页 到第
使用帮助 返回顶部