-
题名自动语言辨识研究(上)
被引量:3
- 1
-
-
作者
杜利民
-
机构
中国科学院声学研究所
-
出处
《电子科技导报》
1996年第4期16-19,25,共5页
-
文摘
多年来,国际上自动语言辨识的研究比较孤立、分散,随着OGI-TS多语种数据库的出现,这一领域的研究逐步走向系统化、科学化,在短短的两三年里取得了令人鼓舞的进展。我国在这一领域里的研究尚待起步。本文概要介绍这一领域的基本问题、重要的研究方法及其最新结果。目的在于推动和加强我国对这一领域的研究。另外,自动语言辨识的方法用于解决我国多种方言的自动辨识问题也具有直接的启发和借鉴作用。
-
关键词
自动语言辨识
语音交互
语音识别
语言辨识
-
分类号
TN912.34
[电子电信—通信与信息系统]
-
-
题名基于滑动倒谱的自动语言辨识
被引量:4
- 2
-
-
作者
王洪海
刘刚
郭军
-
机构
北京邮电大学信息工程学院
-
出处
《智能系统学报》
2008年第4期336-341,共6页
-
基金
"十一五"国家863计划重点项目课题(2006AA010102)
-
文摘
滑动差分倒谱在自动语言辨识的研究中获得了广泛的应用.但是滑动差分倒谱并没有利用语音信号的静态倒谱信息,在方言辨识中的研究表明静态倒谱比差分倒谱含有更多的特征信息.为此,提出了滑动倒谱(SC)的概念,并与滑动差分倒谱特征矢量进行了对比研究.首先利用开发集的语音考察了滑动差分倒谱和滑动倒谱的控制参数在不同取值的情况下对识别性能的影响,利用爬山法确定了这2类特征矢量达到局部最优控制参数组合的路径,然后利用测试集的数据对优化后的2类特征矢量建立的模型进行了闭集辨识和开集辨识.2种情况下的测试结果都表明滑动倒谱的性能优于滑动差分倒谱.并且这2种参数还具有特征互补性,将它们进行决策级数据融合可以进一步提高系统的性能.
-
关键词
自动语言辨识
滑动倒谱
滑动差分倒谱
高斯混合模型
-
Keywords
automatic language identification
shifted cepstra
shifted delta cepstra
Gaussian mixture model
-
分类号
TP391.42
[自动化与计算机技术—计算机应用技术]
-
-
题名自动语言辨识研究(下)
- 3
-
-
作者
杜利民
-
机构
中国科学院声学研究所
-
出处
《电子科技导报》
1996年第5期14-15,共2页
-
文摘
自动语言辨识研究(下)杜利民(中国科学院声学研究所)6整合利用时长和韵律信息人们早就认识到了韵律信息(从语音信号导出的、存在于若干音素范围的基音、幅度、速率等语音特征信息)对语音识别有重大贡献。但对当前系统贡献并不大。同样,在当前的语言辨识系统中整合...
-
关键词
自动语言辨识
信息处理
语音识别
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-
-
题名自动语言辨识的研究方法及发展概述
被引量:1
- 4
-
-
作者
王洪海
刘刚
郭军
-
机构
北京邮电大学模式识别实验室
-
出处
《电脑与信息技术》
2007年第2期37-39,共3页
-
文摘
根据自动语言辨识研究中所采用的识别信息的不同,文章将研究中使用的方法归类为基于声学特征的方法、基于韵律特征的方法、基于音素识别的方法和基于高层语言信息的方法。通过对这些方法进行分类介绍并结合NIST的评测结果分析,阐述了近十几年来自动语言辨识研究的发展情况,最后对进一步研究中存在的问题和发展趋势进行了分析。
-
关键词
自动语言辨识
滑动差分倒谱
连续语音识别
概述
-
Keywords
Automatic Language Identification
Shifted Delta Cepstra(SDC)
Continuous Speech Recognition(CSR)
overview
-
分类号
TN912.34
[电子电信—通信与信息系统]
-
-
题名关于网络语音的自动语言辨识系统研究
- 5
-
-
作者
王洪海
刘刚
郭军
-
机构
北京邮电大学模式识别实验室
-
出处
《电脑与信息技术》
2007年第1期3-6,共4页
-
文摘
文章对从网络上采集的英语、德语、日语、法语、西班牙语等5个语种的语音和现有的汉语语音进行了自动语言辨识的研究,利用RASTA-PLP特征参数和贪婪期望最大算法为每个语种建立了高斯混合模型,并用多个说话人的语音进行了开集测试,讨论了网络语音和非网络语音对识别结果的影响,以及识别率与训练数据和GMM模型阶数的关系。实验结果表明,经过改进的基于声学特征的方法可以有效地应用到网络语音的自动语言辨识系统中。
-
关键词
网络语音
自动语言辨识
RASTA—PLP
高斯混合模型
贪婪期望最大算法
-
Keywords
Internet speech
ALID
RASTA-PLP
GMM
Greedy EM
-
分类号
TN912.34
[电子电信—通信与信息系统]
-
-
题名Cohen类双线性时频分布在语音识别上的应用
- 6
-
-
作者
蒋治宏
黄力
莫徽忠
-
机构
柳州职业技术学院
-
出处
《现代电子技术》
2007年第16期128-130,共3页
-
文摘
短时分析技术有着与生俱来的短时平稳假设限制,众多非平稳信号处理技术有着克服这一根本技术限制的潜力。非平稳信号处理技术中的Cohen类双线性时频分布技术拥有良好的时频分辨率,其中的WVD的时频分辨率已达到不确定原理下界,在非平稳信号处理技术中有独特优势。详细介绍了将这一优势在语音自动识别上的应用原理,提出了一种新型的语音智能识别方法。
-
关键词
自动语言辨识
时频主分量分析
Cohen类双线性时频分布
核函数
-
Keywords
automatic language identification
time - frequency principal component analysis
Cohen bilinear time - frequency distribution
kernel function
-
分类号
TP311.134.3
[自动化与计算机技术—计算机软件与理论]
-
-
题名电脑与信息技术总目次
- 7
-
-
-
出处
《电脑与信息技术》
2007年第6期61-62,共2页
-
-
关键词
自动语言辨识
杨路明
目次
-
分类号
TP
[自动化与计算机技术]
-