-
题名一种改进动态特征参数的话者语音识别系统
被引量:4
- 1
-
-
作者
申小虎
万荣春
张新野
-
机构
江苏警官学院公安科技系
公安部第一研究所
-
出处
《计算机仿真》
CSCD
北大核心
2015年第4期154-158,共5页
-
基金
江苏高校优势学科建设工程资助项目(PAPD)
江苏警官学院科研项目(13Q09)
-
文摘
研究语音动态特征参数提取问题,在话者语音识别过程中,动态特征参数可以有效提高识别率。但是传统算法在其提取过程中存在大量干扰冗余信息,造成了识别率降低并带来运算速度的降低。为解决上述副作用,提出在说话人识别系统中,使用一种动态时频倒谱系数参数的方法。上述方法在不减少反应话者个体特征分布特性的前提下,可消除冗余信息并降低样本特征的维度。利用上述方法提取语音特征参数并输入混合高斯-通用背景模型进行说话人语音分类。在Matlab上仿真结果表明,动态时频倒谱系数可有效改进话者语音识别系统的识别正确率。
-
关键词
话者语音识别系统
美尔频率倒谱系数
滑动差分倒谱特征
动态时频倒谱系数
混合高斯-通用背景模型
-
Keywords
Speech recognition system (SRS)
Mel frequency cepstral coefficient ( MFCC )
shifted delta cepstral feature(sdc)
Dynamic timing frequency cepstral feature (DTFC)
Gaussian mixture model -universal background model ( GMM - UBM)
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名语音信号的动态时频倒谱特征
被引量:2
- 2
-
-
作者
孙平
顾明亮
张彪
高原
张宁
-
机构
徐州师范大学物理与电子工程学院
徐州师范大学语言科学学院
-
出处
《徐州师范大学学报(自然科学版)》
CAS
2011年第3期58-61,共4页
-
基金
国家自然科学基金资助项目(61040053)
江苏省普通高校研究生科研创新计划资助项目(CXZZ11-0903)
徐州师范大学研究生科研创新计划资助项目(2010YLB027)
-
文摘
汉语方言辨识中常用的转移差分倒谱(SDC)特征往往存在较多的冗余信息.对此,提出动态时频倒谱(DT-FC)特征.首先对倒谱矩阵进行离散余弦变换(DCT),然后对变换后的矩阵元素进行重组.基于新特征,在高斯混合模型系统下对闽、粤、吴3种方言进行辨识.实验结果表明,DTFC特征的性能明显优于SDC特征,其平均辨识率可达98.89%,较SDC特征提高了3.1%.
-
关键词
方言辨识
sdc特征
DTFC特征
高斯混合模型
-
Keywords
dialect identification
shifted delta cepstral(sdc) feature
dynamic time-frequency cepstral(DTFC) feature
Gaussian mixed model(GMM)
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于基频的朝鲜语方言辨识方法的研究
被引量:5
- 3
-
-
作者
刘双君
金小峰
崔荣一
-
机构
延边大学计算机科学与技术学科智能信息处理研究室
-
出处
《中文信息学报》
CSCD
北大核心
2017年第2期55-60,70,共7页
-
基金
吉林省科技厅自然科学基金(20140101225JC)
-
文摘
该文提出了一种基于基音频率特征的中国朝鲜族语言、韩国朝鲜语和朝鲜朝鲜语方言的自动辨识方法。首先,选择具有良好区分度的基频移位差分系数作为三个方言的特征参数;其次,设计和采用了分层支持向量机分类器,并进一步引入投票法确定最佳的分类结果。实验结果表明该文提取的特征参数具有良好的区分性和较强的稳定性,该文提出的方言辨识方法比传统的移位差分倒谱系数特征方法识别率高,可以有效解决朝鲜朝鲜语、韩国朝鲜语和中国朝鲜族语言的方言辨识问题。
-
关键词
方言辨识
语种辨识
基频特征
移位差分系数
支持向量机
-
Keywords
dialect identification
language identification
pitch feature
shifted delta cepstral coefficients
support vector machine
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名一种静态特征与动态特征结合的方言辨识方法
被引量:2
- 4
-
-
作者
何艳
于凤芹
-
机构
江南大学物联网工程学院
-
出处
《计算机工程与应用》
CSCD
2012年第13期105-108,共4页
-
基金
国家自然科学基金(No.61075008)
-
文摘
针对MFCC仅反映语音静态特征导致的方言识别率低的问题,而SDC由于考虑了前后帧差分倒谱的影响,能反映语音的动态特征;同时考虑方言的静态与动态特征,对普通话、上海话、广东话和闽南话4种方言进行MFCC特征和SDC特征提取,将其两组特征组合送入支持向量机进行辨识,并研究了针对4种方言的SDC的局部最优参数组合。仿真实验结果表明,同时考虑方言的静态与动态特征方法的识别率高达92.5%,但识别率的提高是以延长运算时间为代价的。
-
关键词
方言辨识
MEL频率倒谱系数
滑动差分倒谱特征
支持向量机
-
Keywords
dialect identification
Mel Frequence cepstral Coefficients (MFCC)
shifted delta Cepstra (sdc)
Support Vector Machine (SVM)
-
分类号
TN912
[电子电信—通信与信息系统]
-
-
题名一种新的低俗语音识别方法
- 5
-
-
作者
周建政
-
机构
天格科技(杭州)有限公司
-
出处
《计算机工程与应用》
CSCD
2013年第1期156-158,共3页
-
基金
浙江省科技厅重大专项(No.2010C11049)
-
文摘
为了应对低俗视频语音等多媒体信息在网络上的大量传播,提出了一种基于移位差分倒谱参数特征的低俗语音识别方法。该方法对输入的语音信号进行分帧,提取移位差分倒谱参数特征,采用了高斯混合模型进行粗分类,对粗分为低俗的语音帧再用支持向量机分类器进行确认。实验结果表明,该方法具有较高的正识别率和较低的误识别率,可用于网络上低俗语音和视频信息的过滤。
-
关键词
不良信息过滤
低俗语音识别
移位差分倒谱参数
高斯混合模型
支持向量机
-
Keywords
objectionable information filter
objectionable sounds recognition
shifted delta cepstral features
Gaussian MaxtureModel( GMM )
Support Vector Machine( SVM )
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-