-
题名基于NAQ的语音情感识别研究
被引量:1
- 1
-
-
作者
白洁
蒋冬梅
谢磊
付中华
任翠红
-
机构
西北工业大学计算机学院
海军兵种指挥学院作战指挥系
-
出处
《计算机应用研究》
CSCD
北大核心
2008年第11期3243-3245,3258,共4页
-
基金
国家自然科学基金资助项目(60703104)
陕西省自然科学基础研究计划资助项目(2007F15)
-
文摘
研究了用迭代自适应逆滤波器估计声门激励的方法,以声门激励的时域参数归一化振幅商作为特征,对六种不同情感的连续语音,首先使用F-ratio准则判别其对情感的区分能力,然后运用混合高斯模型对语音情感进行建模和识别。采用eNTERFACE’05情感语音数据库中的语音,比较了以整句NAQ值作为特征和以元音段的NAQ值作为特征,以及主观感知的情感识别结果。实验表明元音段的NAQ值是一种具有判别力的语音情感特征。
-
关键词
迭代自适应逆滤波
归一化振幅商
F-ratio准则
混合高斯模型
-
Keywords
IAIF (iterative adaptive inverse filtering)
NAQ (normalized amplitude quotient)
F.ratio criterion
GMM(Gaussian mixture models)
-
分类号
TP391.42
[自动化与计算机技术—计算机应用技术]
-
-
题名归一化振幅商在语音情感识别中的应用
被引量:1
- 2
-
-
作者
白洁
蒋冬梅
-
机构
西北工业大学计算机学院
海军兵种指挥学院作战指挥系
-
出处
《计算机仿真》
CSCD
北大核心
2009年第2期183-186,共4页
-
基金
国家自然科学基金项目(60703104)
-
文摘
提出了一种新的连续语音情感识别特征:语音元音段声门激励的时域参数归一化振幅商(the normalized amplitude quotient,NAQ)。该方法首先运用迭代自适应逆滤波器(Iterative Adaptive Inverse Filtering,IAIF)估计声门波,然后采用NAQ值来描述声门开启和闭合的特性。采用eNERFACE’05听视觉情感语音数据库中六种不同情感的语音为实验数据,以情感语音元音段的归一化振幅商值为特征,使用直方图和盒形图分析其特征的分布和对情感的区分能力;以情感语句元音段的NAQ值的均值、方差、最大值、最小值作为特征,用高斯混合模型(Gaussian Mixture Models,GMM)和k-近邻法进行了语音情感识别实验,结果表明NAQ特征对语音情感具有较强的区别能力。
-
关键词
归一化振幅商
迭代自适应逆滤波
高斯混合模型
近邻法
-
Keywords
Normalized amplitude quotient ( NAQ )
Iterative adaptive inverse filtering (IAIF)
Ganssian mixture models (GMM)
Nearest neighbor algorithm
-
分类号
TP391.42
[自动化与计算机技术—计算机应用技术]
-