本文研究了一种结合"声学信息"和"音素配位学信息"进行语言辨识的新算法,首先在预处理中对语音进行自动分段,在特征层上引入带有长时信息的段级特征参数——段级移位差分倒谱,在模型层上利用高斯混合模型(Gaussi- a...本文研究了一种结合"声学信息"和"音素配位学信息"进行语言辨识的新算法,首先在预处理中对语音进行自动分段,在特征层上引入带有长时信息的段级特征参数——段级移位差分倒谱,在模型层上利用高斯混合模型(Gaussi- an Mixture Model,GMM)将语音信号自动标识为符号序列,进而引入多元语言模型(Multi-gram Language Model,MLM)来对"音素配位学信息"进行建模,最后将"GMM得分"和"MLM得分"送入后端多分类支持向量机模型得到最终识别结果。相关实验表明,新系统不需手工标识的语料,识别速度快,对OGI标准语料库中的五种语言获得了开集正识率为78.84%的结果。展开更多
针对城市窨井盖被盗或被损坏的现象,提出一种基于改进动态时间规整(Dynamic Time Warping,DTW)算法的窨井盖盗损检测方法。根据窨井盖在正常振动与非正常振动下产生的声纹差异,采用梅尔倒谱系数(Mel-frequency Cepstral Coefficients,MF...针对城市窨井盖被盗或被损坏的现象,提出一种基于改进动态时间规整(Dynamic Time Warping,DTW)算法的窨井盖盗损检测方法。根据窨井盖在正常振动与非正常振动下产生的声纹差异,采用梅尔倒谱系数(Mel-frequency Cepstral Coefficients,MFCC)并整合差分倒谱系数作为特征参数,结合改进的DTW算法进行声纹识别。通过调整动态时间规整函数,将传统DTW算法搜索区域约束为较小面积的菱形,使其达到减小存储空间和缩短识别时间的目的。仿真实验结果表明,铁锤敲击井盖声、车辆碾压井盖声等七种声音类型的平均识别率为81.4%,平均识别速率提高了29.37%。展开更多
文摘本文研究了一种结合"声学信息"和"音素配位学信息"进行语言辨识的新算法,首先在预处理中对语音进行自动分段,在特征层上引入带有长时信息的段级特征参数——段级移位差分倒谱,在模型层上利用高斯混合模型(Gaussi- an Mixture Model,GMM)将语音信号自动标识为符号序列,进而引入多元语言模型(Multi-gram Language Model,MLM)来对"音素配位学信息"进行建模,最后将"GMM得分"和"MLM得分"送入后端多分类支持向量机模型得到最终识别结果。相关实验表明,新系统不需手工标识的语料,识别速度快,对OGI标准语料库中的五种语言获得了开集正识率为78.84%的结果。
文摘针对城市窨井盖被盗或被损坏的现象,提出一种基于改进动态时间规整(Dynamic Time Warping,DTW)算法的窨井盖盗损检测方法。根据窨井盖在正常振动与非正常振动下产生的声纹差异,采用梅尔倒谱系数(Mel-frequency Cepstral Coefficients,MFCC)并整合差分倒谱系数作为特征参数,结合改进的DTW算法进行声纹识别。通过调整动态时间规整函数,将传统DTW算法搜索区域约束为较小面积的菱形,使其达到减小存储空间和缩短识别时间的目的。仿真实验结果表明,铁锤敲击井盖声、车辆碾压井盖声等七种声音类型的平均识别率为81.4%,平均识别速率提高了29.37%。