期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
基于VQ-GMM的音频分类 被引量:1
1
作者 张瑞杰 李弼程 +1 位作者 张连海 屈丹 《信息工程大学学报》 2008年第4期423-426,454,共5页
音频分类在基于内容的音频、视频检索和分析中起着重要作用。文章针对静音、语音、音乐和环境背景音4类音频提出基于VQ-GMM的分类算法。首先通过阈值判决区分静音和非静音,然后利用VQ-GMM分类器将非静音进而分为语音、音乐和环境背景音... 音频分类在基于内容的音频、视频检索和分析中起着重要作用。文章针对静音、语音、音乐和环境背景音4类音频提出基于VQ-GMM的分类算法。首先通过阈值判决区分静音和非静音,然后利用VQ-GMM分类器将非静音进而分为语音、音乐和环境背景音。实验结果表明该方法的分类性能良好,平均正确率可达95%。 展开更多
关键词 音频分类 VQ—GMM 阈值判决
下载PDF
一种基于图像检索的机器人自定位方法 被引量:4
2
作者 刘洞波 刘国荣 +1 位作者 喻妙华 胡慧 《传感技术学报》 CAS CSCD 北大核心 2010年第4期548-552,共5页
针对单目视觉机器人的定位问题,提出了一种基于EM(expectation maximization algorithm)的混合高斯粒子滤波定位算法。采用高斯混合模型矢量量化的方法生成图像直方图,利用图像特征相似性度量方法对提取的图像直方图进行匹配,并将匹配... 针对单目视觉机器人的定位问题,提出了一种基于EM(expectation maximization algorithm)的混合高斯粒子滤波定位算法。采用高斯混合模型矢量量化的方法生成图像直方图,利用图像特征相似性度量方法对提取的图像直方图进行匹配,并将匹配的结果应用到粒子滤波定位中,实现了室内结构化环境下机器人的全局定位。仿真实验结果表明颜色特征提取方法和机器人定位方法的有效性。 展开更多
关键词 移动机器人 高斯混合模型 矢量量化 MONTE Carlo定位
下载PDF
基于MVQM的说话人识别的研究
3
作者 谢建平 成新民 赵力 《电声技术》 2006年第2期41-43,共3页
提出了一种新的说话人识别方法。该方法综合了VQ和GMM的优点,通过用VQ误差尺度取代传统GMM的输出概率函数,减少了建模时对训练数据量的要求,提高了识别速度。实验结果证明了该方法的有效性。
关键词 说话人识别 矢量量化 混合高斯模型 混合矢量量化模型
下载PDF
与文本无关的说话人辨认系统中一种新的使用基音周期方法研究 被引量:5
4
作者 段新 黄新宇 吴淑珍 《北京大学学报(自然科学版)》 CAS CSCD 北大核心 2003年第5期690-696,共7页
研究了与文本无关的说话人辨认系统中一种新的使用基音周期方法。在说话人辨认系统中将矢量量化 (VQ)、高斯混合模型 (GMM)分类器结合 ,使用升正弦窗函数加权的线性预测倒谱系数 (LPCC)。在训练时为训练集中的每个说话人估计一个一维高... 研究了与文本无关的说话人辨认系统中一种新的使用基音周期方法。在说话人辨认系统中将矢量量化 (VQ)、高斯混合模型 (GMM)分类器结合 ,使用升正弦窗函数加权的线性预测倒谱系数 (LPCC)。在训练时为训练集中的每个说话人估计一个一维高斯形式的基音周期概率密度函数 ;在识别时 ,将测试语音中提取的基音周期在训练集说话人基音周期概率模型中得到的基音周期概率密度对VQ、GMM分类器的似然测度加权 ,形成新的似然测度。实验结果表明 ,使用新的似然测度进行与文本无关的说话人辨认比VQ、GMM分类器的辨认率有较大的提高 ,码字个数为 8,测试时间为 8s时 ,辨认率相对VQ提高约 13%。 展开更多
关键词 矢量量化(VQ) 高斯混合模型(GMM) 升正弦窗函数 基音周期概率密度的高斯函数估计 加权的似然测度
下载PDF
说话人识别的特征组合方法 被引量:2
5
作者 毛燕湖 曾以成 +1 位作者 陈雨莺 谢小娟 《计算机应用》 CSCD 北大核心 2015年第A02期242-244,共3页
针对说话人识别中线性预测系数(LPC)和梅尔频率倒谱系数(MFCC)的直接组合会增加特征参数的维数和出现运算量大的问题,提出了将LPC参数融入到MFCC参数的计算中的特征提取方法。首先,计算语音信号的LPC系数,求出LPC功率谱;其次,将LPC功率... 针对说话人识别中线性预测系数(LPC)和梅尔频率倒谱系数(MFCC)的直接组合会增加特征参数的维数和出现运算量大的问题,提出了将LPC参数融入到MFCC参数的计算中的特征提取方法。首先,计算语音信号的LPC系数,求出LPC功率谱;其次,将LPC功率谱通过三角形滤波器组,并取对数;最后,将取对数后的输出做离散余弦变换,得到新特征线性预测梅尔频率倒谱系数(LPMFCC)。LPMFCC参数兼具LPC参数的声道特性和MFCC参数的听觉特性,虽增加了一步计算,但不增加参数的维数,运算量相对较少。实验结果表明,在纯净语音环境下,提出的LPMFCC参数的说话人识别率较LPC参数和MFCC参数的说话人识别率分别提升了18.57%和10%,在不同噪声环境下,分别提高了13.22%和4.55%。 展开更多
关键词 说话人识别 梅尔频率倒谱系数 线性预测系数 矢量量化 高斯混合模型
下载PDF
基于VQ和GMM的实时声纹识别研究 被引量:3
6
作者 鲁晓倩 关胜晓 《计算机系统应用》 2014年第9期6-12,共7页
目前声纹识别系统已经实现较高的识别精度,但是随着目标说话人个数的增加,一般系统很难满足实时性的要求,由此提出一种双层识别模型.在第一层识别模型中,采用基于VQ-VPT(Vector Quantization-Vantage Point Tree)模型进行快速匹配,挑选... 目前声纹识别系统已经实现较高的识别精度,但是随着目标说话人个数的增加,一般系统很难满足实时性的要求,由此提出一种双层识别模型.在第一层识别模型中,采用基于VQ-VPT(Vector Quantization-Vantage Point Tree)模型进行快速匹配,挑选出与测试者声纹特征最相近的K个目标说话人声纹模型.在第二层识别模型中,采用GMM-UBM(Gaussian Mixture Model-Universal Background Model)模型,精确匹配上层模型得到的K个目标说话人声纹模型,并做出最终的判决.实验验证,双层识别模型在确保高识别精度的前提下,大幅度的提高了系统的识别速度. 展开更多
关键词 声纹识别 矢量量化 优势节点树 高斯混合模型 通用背景模型
下载PDF
基于音素发生率的自动语言辨识
7
作者 戴冠男 王炳锡 屈丹 《信号处理》 CSCD 北大核心 2006年第2期285-288,共4页
不同语言的语音基元的种类和数量存在着差异,即使两种语言有相同的音素,它们的发生频率也存在差异。以前基于音素标识的语言辨识系统,难以引入新的语言。本文分别使用了GMM和VQ模型对音素符号发生率信息在语言辨识中的作用进行了研究,... 不同语言的语音基元的种类和数量存在着差异,即使两种语言有相同的音素,它们的发生频率也存在差异。以前基于音素标识的语言辨识系统,难以引入新的语言。本文分别使用了GMM和VQ模型对音素符号发生率信息在语言辨识中的作用进行了研究,使用了音素符号发生率方法以及三种改进方法,各项实验结果表明音素符号发生率信息在语言辨识中具有一定的作用,可以作为语言辨识方法研究的一个方向。 展开更多
关键词 高斯混合模型 矢量量化模型 混合训练模型 音素发生率 有效性 有效性对
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部