期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
7
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于VQ-GMM的音频分类
被引量:
1
1
作者
张瑞杰
李弼程
+1 位作者
张连海
屈丹
《信息工程大学学报》
2008年第4期423-426,454,共5页
音频分类在基于内容的音频、视频检索和分析中起着重要作用。文章针对静音、语音、音乐和环境背景音4类音频提出基于VQ-GMM的分类算法。首先通过阈值判决区分静音和非静音,然后利用VQ-GMM分类器将非静音进而分为语音、音乐和环境背景音...
音频分类在基于内容的音频、视频检索和分析中起着重要作用。文章针对静音、语音、音乐和环境背景音4类音频提出基于VQ-GMM的分类算法。首先通过阈值判决区分静音和非静音,然后利用VQ-GMM分类器将非静音进而分为语音、音乐和环境背景音。实验结果表明该方法的分类性能良好,平均正确率可达95%。
展开更多
关键词
音频分类
VQ—GMM
阈值判决
下载PDF
职称材料
一种基于图像检索的机器人自定位方法
被引量:
4
2
作者
刘洞波
刘国荣
+1 位作者
喻妙华
胡慧
《传感技术学报》
CAS
CSCD
北大核心
2010年第4期548-552,共5页
针对单目视觉机器人的定位问题,提出了一种基于EM(expectation maximization algorithm)的混合高斯粒子滤波定位算法。采用高斯混合模型矢量量化的方法生成图像直方图,利用图像特征相似性度量方法对提取的图像直方图进行匹配,并将匹配...
针对单目视觉机器人的定位问题,提出了一种基于EM(expectation maximization algorithm)的混合高斯粒子滤波定位算法。采用高斯混合模型矢量量化的方法生成图像直方图,利用图像特征相似性度量方法对提取的图像直方图进行匹配,并将匹配的结果应用到粒子滤波定位中,实现了室内结构化环境下机器人的全局定位。仿真实验结果表明颜色特征提取方法和机器人定位方法的有效性。
展开更多
关键词
移动机器人
高斯混合模型
矢量量化
MONTE
Carlo定位
下载PDF
职称材料
基于MVQM的说话人识别的研究
3
作者
谢建平
成新民
赵力
《电声技术》
2006年第2期41-43,共3页
提出了一种新的说话人识别方法。该方法综合了VQ和GMM的优点,通过用VQ误差尺度取代传统GMM的输出概率函数,减少了建模时对训练数据量的要求,提高了识别速度。实验结果证明了该方法的有效性。
关键词
说话人识别
矢量量化
混合高斯模型
混合矢量量化模型
下载PDF
职称材料
与文本无关的说话人辨认系统中一种新的使用基音周期方法研究
被引量:
5
4
作者
段新
黄新宇
吴淑珍
《北京大学学报(自然科学版)》
CAS
CSCD
北大核心
2003年第5期690-696,共7页
研究了与文本无关的说话人辨认系统中一种新的使用基音周期方法。在说话人辨认系统中将矢量量化 (VQ)、高斯混合模型 (GMM)分类器结合 ,使用升正弦窗函数加权的线性预测倒谱系数 (LPCC)。在训练时为训练集中的每个说话人估计一个一维高...
研究了与文本无关的说话人辨认系统中一种新的使用基音周期方法。在说话人辨认系统中将矢量量化 (VQ)、高斯混合模型 (GMM)分类器结合 ,使用升正弦窗函数加权的线性预测倒谱系数 (LPCC)。在训练时为训练集中的每个说话人估计一个一维高斯形式的基音周期概率密度函数 ;在识别时 ,将测试语音中提取的基音周期在训练集说话人基音周期概率模型中得到的基音周期概率密度对VQ、GMM分类器的似然测度加权 ,形成新的似然测度。实验结果表明 ,使用新的似然测度进行与文本无关的说话人辨认比VQ、GMM分类器的辨认率有较大的提高 ,码字个数为 8,测试时间为 8s时 ,辨认率相对VQ提高约 13%。
展开更多
关键词
矢量量化(VQ)
高斯混合模型(GMM)
升正弦窗函数
基音周期概率密度的高斯函数估计
加权的似然测度
下载PDF
职称材料
说话人识别的特征组合方法
被引量:
2
5
作者
毛燕湖
曾以成
+1 位作者
陈雨莺
谢小娟
《计算机应用》
CSCD
北大核心
2015年第A02期242-244,共3页
针对说话人识别中线性预测系数(LPC)和梅尔频率倒谱系数(MFCC)的直接组合会增加特征参数的维数和出现运算量大的问题,提出了将LPC参数融入到MFCC参数的计算中的特征提取方法。首先,计算语音信号的LPC系数,求出LPC功率谱;其次,将LPC功率...
针对说话人识别中线性预测系数(LPC)和梅尔频率倒谱系数(MFCC)的直接组合会增加特征参数的维数和出现运算量大的问题,提出了将LPC参数融入到MFCC参数的计算中的特征提取方法。首先,计算语音信号的LPC系数,求出LPC功率谱;其次,将LPC功率谱通过三角形滤波器组,并取对数;最后,将取对数后的输出做离散余弦变换,得到新特征线性预测梅尔频率倒谱系数(LPMFCC)。LPMFCC参数兼具LPC参数的声道特性和MFCC参数的听觉特性,虽增加了一步计算,但不增加参数的维数,运算量相对较少。实验结果表明,在纯净语音环境下,提出的LPMFCC参数的说话人识别率较LPC参数和MFCC参数的说话人识别率分别提升了18.57%和10%,在不同噪声环境下,分别提高了13.22%和4.55%。
展开更多
关键词
说话人识别
梅尔频率倒谱系数
线性预测系数
矢量量化
高斯混合模型
下载PDF
职称材料
基于VQ和GMM的实时声纹识别研究
被引量:
3
6
作者
鲁晓倩
关胜晓
《计算机系统应用》
2014年第9期6-12,共7页
目前声纹识别系统已经实现较高的识别精度,但是随着目标说话人个数的增加,一般系统很难满足实时性的要求,由此提出一种双层识别模型.在第一层识别模型中,采用基于VQ-VPT(Vector Quantization-Vantage Point Tree)模型进行快速匹配,挑选...
目前声纹识别系统已经实现较高的识别精度,但是随着目标说话人个数的增加,一般系统很难满足实时性的要求,由此提出一种双层识别模型.在第一层识别模型中,采用基于VQ-VPT(Vector Quantization-Vantage Point Tree)模型进行快速匹配,挑选出与测试者声纹特征最相近的K个目标说话人声纹模型.在第二层识别模型中,采用GMM-UBM(Gaussian Mixture Model-Universal Background Model)模型,精确匹配上层模型得到的K个目标说话人声纹模型,并做出最终的判决.实验验证,双层识别模型在确保高识别精度的前提下,大幅度的提高了系统的识别速度.
展开更多
关键词
声纹识别
矢量量化
优势节点树
高斯混合模型
通用背景模型
下载PDF
职称材料
基于音素发生率的自动语言辨识
7
作者
戴冠男
王炳锡
屈丹
《信号处理》
CSCD
北大核心
2006年第2期285-288,共4页
不同语言的语音基元的种类和数量存在着差异,即使两种语言有相同的音素,它们的发生频率也存在差异。以前基于音素标识的语言辨识系统,难以引入新的语言。本文分别使用了GMM和VQ模型对音素符号发生率信息在语言辨识中的作用进行了研究,...
不同语言的语音基元的种类和数量存在着差异,即使两种语言有相同的音素,它们的发生频率也存在差异。以前基于音素标识的语言辨识系统,难以引入新的语言。本文分别使用了GMM和VQ模型对音素符号发生率信息在语言辨识中的作用进行了研究,使用了音素符号发生率方法以及三种改进方法,各项实验结果表明音素符号发生率信息在语言辨识中具有一定的作用,可以作为语言辨识方法研究的一个方向。
展开更多
关键词
高斯混合模型
矢量量化模型
混合训练模型
音素发生率
有效性
有效性对
下载PDF
职称材料
题名
基于VQ-GMM的音频分类
被引量:
1
1
作者
张瑞杰
李弼程
张连海
屈丹
机构
信息工程大学信息工程学院
出处
《信息工程大学学报》
2008年第4期423-426,454,共5页
基金
国家863计划资助项目(2006AA01Z146)
文摘
音频分类在基于内容的音频、视频检索和分析中起着重要作用。文章针对静音、语音、音乐和环境背景音4类音频提出基于VQ-GMM的分类算法。首先通过阈值判决区分静音和非静音,然后利用VQ-GMM分类器将非静音进而分为语音、音乐和环境背景音。实验结果表明该方法的分类性能良好,平均正确率可达95%。
关键词
音频分类
VQ—GMM
阈值判决
Keywords
audio classification
vq-gmm
threshold judging
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
一种基于图像检索的机器人自定位方法
被引量:
4
2
作者
刘洞波
刘国荣
喻妙华
胡慧
机构
湖南大学电气与信息工程学院
湖南工程学院计算机与通信学院
出处
《传感技术学报》
CAS
CSCD
北大核心
2010年第4期548-552,共5页
基金
湖南省教育厅资助科研项目资助(08C224)
湖南省科技计划项目资助(2008FJ3029)
科技部科技人员服务企业行动项目资助(2009GJD20020)
文摘
针对单目视觉机器人的定位问题,提出了一种基于EM(expectation maximization algorithm)的混合高斯粒子滤波定位算法。采用高斯混合模型矢量量化的方法生成图像直方图,利用图像特征相似性度量方法对提取的图像直方图进行匹配,并将匹配的结果应用到粒子滤波定位中,实现了室内结构化环境下机器人的全局定位。仿真实验结果表明颜色特征提取方法和机器人定位方法的有效性。
关键词
移动机器人
高斯混合模型
矢量量化
MONTE
Carlo定位
Keywords
mobile robot
Gaussian mixtue model (GMM)
vector quantization (VQ)
Monte Carlo localization
分类号
TP24 [自动化与计算机技术—检测技术与自动化装置]
下载PDF
职称材料
题名
基于MVQM的说话人识别的研究
3
作者
谢建平
成新民
赵力
机构
丽水学院计算机与信息工程学院
东南大学无线电系
出处
《电声技术》
2006年第2期41-43,共3页
基金
教育部科学技术重点项目(03082)
国家自然基金(60472058)
文摘
提出了一种新的说话人识别方法。该方法综合了VQ和GMM的优点,通过用VQ误差尺度取代传统GMM的输出概率函数,减少了建模时对训练数据量的要求,提高了识别速度。实验结果证明了该方法的有效性。
关键词
说话人识别
矢量量化
混合高斯模型
混合矢量量化模型
Keywords
speaker recognition
VQ
Gaussian Mixture Model (GMM)
Mixture Vector Quantization Model(MVQM)
分类号
TN912.34 [电子电信—通信与信息系统]
下载PDF
职称材料
题名
与文本无关的说话人辨认系统中一种新的使用基音周期方法研究
被引量:
5
4
作者
段新
黄新宇
吴淑珍
机构
北京大学信息科学技术学院
出处
《北京大学学报(自然科学版)》
CAS
CSCD
北大核心
2003年第5期690-696,共7页
文摘
研究了与文本无关的说话人辨认系统中一种新的使用基音周期方法。在说话人辨认系统中将矢量量化 (VQ)、高斯混合模型 (GMM)分类器结合 ,使用升正弦窗函数加权的线性预测倒谱系数 (LPCC)。在训练时为训练集中的每个说话人估计一个一维高斯形式的基音周期概率密度函数 ;在识别时 ,将测试语音中提取的基音周期在训练集说话人基音周期概率模型中得到的基音周期概率密度对VQ、GMM分类器的似然测度加权 ,形成新的似然测度。实验结果表明 ,使用新的似然测度进行与文本无关的说话人辨认比VQ、GMM分类器的辨认率有较大的提高 ,码字个数为 8,测试时间为 8s时 ,辨认率相对VQ提高约 13%。
关键词
矢量量化(VQ)
高斯混合模型(GMM)
升正弦窗函数
基音周期概率密度的高斯函数估计
加权的似然测度
Keywords
vector quantization(VQ)
Gaussian mixed model(GMM)
raised-sine function windows
Gaussian function estimation for pitch period probability density
weighted likelihood measure
分类号
TN912.3 [电子电信—通信与信息系统]
下载PDF
职称材料
题名
说话人识别的特征组合方法
被引量:
2
5
作者
毛燕湖
曾以成
陈雨莺
谢小娟
机构
湘潭大学物理与光电工程学院
出处
《计算机应用》
CSCD
北大核心
2015年第A02期242-244,共3页
基金
国家自然科学基金资助项目(60972147)
文摘
针对说话人识别中线性预测系数(LPC)和梅尔频率倒谱系数(MFCC)的直接组合会增加特征参数的维数和出现运算量大的问题,提出了将LPC参数融入到MFCC参数的计算中的特征提取方法。首先,计算语音信号的LPC系数,求出LPC功率谱;其次,将LPC功率谱通过三角形滤波器组,并取对数;最后,将取对数后的输出做离散余弦变换,得到新特征线性预测梅尔频率倒谱系数(LPMFCC)。LPMFCC参数兼具LPC参数的声道特性和MFCC参数的听觉特性,虽增加了一步计算,但不增加参数的维数,运算量相对较少。实验结果表明,在纯净语音环境下,提出的LPMFCC参数的说话人识别率较LPC参数和MFCC参数的说话人识别率分别提升了18.57%和10%,在不同噪声环境下,分别提高了13.22%和4.55%。
关键词
说话人识别
梅尔频率倒谱系数
线性预测系数
矢量量化
高斯混合模型
Keywords
speaker recognition
Mel frequency cepstrum coefficient
linear prediction coefficient
Vector Quantization(VQ)
Gaussian Mixture Model(GMM)
分类号
TN912 [电子电信—通信与信息系统]
下载PDF
职称材料
题名
基于VQ和GMM的实时声纹识别研究
被引量:
3
6
作者
鲁晓倩
关胜晓
机构
中国科学技术大学信息科学技术学院
出处
《计算机系统应用》
2014年第9期6-12,共7页
文摘
目前声纹识别系统已经实现较高的识别精度,但是随着目标说话人个数的增加,一般系统很难满足实时性的要求,由此提出一种双层识别模型.在第一层识别模型中,采用基于VQ-VPT(Vector Quantization-Vantage Point Tree)模型进行快速匹配,挑选出与测试者声纹特征最相近的K个目标说话人声纹模型.在第二层识别模型中,采用GMM-UBM(Gaussian Mixture Model-Universal Background Model)模型,精确匹配上层模型得到的K个目标说话人声纹模型,并做出最终的判决.实验验证,双层识别模型在确保高识别精度的前提下,大幅度的提高了系统的识别速度.
关键词
声纹识别
矢量量化
优势节点树
高斯混合模型
通用背景模型
Keywords
voiceprint recognition vector quantization (VQ) vantage point tree (VPT) gaussian mixture model (GMM) universal background model (UBM)
分类号
TP391.41 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于音素发生率的自动语言辨识
7
作者
戴冠男
王炳锡
屈丹
机构
解放军信息工程大学
出处
《信号处理》
CSCD
北大核心
2006年第2期285-288,共4页
基金
国家自然科学基金委员会对“电话信道自然语音语言辨识研究”项目(批准号:No.60372038)的支持
文摘
不同语言的语音基元的种类和数量存在着差异,即使两种语言有相同的音素,它们的发生频率也存在差异。以前基于音素标识的语言辨识系统,难以引入新的语言。本文分别使用了GMM和VQ模型对音素符号发生率信息在语言辨识中的作用进行了研究,使用了音素符号发生率方法以及三种改进方法,各项实验结果表明音素符号发生率信息在语言辨识中具有一定的作用,可以作为语言辨识方法研究的一个方向。
关键词
高斯混合模型
矢量量化模型
混合训练模型
音素发生率
有效性
有效性对
Keywords
Gaussian Mixture Model ( GMM )
Vector Quantization ( VQ )
Mixed Training Model ( MTM )
Occurring of Phones
Usefulness
Usefulness Pair
分类号
TP391.4 [自动化与计算机技术—计算机应用技术]
S858.31 [农业科学—临床兽医学]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于VQ-GMM的音频分类
张瑞杰
李弼程
张连海
屈丹
《信息工程大学学报》
2008
1
下载PDF
职称材料
2
一种基于图像检索的机器人自定位方法
刘洞波
刘国荣
喻妙华
胡慧
《传感技术学报》
CAS
CSCD
北大核心
2010
4
下载PDF
职称材料
3
基于MVQM的说话人识别的研究
谢建平
成新民
赵力
《电声技术》
2006
0
下载PDF
职称材料
4
与文本无关的说话人辨认系统中一种新的使用基音周期方法研究
段新
黄新宇
吴淑珍
《北京大学学报(自然科学版)》
CAS
CSCD
北大核心
2003
5
下载PDF
职称材料
5
说话人识别的特征组合方法
毛燕湖
曾以成
陈雨莺
谢小娟
《计算机应用》
CSCD
北大核心
2015
2
下载PDF
职称材料
6
基于VQ和GMM的实时声纹识别研究
鲁晓倩
关胜晓
《计算机系统应用》
2014
3
下载PDF
职称材料
7
基于音素发生率的自动语言辨识
戴冠男
王炳锡
屈丹
《信号处理》
CSCD
北大核心
2006
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部