期刊文献+
共找到19篇文章
< 1 >
每页显示 20 50 100
基于MFCC和加权矢量量化的说话人识别系统 被引量:34
1
作者 邵央 刘丙哲 李宗葛 《计算机工程与应用》 CSCD 北大核心 2002年第5期127-128,共2页
文章介绍的说话人识别系统,采用能够反映人对语音的感知特性的Mel频率倒谱系数(Mel-FrequencyCeptralCoefficients,MFCC)作为特征参数,同时考虑到特征参数各维分量对于不同说话人的区分程度,采用加权的办法进行矢量量化。取得了很好的结... 文章介绍的说话人识别系统,采用能够反映人对语音的感知特性的Mel频率倒谱系数(Mel-FrequencyCeptralCoefficients,MFCC)作为特征参数,同时考虑到特征参数各维分量对于不同说话人的区分程度,采用加权的办法进行矢量量化。取得了很好的结果,系统训练和识别计算量和存储量都比较低。 展开更多
关键词 倒谱系数 说话人识别系统 加权矢量量化 MFCC 语音识别 INTERNET
下载PDF
基于支撑向量机的文本无关的说话人识别系统 被引量:8
2
作者 何昕 刘重庆 李介谷 《计算机工程》 EI CAS CSCD 北大核心 2000年第6期61-63,共3页
支撑向量机(SVM)是一种新的统计学习方法。提出一种基于支撑向量机的文本无关的说话人辨认系统,在作者的实验中得到了98%的平均识别率,同时实验表明同基于向量量化(VQ)和高斯混合模型(GMM)的经典方法相比,基于SVM的方法具有... 支撑向量机(SVM)是一种新的统计学习方法。提出一种基于支撑向量机的文本无关的说话人辨认系统,在作者的实验中得到了98%的平均识别率,同时实验表明同基于向量量化(VQ)和高斯混合模型(GMM)的经典方法相比,基于SVM的方法具有更好的性能。 展开更多
关键词 支撑向量机 说话人识别系统 语音识别 模式识别
下载PDF
基于LPC倒谱参数和支持向量机技术的说话人识别系统 被引量:4
3
作者 但志平 王以治 +1 位作者 黄艳 李保华 《电声技术》 北大核心 2004年第3期39-41,44,共4页
采用能够反映人对语音的感知特性的线性预测(LPC)倒谱参数作为特征参数,同时针对支持向量机技术对模式识别中的非线性、高维数的样本问题有非常好的分类效果和学习推广能力,设计了一个支持向量机分类器来进行说话人识别。试验结果验证... 采用能够反映人对语音的感知特性的线性预测(LPC)倒谱参数作为特征参数,同时针对支持向量机技术对模式识别中的非线性、高维数的样本问题有非常好的分类效果和学习推广能力,设计了一个支持向量机分类器来进行说话人识别。试验结果验证了该系统有很高的识别率和较强的鲁棒性。 展开更多
关键词 LPC倒谱参数 支持向量机 说话人识别系统 核函数 线性预测
下载PDF
一种与文本有关的说话人识别系统设计与实现 被引量:3
4
作者 王晶晶 陈中柱 +1 位作者 薛文涛 江红英 《计算机仿真》 CSCD 2004年第6期185-186,194,共3页
该文设计并实现了一种基于小波变换和线性预测的语音信号特征提取方法 (DWT -LPC)和自组织神经网络的与文本有关的说话人识别系统。该系统包括端点检测、特征提取、说话人识别、网络训练和神经网络参数五部分 ,结构简单 ,实时性能好 ,... 该文设计并实现了一种基于小波变换和线性预测的语音信号特征提取方法 (DWT -LPC)和自组织神经网络的与文本有关的说话人识别系统。该系统包括端点检测、特征提取、说话人识别、网络训练和神经网络参数五部分 ,结构简单 ,实时性能好 ,并且网络训练所需数据少。用MATLAB对说话人识别系统进行仿真实验 ,选择由元音、轻辅音和浊辅音组成的本文 ,经过测试 ,识别率达 98.5 %。 展开更多
关键词 说话人识别系统 小波变换 线性预测 DWT—LPC 自组织神经网络
下载PDF
基于高斯混合模型的说话人识别系统实验设计 被引量:2
5
作者 芮贤义 陈小平 俞一彪 《实验技术与管理》 CAS 北大核心 2022年第2期166-170,共5页
该文设计了基于高斯混合模型的说话人识别系统实验,通过录制小型语音库、提取表征说话人个性的特征参数、训练说话人模型和似然度判决,实现文本无关的说话人识别。实验以小组形式协作完成,并鼓励学生展开进阶研究,帮助学生提升团队协作... 该文设计了基于高斯混合模型的说话人识别系统实验,通过录制小型语音库、提取表征说话人个性的特征参数、训练说话人模型和似然度判决,实现文本无关的说话人识别。实验以小组形式协作完成,并鼓励学生展开进阶研究,帮助学生提升团队协作精神和创新精神,以及解决复杂工程问题的能力。所建立的全过程多维度立体化的实验考核体系,着眼于对学生的方案设计、实验操作、报告撰写、演示答辩等全过程评价,有助于激发学生的创造力和学习热情。 展开更多
关键词 实验设计 说话人识别系统 实验考核
下载PDF
基于GMM的说话人识别系统研究 被引量:2
6
作者 崔桂香 丁晓明 《北京电子科技学院学报》 2004年第4期1-5,共5页
说话人识别技术(声纹识别技术)以其独特优势在信息安全领域的应用逐渐增大。本文概括叙述了说话人识别的基本概念;介绍了在模拟噪声环境下,采用新特征提取算法的基于GMM的说话人识别系统的设计原理以及实现。测试结果表明,说话人辨认识... 说话人识别技术(声纹识别技术)以其独特优势在信息安全领域的应用逐渐增大。本文概括叙述了说话人识别的基本概念;介绍了在模拟噪声环境下,采用新特征提取算法的基于GMM的说话人识别系统的设计原理以及实现。测试结果表明,说话人辨认识别率达到96%以上。 展开更多
关键词 GMM 系统研究 说话人识别系统 声纹识别技术 特征提取算法 说话人辨认 信息安全 噪声环境 设计原理 识别
下载PDF
基于FPGA和DSP的说话人识别系统的设计与实现 被引量:1
7
作者 梁涛 张国杰 张效军 《电子技术应用》 北大核心 2008年第9期43-46,共4页
介绍了基于 Altera 的 FPGA 和 TI 的 DSP 的说话人识别系统的设计和实现方法,利用 FPGA并行计算能力,实现了语音信号的预处理、特征参数提取和模板匹配三个模块,提高了说话人识别系统的识别效率和识别速度,在性能上优于传统的基于 DSP... 介绍了基于 Altera 的 FPGA 和 TI 的 DSP 的说话人识别系统的设计和实现方法,利用 FPGA并行计算能力,实现了语音信号的预处理、特征参数提取和模板匹配三个模块,提高了说话人识别系统的识别效率和识别速度,在性能上优于传统的基于 DSP 的实现方法,适用于电信网络中实时大容量的说话人识别系统。 展开更多
关键词 FPGA DSP 说话人识别系统 MFCC DTW
下载PDF
MATLAB环境下基于矢量量化的说话人识别系统
8
作者 宋敏 刘幺和 谭保华 《湖北工业大学学报》 2006年第6期27-29,共3页
在MATLAB环境下实现基于矢量量化的说话人识别系统.在实时录音的情况下,利用该识别系统,对不同人的1-7 s的语音进行辨识,准确率可达到98%.识别时间根据使用人数的不同,测试语音长度的不同辨识时间从1-20 s,实现与文本无关的自动说话人... 在MATLAB环境下实现基于矢量量化的说话人识别系统.在实时录音的情况下,利用该识别系统,对不同人的1-7 s的语音进行辨识,准确率可达到98%.识别时间根据使用人数的不同,测试语音长度的不同辨识时间从1-20 s,实现与文本无关的自动说话人确认的实时识别. 展开更多
关键词 说话人识别系统 MATLAB 矢量量化
下载PDF
说话人识别系统研究 被引量:1
9
作者 刘刚 《网络安全技术与应用》 2003年第12期29-31,共3页
说话人识别与指纹、脸型等识别技术一样是生物特征识 别,是利用包含在说话人的语音波形中特有的 个体信息自动识别说话人身份的过程。可广泛 用于银行、证券系统、网络安全及军队安全系统 中。本文就说话人识别分类、说话人识别实现的 ... 说话人识别与指纹、脸型等识别技术一样是生物特征识 别,是利用包含在说话人的语音波形中特有的 个体信息自动识别说话人身份的过程。可广泛 用于银行、证券系统、网络安全及军队安全系统 中。本文就说话人识别分类、说话人识别实现的 物理基础及说话人识别系统的实现方法作了一 些分析。 展开更多
关键词 说话人识别系统 生物识别 密码方式 语音信号处理 线性预测 语音识别 隐马尔可夫模型
原文传递
一种适于说话人识别的非线性频率尺度变换 被引量:13
10
作者 俞一彪 袁冬梅 薛峰 《声学学报》 EI CSCD 北大核心 2008年第5期450-455,共6页
传统的非线性频率尺度变换虽然能够反映人类听觉系统(HAS:Human Auditory System)的感知特性,但不能区别对待语音中包含的语义和个性特征,在表达说话人个性特征方面并不充分。通过分析语音信号不同频带短时谱对说话人识别性能的影响,采... 传统的非线性频率尺度变换虽然能够反映人类听觉系统(HAS:Human Auditory System)的感知特性,但不能区别对待语音中包含的语义和个性特征,在表达说话人个性特征方面并不充分。通过分析语音信号不同频带短时谱对说话人识别性能的影响,采用最小二乘法多项式曲线拟合技术,提出了一种非线性频率尺度变换。实验表明,与传统的Mel、Bark和ERB频率尺度变换相比,在同样的训练与测试条件下,平均误识率分别降低70.5%,60.8%和70.5%。这一结果说明,本文提出的非线性频率尺度变换有效地增强了短时谱的说话人个性特征,能够提高说话人识别系统的性能。 展开更多
关键词 说话人识别系统 非线性频率 尺度变换 人类听觉系统 个性特征 识别性能 语音信号 HUMAN
下载PDF
采用归一化补偿变换的与文本无关的说话人识别 被引量:13
11
作者 包永强 赵力 邹采荣 《声学学报》 EI CSCD 北大核心 2006年第1期55-60,共6页
在噪声环境下,特别是当说话人识别最常用的模型——高斯混合模型(GMM)失配的情况下,需要对其输出帧似然概率的统计特性进行补偿。文章根据说话人识别的声学特性,提出了一种非线性变换方法——归一化补偿变换。理论分析和实验结果表明:... 在噪声环境下,特别是当说话人识别最常用的模型——高斯混合模型(GMM)失配的情况下,需要对其输出帧似然概率的统计特性进行补偿。文章根据说话人识别的声学特性,提出了一种非线性变换方法——归一化补偿变换。理论分析和实验结果表明:与常用的最大似然(ML)变换相比,该变换能够提高系统识别率,最大可达3.7%,同时可降低误识率,最大可达45.1%。结果说明归一化补偿变换方法基本克服了在与文本无关说话人识别系统中,当说话人的个性特征不断变化、语音与噪声不能很好地分离或者降噪算法对语音有损伤、模型不能很好地匹配时,需要对模型输出的似然概率(得分)进行补偿的局限。这也说明对模型输出的似然概率进行处理是降低噪声和干扰的影响、提高说话人识别率的有效方法。 展开更多
关键词 说话人识别系统 与文本无关 高斯混合模型(GMM) 归一化 补偿 噪声环境 变换方法 统计特性 声学特性 最大似然
下载PDF
感知听觉场景分析的说话人识别 被引量:4
12
作者 吴迪 陶智 +4 位作者 张晓俊 周燕 潘欣裕 肖仲喆 赵鹤鸣 《声学学报》 EI CSCD 北大核心 2016年第2期260-272,共13页
针对低信噪比说话人识别中缺失数据特征方法鲁棒性下降的问题,提出了一种采用感知听觉场景分析的缺失数据特征提取方法。首先求取语音的缺失数据特征谱,并由语音的感知特性求出感知特性的语音含量。含噪语音经过感知特性的语音增强和对... 针对低信噪比说话人识别中缺失数据特征方法鲁棒性下降的问题,提出了一种采用感知听觉场景分析的缺失数据特征提取方法。首先求取语音的缺失数据特征谱,并由语音的感知特性求出感知特性的语音含量。含噪语音经过感知特性的语音增强和对其语谱的二维增强后求解出语音的分布,联合感知特性语音含量和缺失强度参数提取出感知听觉因子。再结合缺失数据特征谱把特征的提取过程分解为不同听觉场景进行区分地分析和处理,以增强说话人识别系统的鲁棒性能。实验结果表明,在-10 dB到10 dB的低信噪比环境下,对于4种不同的噪声,提出的方法比5种对比方法的鲁棒性均有提高,平均识别率分别提高26.0%,19.6%,12.7%,4.6%和6.5%。论文提出的方法,是一种在时-频域中寻找语音鲁棒特征的方法,更适合于低信噪比环境下的说话人识别。 展开更多
关键词 说话人识别系统 听觉场景分析 感知特性 语音增强 鲁棒性能 特征方法 缺失数据 低信噪比
下载PDF
基于段级特征主成分分析的说话人识别算法 被引量:4
13
作者 储雯 李银国 +1 位作者 徐洋 孟祥涛 《计算机应用》 CSCD 北大核心 2013年第7期1935-1937,1968,共4页
为了提高说话人识别(SR)系统的运算速度,增强其鲁棒性,以现有的帧级语音特征为基础,提出了一种基于段级特征主成分分析的说话人识别算法。该算法在训练和识别阶段以段级特征代替帧级特征,然后用主成分分析方法对段级特征进行降维、去相... 为了提高说话人识别(SR)系统的运算速度,增强其鲁棒性,以现有的帧级语音特征为基础,提出了一种基于段级特征主成分分析的说话人识别算法。该算法在训练和识别阶段以段级特征代替帧级特征,然后用主成分分析方法对段级特征进行降维、去相关。实验结果表明,该算法的系统训练时间、测试时间分别为基线系统的47.8%、40.0%,同时识别率略有提高,抑制了噪声对说话人识别系统的影响。该结果验证了基于段级特征主成分分析的说话人识别算法在识别率有所提高的情况下取得了较快的识别速度,同时在不同噪声环境下的不同信噪比情况下均可以提高系统识别率。 展开更多
关键词 说话人识别 非线性分段 主成分分析 说话人识别系统
下载PDF
基于高斯混合模型移动因子补偿的说话人识别方法 被引量:3
14
作者 姜涛 韩纪庆 郑铁然 《声学学报》 EI CSCD 北大核心 2011年第6期658-664,共7页
提出一种模型补偿方法,以克服基于高斯混合模型的文本无关说话人识别系统性能随目标话者训练语料长度减小而下降的问题。该方法首先构造了一个低维的移动空间,每个训练语料较充分说话人模型的自适应过程均可用该空间中的移动因子表示,... 提出一种模型补偿方法,以克服基于高斯混合模型的文本无关说话人识别系统性能随目标话者训练语料长度减小而下降的问题。该方法首先构造了一个低维的移动空间,每个训练语料较充分说话人模型的自适应过程均可用该空间中的移动因子表示,然后在目标话者训练语料较不充分的条件下,从受训练语料长度影响较小的话者模型分量中学习移动因子,并依据它对受语料长度影响较大的分量进行参数补偿。和基线系统相比,该方法在相同的训练和评测集上,等错误率指标下,获得相对约7%的性能提升。 展开更多
关键词 说话人识别系统 高斯混合模型 补偿方法 移动 识别方法 因子 自适应过程 文本无关
下载PDF
Mel子带谱质心和高斯混合相关性在鲁棒话者识别中的应用 被引量:3
15
作者 邓菁 郑方 +1 位作者 刘建 吴文虎 《声学学报》 EI CSCD 北大核心 2006年第5期471-475,共5页
提出了两种方法以克服背景噪音的干扰并提高说话人识别系统的鲁棒性:一种方法是基于频谱峰值位置受背景噪音影响相对较小的考虑,将子带幅度信息和子带Mel频谱质心(SMSC)相结合;另一种方法是通过计算类转移概率矩阵来对隐藏于高斯混合... 提出了两种方法以克服背景噪音的干扰并提高说话人识别系统的鲁棒性:一种方法是基于频谱峰值位置受背景噪音影响相对较小的考虑,将子带幅度信息和子带Mel频谱质心(SMSC)相结合;另一种方法是通过计算类转移概率矩阵来对隐藏于高斯混合相关(GMC)中的说话人高层信息进行建模。实验表明SMSC和GMC都能够在平稳噪音环境下提高说话人识别系统的鲁棒性,并且采用SMSC和GMC的GMM-UBM系统跟使用传统MFCC的GMM-UBM基准系统相比,平均错误率下降了11.7%。 展开更多
关键词 鲁棒性 混合相 Mel 话者识别 子带 说话人识别系统 高斯 质心
下载PDF
基于ResNet-LSTM的多类型伪装语音检测
16
作者 苏卓艺 《数字技术与应用》 2023年第9期11-15,57,共6页
现今,随着语音处理算法及相应工具的成熟,这给社会带来便利的同时,亦面临不少新的安全问题。其中,伪装语音便是亟待解决的重要安全问题之一。根据已有的研究记录表明:伪装语音能轻易骗过人耳及说话人识别系统,从而冒充他人或隐藏说话人... 现今,随着语音处理算法及相应工具的成熟,这给社会带来便利的同时,亦面临不少新的安全问题。其中,伪装语音便是亟待解决的重要安全问题之一。根据已有的研究记录表明:伪装语音能轻易骗过人耳及说话人识别系统,从而冒充他人或隐藏说话人身份,对人身、经济等领域均带来严重威胁。目前,针对伪装语音的检测研究已经有了一定的进展。但大多数的研究所都只针对一种类型的伪装语音进行研究和检测,在应对其他类型的伪装攻击时,往往检测率不高。而在实际应用场合中,一般不能提前知道伪装语音的类型。 展开更多
关键词 实际应用场合 检测率 伪装攻击 说话人识别系统 检测研究
下载PDF
ACE框架在网络通讯软件设计中的应用研究 被引量:4
17
作者 崔桂香 丁晓明 《北京电子科技学院学报》 2004年第4期55-59,共5页
本文介绍了利用ACE(Adapted Communication Environment)实现通信软件的设计机制和优越性,浅析了ACE中主动对象和前摄式模式机制,并使用这两种构件实现了说话人识别系统多机控制子系统。
关键词 ACE 软件设计 网络通讯 说话人识别系统 应用 框架 控制子系统 设计机制 通信软件 主动对象 多机 构件
下载PDF
一种RBFN和FLD融合的说话人识别方法
18
作者 连翰 汪峥 王建军 《复旦学报(自然科学版)》 CAS CSCD 北大核心 2005年第1期118-121,127,共5页
提出一种新的可用于说话人识别的径向基函数网络(RBFN)阵列.RBFN网设计思想是在确定网络中心点之后采用最小线性方差作为目标函数解得最优权重,该方法并不能得到最优分类效果.使用Fisher目标函数,替代RBF中的误差目标函数来求取最优权重... 提出一种新的可用于说话人识别的径向基函数网络(RBFN)阵列.RBFN网设计思想是在确定网络中心点之后采用最小线性方差作为目标函数解得最优权重,该方法并不能得到最优分类效果.使用Fisher目标函数,替代RBF中的误差目标函数来求取最优权重,用与文本无关的闭集说话人识别系统对该算法进行了验证,实验结果表明,该方法提高了RBF分类能力,比传统的RBF算法以及ROLS算法具有更高的识别率,并在识别效果接近GMM方法的情况下计算量大幅度减少. 展开更多
关键词 RBF ROLS 最优 算法 说话人识别系统 网络中心 识别 与文本无关 幅度 阵列
原文传递
基于帧间相关特性和汉语音节组成规则的连接数字串的音节切分
19
作者 陈雁翔 戴蓓蒨 +1 位作者 周曦 李辉 《模式识别与人工智能》 EI CSCD 北大核心 2003年第3期352-356,共5页
本文提出了一种基于帧间相关特性的连续语音流的音节切分方法,采用反映相邻帧间LPC系数相关程度的帧间相关特性及其参数,进行连续语音流的分段切分,并通过时域参数对切分出的各个语音段进行音素性质标记,再根据汉语音节组成规则最后确... 本文提出了一种基于帧间相关特性的连续语音流的音节切分方法,采用反映相邻帧间LPC系数相关程度的帧间相关特性及其参数,进行连续语音流的分段切分,并通过时域参数对切分出的各个语音段进行音素性质标记,再根据汉语音节组成规则最后确定出音节切分及其边界。汉语数字串语音流的音节切分实验表明了该方法的有效性。 展开更多
关键词 语音识别 说话人识别系统 连续语音流 音节切分 连接数字串 汉语音节组成规则 帧间相关特性
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部