期刊文献+
共找到91篇文章
< 1 2 5 >
每页显示 20 50 100
一种适于说话人识别的非线性频率尺度变换 被引量:13
1
作者 俞一彪 袁冬梅 薛峰 《声学学报》 EI CSCD 北大核心 2008年第5期450-455,共6页
传统的非线性频率尺度变换虽然能够反映人类听觉系统(HAS:Human Auditory System)的感知特性,但不能区别对待语音中包含的语义和个性特征,在表达说话人个性特征方面并不充分。通过分析语音信号不同频带短时谱对说话人识别性能的影响,采... 传统的非线性频率尺度变换虽然能够反映人类听觉系统(HAS:Human Auditory System)的感知特性,但不能区别对待语音中包含的语义和个性特征,在表达说话人个性特征方面并不充分。通过分析语音信号不同频带短时谱对说话人识别性能的影响,采用最小二乘法多项式曲线拟合技术,提出了一种非线性频率尺度变换。实验表明,与传统的Mel、Bark和ERB频率尺度变换相比,在同样的训练与测试条件下,平均误识率分别降低70.5%,60.8%和70.5%。这一结果说明,本文提出的非线性频率尺度变换有效地增强了短时谱的说话人个性特征,能够提高说话人识别系统的性能。 展开更多
关键词 说话人识别系统 非线性频率 尺度变换 人类听觉系统 个性特征 识别性能 语音信号 HUMAN
下载PDF
采用独立说话人模型的语音转换 被引量:8
2
作者 俞一彪 曾道建 姜莹 《声学学报》 EI CSCD 北大核心 2012年第3期346-352,共7页
提出一种基于完全独立的说话人语音模型进行语音转换的方法。首先每个说话人采用各自的语料训练结构化高斯混合模型(Structured Gaussian Mixture Model,SGMM),然后根据源和目标说话人各自的模型采用全局声学结构(AcousticalUniversal S... 提出一种基于完全独立的说话人语音模型进行语音转换的方法。首先每个说话人采用各自的语料训练结构化高斯混合模型(Structured Gaussian Mixture Model,SGMM),然后根据源和目标说话人各自的模型采用全局声学结构(AcousticalUniversal Structure,AUS)进行匹配和高斯分布对准,最终得到相应的转换函数进行语音转换。ABX和MOS实验表明可以得到与传统的平行语料联合训练方法接近的转换性能,并且转换语音的目标说话人识别正确率达到94.5%。实验结果充分说明了本文提出的方法不仅具有较好的转换性能,而且具有较小的训练量和很好的系统扩展性。 展开更多
关键词 说话人识别 语音转换 语音模型 GAUSSIAN 高斯混合模型 训练方法 系统扩展性 声学结构
下载PDF
数字信号处理多目标层次化实验方案设计与实践 被引量:7
3
作者 俞一彪 孙兵 +2 位作者 芮贤义 石霏 胡剑凌 《实验室研究与探索》 CAS 北大核心 2022年第6期229-232,共4页
理论与应用相结合是电子信息类专业数字信号处理课程教学的一个核心思想,而实验教学环节及其实验方案设计是这一思想得以体现的重要保证。层次化实验方案以巩固基础理论、掌握基本应用、提升复杂系统分析设计能力为主要目标导向,结合课... 理论与应用相结合是电子信息类专业数字信号处理课程教学的一个核心思想,而实验教学环节及其实验方案设计是这一思想得以体现的重要保证。层次化实验方案以巩固基础理论、掌握基本应用、提升复杂系统分析设计能力为主要目标导向,结合课程教学内容,将验证性实验、仿真性系统实验和工程性系统实验按照金字塔结构进行实验内容设计,并结合课程教学进度采用独立和小组方式有序选择展开。实践表明,层次化实验方案较好地解决了课程教学中理论与应用相结合的问题,有利于创新人才的培养,符合新工科教育思想和工程专业认证规范要求。 展开更多
关键词 数字信号处理 层次化实验方案 仿真性系统 工程性系统
下载PDF
语音信号互信息估计的非线性搜索算法及识别应用 被引量:9
4
作者 俞一彪 赵鹤鸣 周旭东 《信号处理》 CSCD 2002年第2期102-106,共5页
基于互信息理论的语音识别方法不仅考虑了语音信号的时变分布特征,并且考虑了语音信号的统计分布特征,能有效地提高同类模式的凝聚度,减少非同类模式间的耦合性,在语音识别实验和实际应用中反映出良好的识别精度和很高的运行效率,... 基于互信息理论的语音识别方法不仅考虑了语音信号的时变分布特征,并且考虑了语音信号的统计分布特征,能有效地提高同类模式的凝聚度,减少非同类模式间的耦合性,在语音识别实验和实际应用中反映出良好的识别精度和很高的运行效率,与其它方法相比更适合嵌入式系统的语音识别应用。本文提出了一种互信息估计的非线性搜索算法,这一算法能够有效地处理语音信号时变分布特征的非线性波动,进一步提高语音模式互信息匹配的精度。 展开更多
关键词 语音信号 互信息估计 语音识别 非线性搜索算法
下载PDF
语音识别浏览器VoiceIE设计与实现 被引量:6
5
作者 俞一彪 赵鹤鸣 周旭东 《数据采集与处理》 CSCD 2002年第1期95-99,共5页
语音识别浏览器 Voice IE提供一种全新的语音方式进行 Internet WWW浏览 ,适合各类办公自动化系统 ,特别是基于嵌入式系统的信息家电、PDA等应用领域。本文首先介绍 Voice IE的系统结构及功能 ,然后阐述语音识别模块和浏览器模块的设计... 语音识别浏览器 Voice IE提供一种全新的语音方式进行 Internet WWW浏览 ,适合各类办公自动化系统 ,特别是基于嵌入式系统的信息家电、PDA等应用领域。本文首先介绍 Voice IE的系统结构及功能 ,然后阐述语音识别模块和浏览器模块的设计与实现方法 ,对浏览操作与窗口管理中基于 COM编程和 Internet API运用 ,语音信号实时检测与识别中 MCI API与互信息匹配模型 MIM的运用 ,以及语音识别模块与浏览器模块的数据通信等进行了描述。 展开更多
关键词 语音识别浏览器 VoiceIE 设计 语音信号处理
下载PDF
文本无关说话人识别的全特征矢量集模型及互信息评估方法 被引量:7
6
作者 俞一彪 王朔中 《声学学报》 EI CSCD 北大核心 2005年第6期536-541,共6页
提出了一种文本无关说话人识别的全特征矢量集模型及互信息评估方法,该模型通过对一组说话人语音数据在特征空间进行聚类而形成,全面地反映了说话人语音的个性特征。对于说话人语音的似然度计算与判决,则提出了一种互信息评估方法,该算... 提出了一种文本无关说话人识别的全特征矢量集模型及互信息评估方法,该模型通过对一组说话人语音数据在特征空间进行聚类而形成,全面地反映了说话人语音的个性特征。对于说话人语音的似然度计算与判决,则提出了一种互信息评估方法,该算法综合分析距离空间和信息空间的似然度,并运用最大互信息判决准则进行识别判决。实验分析了线性预测倒谱系数(LPCC)和Mel频率倒谱系数(MFCC)两种情况下应用全特征矢量集模型和互信息评估算法的说话人识别性能,并与高斯混合模型进行了比较。结果表明:全特征矢量集模型和互信息评估算法能够充分反映说话人语音特征,并能够有效评估说话人语音特征相似程度,具有很好的识别性能,是有效的。 展开更多
关键词 高斯混合模型 说话人识别 最大互信息 评估方法 特征矢量 文本无关 MEL频率倒谱系数 线性预测倒谱系数 语音数据
下载PDF
基于互信息匹配模型的说话人识别 被引量:8
7
作者 俞一彪 王朔中 《声学学报》 EI CSCD 北大核心 2004年第5期462-466,共5页
依据互信息理论提出的互信息匹配识别模型MIM(Mutual Information Matching),能够有效地综合处理语音信号的统计分布特征与时变分布特征,并具有较强的鲁棒性。介绍了运用互信息进行说话人模式匹配的原理,探讨了基于文本的说话人识别中MI... 依据互信息理论提出的互信息匹配识别模型MIM(Mutual Information Matching),能够有效地综合处理语音信号的统计分布特征与时变分布特征,并具有较强的鲁棒性。介绍了运用互信息进行说话人模式匹配的原理,探讨了基于文本的说话人识别中MIM模型的应用,通过说话人辨别实验对MIM模型的性能进行了实验分析,并与其它识别模型DTW和GMM进行了比较。对18名男性和12名女性组成的30名说话人进行的识别实验表明, MIM模型的说话人识别性能较好,在采用LPCC特征参数的情况下,平均错误识别率为1.33%。 展开更多
关键词 互信息匹配模型 说话人识别 语音信号 鲁棒性 平均错误识别率
下载PDF
运用互信息匹配及关键词分析的语音对话系统 被引量:4
8
作者 俞一彪 赵鹤鸣 周旭东 《小型微型计算机系统》 CSCD 北大核心 2003年第1期147-150,共4页
介绍应用于“虎丘”旅游服务的非特定人语音对话系统 .该系统运用互信息匹配模型 MIM进行音节识别 ,并提出了关键词句法模型及相应的分析算法 KBP进行语句分析和识别 .实验表明 ,互信息匹配模型 MIM的应用使连续语音音节识别率达到 78% ... 介绍应用于“虎丘”旅游服务的非特定人语音对话系统 .该系统运用互信息匹配模型 MIM进行音节识别 ,并提出了关键词句法模型及相应的分析算法 KBP进行语句分析和识别 .实验表明 ,互信息匹配模型 MIM的应用使连续语音音节识别率达到 78% ,而关键词句法分析的运用使系统总体语句识别率提高了 65 % 。 展开更多
关键词 语音对话系统 互信息 关键词分析 KBP
下载PDF
电子信息类本科DSP教学实践与探索 被引量:23
9
作者 俞一彪 孙兵 +1 位作者 曹洪龙 邵雷 《理工高教研究》 2006年第4期111-112,共2页
随着DSP技术在通信、控制等领域的深入应用,阐述了高校电子信息类专业开设DSP课程的指导思想、教学内容、实验以及具体实施方法,分析了存在的问题,并就今后如何进一步改进教学方案提出建议。
关键词 电子信息类专业 DSP技术 教学内容 本科 教学方案 高校
下载PDF
一种语音特征参数子分量分析与有效性评价的新方法 被引量:3
10
作者 俞一彪 许允喜 芮贤义 《信号处理》 CSCD 北大核心 2007年第2期188-191,共4页
语音信号中包含语义和说话人个性两大特征,其有效提取和强化对语音识别和说话人识别有着非常重要的意义。本文提出了一种语音特征参数中语义和个性特征子分量分析与有效性评价的4S方法,对语义和个性特征的成份比例进行分析,并通过量化... 语音信号中包含语义和说话人个性两大特征,其有效提取和强化对语音识别和说话人识别有着非常重要的意义。本文提出了一种语音特征参数中语义和个性特征子分量分析与有效性评价的4S方法,对语义和个性特征的成份比例进行分析,并通过量化指标评判特征参数对语音识别和说话人识别的有效性。运用4S分析方法对目前常用的特征参数LPC, LPCC和MFCC的子分量分析与有效性评价结果表明,所有的特征参数都更多地包含了语义特征信息,语义特征和说话人个性特征的成份比例因子LIR分别为1.30、1.44和1.61,并且,三种参数对语音识别和说话人识别的有效性均呈现出依次提高的特性。 展开更多
关键词 语音信号 特征参数 语义与个性特征 子分量分析
下载PDF
连续语音识别中句法结构知识的利用 被引量:5
11
作者 俞一彪 袁保宗 《电子学报》 EI CAS CSCD 北大核心 1990年第6期68-74,共7页
本文论述连续语音识别中如何利用句法结构知识。首先介绍句法结构模型的建立,然后阐述如何基于句法结构模型分析,从语音处理的初步结果搜索出输入语句的方法。本文提出了三种启发式搜索策略:(1)最大似然优先搜索(MLF);(2)局部最大似然优... 本文论述连续语音识别中如何利用句法结构知识。首先介绍句法结构模型的建立,然后阐述如何基于句法结构模型分析,从语音处理的初步结果搜索出输入语句的方法。本文提出了三种启发式搜索策略:(1)最大似然优先搜索(MLF);(2)局部最大似然优先(PMLF);(3)最大似然近邻法(MLNN)。 展开更多
关键词 语言识别 句法结构 语音识别
下载PDF
语音识别中互信息测度的聚类特性分析与实验评价 被引量:2
12
作者 俞一彪 王朔中 《信号处理》 CSCD 2002年第5期442-447,共6页
互信息作为一种模式距离测度已经被成功地应用在语音识别中,并由此提出了语音识别的互信息匹配模型。本文运用统计方法对互信息测度的聚类特性进行了分析,对其实际识别性能进行了实验评价,并与传统的距离测度Euclidean,Mahalanobis和Ita... 互信息作为一种模式距离测度已经被成功地应用在语音识别中,并由此提出了语音识别的互信息匹配模型。本文运用统计方法对互信息测度的聚类特性进行了分析,对其实际识别性能进行了实验评价,并与传统的距离测度Euclidean,Mahalanobis和Itakura-Saito进行了比较。分析与实验表明,互信息测度具有较好的聚类特性,相应的类内凝聚度较高,类间耦合度较小,在采用线性预测倒谱系数LPCC作为特征参数时,运用互信息测度的错误识别率较小,仅为运用Euclidean测度时的50%。 展开更多
关键词 互信息测度 聚类特性 语音识别 距离测度
下载PDF
语音应答服务系统AirVoice设计与实现 被引量:1
13
作者 俞一彪 蔡煜晗 +1 位作者 赵鹤鸣 周旭东 《微计算机应用》 2001年第2期101-105,共5页
本文介绍基于PC/MODEM的PSTN语音应答服务系统AriVoice,对AirVoice系统的功能、结构以及实现语音应答服务的关键技术进行了说明,重点讨论了利用调制解调芯片CLMD1414UNT和VB串行通信控件MsComm实现PSTN语音通信控制的技术实现方法,并阐... 本文介绍基于PC/MODEM的PSTN语音应答服务系统AriVoice,对AirVoice系统的功能、结构以及实现语音应答服务的关键技术进行了说明,重点讨论了利用调制解调芯片CLMD1414UNT和VB串行通信控件MsComm实现PSTN语音通信控制的技术实现方法,并阐述了语音合成技术在系统中的应用。 展开更多
关键词 语音应答服务系统 AIR VOICE 调制解调器 设计
下载PDF
PSTN语音信息查询服务系统开发
14
作者 俞一彪 蔡煜晗 +1 位作者 赵鹤鸣 周旭东 《计算机应用研究》 CSCD 北大核心 2001年第3期87-90,共4页
以AirVoice为例,介绍基于PC/MODEM的PSTN语音信息查询服务系统的开发技术,对PSTN语音信息查询服务系统的结构、类型、功能以及开发中的关键技术进行了说明,重点讨论了利用VB串行通信控件和MODEM语音AT指令集实现PSTN语音通信控制的... 以AirVoice为例,介绍基于PC/MODEM的PSTN语音信息查询服务系统的开发技术,对PSTN语音信息查询服务系统的结构、类型、功能以及开发中的关键技术进行了说明,重点讨论了利用VB串行通信控件和MODEM语音AT指令集实现PSTN语音通信控制的技术实现方法。 展开更多
关键词 语音通信 语音信息查询服务系统 PSTN 语音信号处理
下载PDF
基于PSTN的远程控制系统通信模块设计与实现
15
作者 俞一彪 赵鹤鸣 周旭东 《计算机工程》 CAS CSCD 北大核心 2001年第11期120-122,共3页
基于PSTN的远程控制系统利用公共交换电信网进行控制信号的传输与通信,远程用户可以通过任何电话终端与系统进行语音应答通信,查询并发送控制指令实现电器设备的实时远程检测与控制。介绍了PSTN远程控制系统的构成,并详细阐... 基于PSTN的远程控制系统利用公共交换电信网进行控制信号的传输与通信,远程用户可以通过任何电话终端与系统进行语音应答通信,查询并发送控制指令实现电器设备的实时远程检测与控制。介绍了PSTN远程控制系统的构成,并详细阐述系统信信模块的设计与技术实现方法。 展开更多
关键词 公共交换电信网 语音应答 通信模块 PSTN 远程控制系统
下载PDF
基于MIM模型的语音识别引擎SDSE及应用
16
作者 俞一彪 赵鹤鸣 周旭东 《计算机工程与应用》 CSCD 北大核心 2002年第11期91-93,156,共4页
语音识别引擎SDSE提供一种通用的实时语音输入、分析和识别接口,通过与其它软件模块的连接和DDE数据通信实现人机语音通信交互操作,可应用于WINDOWS平台的PC和各类多媒体信息终端。该文介绍语音识别引擎SDSE的模块结构以及设计与实现方... 语音识别引擎SDSE提供一种通用的实时语音输入、分析和识别接口,通过与其它软件模块的连接和DDE数据通信实现人机语音通信交互操作,可应用于WINDOWS平台的PC和各类多媒体信息终端。该文介绍语音识别引擎SDSE的模块结构以及设计与实现方法,对SDSE的语音处理、互信息匹配模型MIM的运用进行了描述,同时也简要介绍了SDSE在语音识别浏览器VoiceIE和WORD文本输入中的具体应用。 展开更多
关键词 MIM模型 语音识别引擎 SDSE 语音信号处理 计算机
下载PDF
说话人语音特征子空间分离及识别应用
17
作者 俞一彪 芮贤义 许允喜 《电路与系统学报》 CSCD 北大核心 2008年第1期7-11,共5页
本文依据主元分析原理从语音特征观察空间分离说话人语音特征子空间,对输入语音特征矢量与子空间的距离测度进行了定义,并对基于特征子空间的说话人识别性能进行了分析。说话人语音训练样本提取特征后在语音特征观察空间形成具有一定散... 本文依据主元分析原理从语音特征观察空间分离说话人语音特征子空间,对输入语音特征矢量与子空间的距离测度进行了定义,并对基于特征子空间的说话人识别性能进行了分析。说话人语音训练样本提取特征后在语音特征观察空间形成具有一定散度的分布,根据主元分析原理和分布散度提取主要散度本征向量作为基底构成说话人语音特征子空间,并通过测试语音特征矢量与子空间的距离测度进行模式匹配。实验结果表明,特征子空间方法对说话人识别是有效的,特别是在小于3秒的短时测试语音下能够得到较高的识别率。 展开更多
关键词 说话人识别 子空间 主元分析 文本无关
下载PDF
数据库图形编译系统的DBMDS
18
作者 俞一彪 《计算机应用》 CSCD 1993年第4期37-39,共3页
本文介绍应用于数据库管理系统Foxbase、dBASE的图形编译系统DBMDS。DBMDS在Foxbase和dBASE中增设了17种基本图形程序语句供图形设计。由此,可编程作出任何所需的图形或图表,并可方便地打印输出。图形数据可来自数据库或表达式等。
关键词 数据库 图形编译 DBMDS
下载PDF
CCDOS2.13H汉字编码输入方法扩充软件接口设计
19
作者 俞一彪 《计算机应用》 CSCD 1994年第2期49-50,共2页
本文针对CCDOS2.13H提出了一种汉字编码输入方法扩充软件接口。可以在原有的汉字输入方法基础上扩充新的汉字输入方法,从而利用这一扩充方法输入汉字。本文介绍一种不改变汉字系统的任何文件的一种动态扩充方法。
关键词 操作系统 汉字编码 软件接口
下载PDF
利用微课翻转课堂优化DSP实验教学探索 被引量:25
20
作者 曹洪龙 胡剑凌 +2 位作者 俞一彪 邵雷 刘学观 《西南师范大学学报(自然科学版)》 CAS 北大核心 2015年第10期191-196,共6页
DSP实验教学是DSP技术课程的重要组成部分,对于学生准确理解和扎实掌握DSP系统架构有重要的作用.针对DSP技术实验教学存在的问题,建设DSP实验教学微课资源并利用微课翻转课堂优化DSP实验教学,可以使学生成为学习主体并有效激励学生开展... DSP实验教学是DSP技术课程的重要组成部分,对于学生准确理解和扎实掌握DSP系统架构有重要的作用.针对DSP技术实验教学存在的问题,建设DSP实验教学微课资源并利用微课翻转课堂优化DSP实验教学,可以使学生成为学习主体并有效激励学生开展DSP创新性实验,提高学生实践能力和创新意识,有利于培养DSP技术方面的卓越工程师,在DSP实验教学中取得较好的教学成果. 展开更多
关键词 数字信号处理器 翻转课堂 微课 微创新
下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部