期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
基于汉字语音映射的脑电信号直译方法研究
1
作者 伍茂贤 尹念 陈仪琳 《癫痫与神经电生理学杂志》 2023年第5期276-282,共7页
目的探讨基于汉字语音映射的脑电信号(EEG)直译方法,从而开发一种人机交互的新手段。方法基于对汉字语音朗读时产生的EEG采集,利用Mel倒频谱系数对语音信号进行特征提取,将EEG特征与语音特征映射生成数据库,基于数据库利用循环神经网络... 目的探讨基于汉字语音映射的脑电信号(EEG)直译方法,从而开发一种人机交互的新手段。方法基于对汉字语音朗读时产生的EEG采集,利用Mel倒频谱系数对语音信号进行特征提取,将EEG特征与语音特征映射生成数据库,基于数据库利用循环神经网络进行EEG识别。采用共空间模式(CSP)联合支持向量机(SVM)对EEG进行特征提取和分类识别作为对照试验。结果CSP+SVM识别方式下,平均分类准确率为(36.53±3.17)%;在基于汉字语音映射的EEG直译方式下,平均分类准确率为(69.93±3.07)%,经重复数据集训练后的识别准确率可达75%以上。结论基于语音映射的直译方法可以获得更稳定的EEG,将EEG与语音信号形成映射,可以准确且快速地用EEG重建汉字语音信息,为未来用EEG实现人机通信提供有效依据,从而实现用汉字语音映射的EEG直译方法开发一种人机交互的新手段。 展开更多
关键词 脑电信号 语音映射 神经网络 脑机接口 机器翻译
下载PDF
基于DIVA模型的语音-映射单元自动获取
2
作者 张少白 刘欣 《智能系统学报》 CSCD 北大核心 2013年第4期305-311,共7页
针对DIVA模型中存在的"感知能力与语音生成技巧发育不平衡"问题,提出了一种自动获取语音-映射单元的方法.该方法将人耳模拟为一个具有不同带宽的并联带通滤波器组,分别与模型中21维度的听觉存储空间相关联,对不同听觉的不同反... 针对DIVA模型中存在的"感知能力与语音生成技巧发育不平衡"问题,提出了一种自动获取语音-映射单元的方法.该方法将人耳模拟为一个具有不同带宽的并联带通滤波器组,分别与模型中21维度的听觉存储空间相关联,对不同听觉的不同反应,分别考虑其频带的屏蔽效应、听觉响度与频率的关系.在读取语音输入信号的过程中,模型能较好地获得初始听觉表示,其方式与婴儿咿呀学语的过程基本一致.仿真实验表明,通过边界定义、相似性比较以及搜索更新等步骤,此方法能很好地进行初始输入模式的自组织匹配,并最终使DIVA模型更具语音获取的自然特性. 展开更多
关键词 DIVA模型 音素 语音-映射单元 语音生成与获取
下载PDF
基于CASA简化模型的语音增强算法 被引量:3
3
作者 虞晓 胡光锐 崔玉红 《上海交通大学学报》 EI CAS CSCD 北大核心 2001年第11期1635-1639,共5页
基于听觉现象分析 (CASA)模型的基本原理 ,针对仅有非语音信号干扰情况下的单通道语音增强处理问题 ,利用人耳的频率掩蔽效应 ,提出了一种单通道简化 CASA计算模型语音增强新算法 .新算法通过提取混合语音输入中的有效语音时频成分并利... 基于听觉现象分析 (CASA)模型的基本原理 ,针对仅有非语音信号干扰情况下的单通道语音增强处理问题 ,利用人耳的频率掩蔽效应 ,提出了一种单通道简化 CASA计算模型语音增强新算法 .新算法通过提取混合语音输入中的有效语音时频成分并利用人耳的听觉掩蔽效应重构合成增强语音输出信号 .通过在汽车噪声和白噪声干扰下的仿真实验结果表明 ,简化的 CASA模型语音增强算法的输出信噪比约提高了 1 0 d B,且可以有效抑制干扰噪声的听觉影响 。 展开更多
关键词 语音增强 听觉现象分析 语音有效能量映射 开关网络 干扰抑制 信噪比 CASA模型
下载PDF
基于语音驱动的三维人脸动画技术综述 被引量:2
4
作者 刘贤梅 刘露 +2 位作者 贾迪 赵娅 田枫 《计算机系统应用》 2022年第10期44-50,共7页
随着三维数字虚拟人的发展,语音驱动三维人脸动画技术已经成为虚拟人交互的重要研究热点之一.其关键技术在于语音-视觉映射模型的建立以及三维人脸动画的合成.首先分析了音-视素匹配法和音-视觉参数映射两类方法的特点;之后阐述了目前... 随着三维数字虚拟人的发展,语音驱动三维人脸动画技术已经成为虚拟人交互的重要研究热点之一.其关键技术在于语音-视觉映射模型的建立以及三维人脸动画的合成.首先分析了音-视素匹配法和音-视觉参数映射两类方法的特点;之后阐述了目前三维人脸模型的建立方法,并依据三维人脸模型的表示方法不同,分析了不同运动控制方法的优缺点;然后阐述了语音驱动三维人脸动画的主观评价和客观评价方法;最后总结了语音驱动三维人脸动画技术的未来发展方向. 展开更多
关键词 三维人脸动画 语音 语音-视觉映射模型 虚拟人
下载PDF
基于语音生成逆向解的嘶音合成方法
5
作者 程启明 俞振利 张礼和 《科技通报》 北大核心 2001年第5期6-9,共4页
提出了一种应用三质量块声带模型与语音生成逆向映射法相结合的嘶音合成方法 .应用这种方法合成的嘶音信号与实际嘶音信号的实验比较结果表明 。
关键词 语音合音 语音生成模型 嘶音信号 语音生成逆向映射 三质量块声带模型
下载PDF
听力教学探析
6
作者 陈志烈 邢林燕 《丽水师范专科学校学报》 2002年第6期64-66,共3页
听力是外语学习的四种基本技能之一。听力训练在外语学习中起着重要的作用 ,能加强音义的联接 ,提高学习者的语音编码能力 ,有助于语言的内化。目前许多高校的听力教学采用的是测试型的方法 ,而不是诊断型的 ,这不利于学习者听力能力的... 听力是外语学习的四种基本技能之一。听力训练在外语学习中起着重要的作用 ,能加强音义的联接 ,提高学习者的语音编码能力 ,有助于语言的内化。目前许多高校的听力教学采用的是测试型的方法 ,而不是诊断型的 ,这不利于学习者听力能力的提高。指出听力训练要以培养学习者的策略和方法为目标 。 展开更多
关键词 听力教学 语音映射 音义联接 语音编码能力 英语教学 听力能力
下载PDF
Mapping methods for output-based objective speech quality assessment using data mining 被引量:2
7
作者 王晶 赵胜辉 +1 位作者 谢湘 匡镜明 《Journal of Central South University》 SCIE EI CAS 2014年第5期1919-1926,共8页
Objective speech quality is difficult to be measured without the input reference speech.Mapping methods using data mining are investigated and designed to improve the output-based speech quality assessment algorithm.T... Objective speech quality is difficult to be measured without the input reference speech.Mapping methods using data mining are investigated and designed to improve the output-based speech quality assessment algorithm.The degraded speech is firstly separated into three classes(unvoiced,voiced and silence),and then the consistency measurement between the degraded speech signal and the pre-trained reference model for each class is calculated and mapped to an objective speech quality score using data mining.Fuzzy Gaussian mixture model(GMM)is used to generate the artificial reference model trained on perceptual linear predictive(PLP)features.The mean opinion score(MOS)mapping methods including multivariate non-linear regression(MNLR),fuzzy neural network(FNN)and support vector regression(SVR)are designed and compared with the standard ITU-T P.563 method.Experimental results show that the assessment methods with data mining perform better than ITU-T P.563.Moreover,FNN and SVR are more efficient than MNLR,and FNN performs best with 14.50% increase in the correlation coefficient and 32.76% decrease in the root-mean-square MOS error. 展开更多
关键词 objective speech quality data mining multivariate non-linear regression fuzzy neural network support vector regression
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部