期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
两级特征联合学习的情感说话人识别
1
作者
刘金琳
李冬冬
+1 位作者
王喆
蔡立志
《计算机工程与应用》
CSCD
北大核心
2023年第1期149-155,共7页
针对说话人识别的性能易受到情感因素影响的问题,提出利用片段级别特征和帧级别特征联合学习的方法。利用长短时记忆网络进行说话人识别任务,提取时序输出作为片段级别的情感说话人特征,保留了语音帧特征原本信息的同时加强了情感信息...
针对说话人识别的性能易受到情感因素影响的问题,提出利用片段级别特征和帧级别特征联合学习的方法。利用长短时记忆网络进行说话人识别任务,提取时序输出作为片段级别的情感说话人特征,保留了语音帧特征原本信息的同时加强了情感信息的表达,再利用全连接网络进一步学习片段级别特征中每一个特征帧的说话人信息来增强帧级别特征的说话人信息表示能力,最后拼接片段级别特征和帧级别特征得到最终的说话人特征以增强特征的表征能力。在普通话情感语音语料库(MASC)上进行实验,验证所提出方法有效性的同时,探究了片段级别特征中包含语音帧数量和不同情感状态对情感说话人识别的影响。
展开更多
关键词
情感说话人识别
长短时记忆网络
深度神经网络
下载PDF
职称材料
基于邻居相似现象的情感说话人识别
被引量:
1
2
作者
陈力
杨莹春
《浙江大学学报(工学版)》
EI
CAS
CSCD
北大核心
2012年第10期1790-1795,共6页
根据语音学的研究,提出中性时发音相似的说话人,在情感状态下的发音人相似的假设——邻居相似现象,并通过定量和定性的分析验证了该假设,即在音素内容相同的情况下,同一说话人的中性模型和情感模型对应高斯分量的"邻居"基本类...
根据语音学的研究,提出中性时发音相似的说话人,在情感状态下的发音人相似的假设——邻居相似现象,并通过定量和定性的分析验证了该假设,即在音素内容相同的情况下,同一说话人的中性模型和情感模型对应高斯分量的"邻居"基本类似.为了解决说话人情感变化时语音短时特征的分布与中性语音模型存在差异的问题,提出说话人情感模型合成的方法——将开发库中学习到的中性-情感变化规律移植到评测库中,根据说话人的中性模型合成出情感模型.从邻居相似现象的特性出发,根据KL距离选取该说话人中性下若干相似的邻居,根据基于邻居的方法和基于邻居变换的方法,合成出该说话人的情感模型.MASC库上的实验结果表明,该方法的识别准确率比传统的GMM-UBM算法提高了2.81%,与情感属性映射(EAP)方法相比识别率提高了1.3%.
展开更多
关键词
情感说话人识别
邻居相似现象
情感
模型合成
下载PDF
职称材料
题名
两级特征联合学习的情感说话人识别
1
作者
刘金琳
李冬冬
王喆
蔡立志
机构
华东理工大学信息科学与工程学院
苏州大学江苏省计算机信息处理技术重点实验室
出处
《计算机工程与应用》
CSCD
北大核心
2023年第1期149-155,共7页
基金
国家自然科学基金(61806078)
国家重大新药开发科技专项(2019ZX09210004)
上海市教育发展基金会和上海市教育委员会“曙光计划”(61725301)。
文摘
针对说话人识别的性能易受到情感因素影响的问题,提出利用片段级别特征和帧级别特征联合学习的方法。利用长短时记忆网络进行说话人识别任务,提取时序输出作为片段级别的情感说话人特征,保留了语音帧特征原本信息的同时加强了情感信息的表达,再利用全连接网络进一步学习片段级别特征中每一个特征帧的说话人信息来增强帧级别特征的说话人信息表示能力,最后拼接片段级别特征和帧级别特征得到最终的说话人特征以增强特征的表征能力。在普通话情感语音语料库(MASC)上进行实验,验证所提出方法有效性的同时,探究了片段级别特征中包含语音帧数量和不同情感状态对情感说话人识别的影响。
关键词
情感说话人识别
长短时记忆网络
深度神经网络
Keywords
emotional speaker recognition
long short-term memory
deep neutral network
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
TP37 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
基于邻居相似现象的情感说话人识别
被引量:
1
2
作者
陈力
杨莹春
机构
浙江大学计算机科学与技术学院
出处
《浙江大学学报(工学版)》
EI
CAS
CSCD
北大核心
2012年第10期1790-1795,共6页
基金
国家自然科学基金资助项目(60970080)
核高基重大专项资助项目(2009ZX01039-002-001-04)
文摘
根据语音学的研究,提出中性时发音相似的说话人,在情感状态下的发音人相似的假设——邻居相似现象,并通过定量和定性的分析验证了该假设,即在音素内容相同的情况下,同一说话人的中性模型和情感模型对应高斯分量的"邻居"基本类似.为了解决说话人情感变化时语音短时特征的分布与中性语音模型存在差异的问题,提出说话人情感模型合成的方法——将开发库中学习到的中性-情感变化规律移植到评测库中,根据说话人的中性模型合成出情感模型.从邻居相似现象的特性出发,根据KL距离选取该说话人中性下若干相似的邻居,根据基于邻居的方法和基于邻居变换的方法,合成出该说话人的情感模型.MASC库上的实验结果表明,该方法的识别准确率比传统的GMM-UBM算法提高了2.81%,与情感属性映射(EAP)方法相比识别率提高了1.3%.
关键词
情感说话人识别
邻居相似现象
情感
模型合成
Keywords
emotional speaker recognition
similar neighbor phenomenon
emotional model synthesis
分类号
TP271 [自动化与计算机技术—检测技术与自动化装置]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
两级特征联合学习的情感说话人识别
刘金琳
李冬冬
王喆
蔡立志
《计算机工程与应用》
CSCD
北大核心
2023
0
下载PDF
职称材料
2
基于邻居相似现象的情感说话人识别
陈力
杨莹春
《浙江大学学报(工学版)》
EI
CAS
CSCD
北大核心
2012
1
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部