期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于迁移学习和基频特征融合的文本相关说话人识别框架
1
作者
马皓天
洪峰
+5 位作者
毛海全
徐楚林
胡梦璐
牟宏宇
陈友元
许伟杰
《声学技术》
CSCD
北大核心
2024年第5期677-685,共9页
目前,面向我国金融支付的说话人识别技术在社会层面上没有大范围的推广,其原因在于数据集的缺乏以及识别技术未能满足安全性要求。针对上述问题,文章录制了用于中文数字串文本相关说话人识别的SHALCAS-WXSD22B数据集,用于金融支付场景...
目前,面向我国金融支付的说话人识别技术在社会层面上没有大范围的推广,其原因在于数据集的缺乏以及识别技术未能满足安全性要求。针对上述问题,文章录制了用于中文数字串文本相关说话人识别的SHALCAS-WXSD22B数据集,用于金融支付场景中的数字串声纹识别研究,并提出一种基于迁移学习和基频特征融合的文本相关说话人识别框架,提高了文本相关说话人识别技术的可靠性。在数字串SHALCAS-WXSD22B-d006和SHALCAS-WXSD22B-d007语料实验中,所提框架实现的最佳等错误率分别为0.88%和1.05%,与ECAPA-TDNN基线模型相比等错误率相对降低了17和20个百分点,且达到了支付场景下的声纹识别安全性指标。实验结果表明,文中所提框架不仅具有更好的识别准确率和安全性能,而且同样能提高框架中包括ResNet34在内的其他log-Mel识别模型的性能。
展开更多
关键词
文本相关说话人识别
迁移学习
基频特征
嵌入级融合
决策
级
融合
下载PDF
职称材料
题名
基于迁移学习和基频特征融合的文本相关说话人识别框架
1
作者
马皓天
洪峰
毛海全
徐楚林
胡梦璐
牟宏宇
陈友元
许伟杰
机构
中国科学院声学研究所东海研究站
中国科学院大学
出处
《声学技术》
CSCD
北大核心
2024年第5期677-685,共9页
基金
中国科学院声学研究所自主部署"前沿探索"项目(QYTS202114)
中国科学院青年创新促进会(2021022)项目
上海市自然科学基金项目(22ZR1475700)。
文摘
目前,面向我国金融支付的说话人识别技术在社会层面上没有大范围的推广,其原因在于数据集的缺乏以及识别技术未能满足安全性要求。针对上述问题,文章录制了用于中文数字串文本相关说话人识别的SHALCAS-WXSD22B数据集,用于金融支付场景中的数字串声纹识别研究,并提出一种基于迁移学习和基频特征融合的文本相关说话人识别框架,提高了文本相关说话人识别技术的可靠性。在数字串SHALCAS-WXSD22B-d006和SHALCAS-WXSD22B-d007语料实验中,所提框架实现的最佳等错误率分别为0.88%和1.05%,与ECAPA-TDNN基线模型相比等错误率相对降低了17和20个百分点,且达到了支付场景下的声纹识别安全性指标。实验结果表明,文中所提框架不仅具有更好的识别准确率和安全性能,而且同样能提高框架中包括ResNet34在内的其他log-Mel识别模型的性能。
关键词
文本相关说话人识别
迁移学习
基频特征
嵌入级融合
决策
级
融合
Keywords
text-independent speaker verification
transfer learning
embedding-level fusion
decision-level fusion
分类号
H107 [语言文字—汉语]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于迁移学习和基频特征融合的文本相关说话人识别框架
马皓天
洪峰
毛海全
徐楚林
胡梦璐
牟宏宇
陈友元
许伟杰
《声学技术》
CSCD
北大核心
2024
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部