期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于双向伪标签自监督学习的跨人脸-语音匹配方法
被引量:
1
1
作者
朱明航
柳欣
+2 位作者
于镇宁
徐行
郑书凯
《计算机研究与发展》
EI
CSCD
北大核心
2023年第11期2638-2649,共12页
神经认知科学研究表明,人类大脑在感知语音的过程中常常将结合人脸信息进行跨模态交互分析.然而,现有的跨模态人脸-语音关联方法仍面临着对复杂样本敏感、监督信息缺乏以及语义关联不足等挑战,其主要原因是缺少对潜在共性语义的挖掘.针...
神经认知科学研究表明,人类大脑在感知语音的过程中常常将结合人脸信息进行跨模态交互分析.然而,现有的跨模态人脸-语音关联方法仍面临着对复杂样本敏感、监督信息缺乏以及语义关联不足等挑战,其主要原因是缺少对潜在共性语义的挖掘.针对这些问题,提出了基于双向伪标签自监督学习的跨模态学习架构,用于人脸-语音关联学习与匹配任务.首先,构建跨模态加权残差网络来学习人脸-语音的跨模态共享嵌入,然后提出一种新颖的双向伪标签关联的自监督学习方法,旨在通过一种模态的潜在语义信息去监督另一个模态的特征学习,从而基于这种交互式跨模态自监督学习能够挖掘到人脸-语音间更紧密的关联.为增加挖掘监督信息的判别性,进一步构建了2个辅助损失促使来自相同身份的人脸-语音特征更接近,并使来自不同身份的特征更加疏远.基于大量实验验证,相比较于现有方法,在人脸-语音跨模态匹配任务上获得了全面的提升.
展开更多
关键词
人脸-语音关联
双向伪标签
自监督学习
加权残差网络
潜语义监督
下载PDF
职称材料
高吞吐、低延迟场景下的智能人机对话关键技术及应用
2
作者
李太豪
潘煜
+6 位作者
金佳
曾令仿
裴冠雄
赖有献
汪严磊
郑书凯
阮玉平
《中国科技成果》
2023年第1期52-52,共1页
《新一代人工智能发展规划》中指出,面向国家重大战略需求,多媒体信息理解的人机对话系统是需要突破的关键共性技术.近年来,人机对话技术被广泛地应用于手机端智能语音助手、客服机器人、智慧医疗等各个领域.然而随着多用户、高并发、...
《新一代人工智能发展规划》中指出,面向国家重大战略需求,多媒体信息理解的人机对话系统是需要突破的关键共性技术.近年来,人机对话技术被广泛地应用于手机端智能语音助手、客服机器人、智慧医疗等各个领域.然而随着多用户、高并发、海量异构数据应用场景的与日俱增和自然人机交互需求的不断提高,现有的人机对话数据感-存-算时延大、多模态数据利用少、智能化程度低和拟人化效果差等问题更加凸显,已成为制约人机对话系统大规模智慧化应用的瓶颈.
展开更多
关键词
人机对话
人工智能
多模态数据
多媒体信息
高并发
机器人
国家重大战略
关键共性技术
原文传递
题名
基于双向伪标签自监督学习的跨人脸-语音匹配方法
被引量:
1
1
作者
朱明航
柳欣
于镇宁
徐行
郑书凯
机构
华侨大学计算机科学与技术学院
福建省大数据智能与安全重点实验室(华侨大学)
之江实验室
电子科技大学计算机科学与工程学院
出处
《计算机研究与发展》
EI
CSCD
北大核心
2023年第11期2638-2649,共12页
基金
之江实验室开放课题(2021KH0AB01)
国家自然科学基金项目(61673185,61976049)
+1 种基金
福建省自然科学基金项目(2020J01083,2020J01084)
福建省本科高校教学研究项目(FBJG20220092)。
文摘
神经认知科学研究表明,人类大脑在感知语音的过程中常常将结合人脸信息进行跨模态交互分析.然而,现有的跨模态人脸-语音关联方法仍面临着对复杂样本敏感、监督信息缺乏以及语义关联不足等挑战,其主要原因是缺少对潜在共性语义的挖掘.针对这些问题,提出了基于双向伪标签自监督学习的跨模态学习架构,用于人脸-语音关联学习与匹配任务.首先,构建跨模态加权残差网络来学习人脸-语音的跨模态共享嵌入,然后提出一种新颖的双向伪标签关联的自监督学习方法,旨在通过一种模态的潜在语义信息去监督另一个模态的特征学习,从而基于这种交互式跨模态自监督学习能够挖掘到人脸-语音间更紧密的关联.为增加挖掘监督信息的判别性,进一步构建了2个辅助损失促使来自相同身份的人脸-语音特征更接近,并使来自不同身份的特征更加疏远.基于大量实验验证,相比较于现有方法,在人脸-语音跨模态匹配任务上获得了全面的提升.
关键词
人脸-语音关联
双向伪标签
自监督学习
加权残差网络
潜语义监督
Keywords
face-voice association
bi-pseudo label
self-supervised learning
weighted residual network
latent semantic supervision
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
高吞吐、低延迟场景下的智能人机对话关键技术及应用
2
作者
李太豪
潘煜
金佳
曾令仿
裴冠雄
赖有献
汪严磊
郑书凯
阮玉平
机构
之江实验室
上海外国语大学
德勤勤跃数字科技(上海)有限公司
出处
《中国科技成果》
2023年第1期52-52,共1页
文摘
《新一代人工智能发展规划》中指出,面向国家重大战略需求,多媒体信息理解的人机对话系统是需要突破的关键共性技术.近年来,人机对话技术被广泛地应用于手机端智能语音助手、客服机器人、智慧医疗等各个领域.然而随着多用户、高并发、海量异构数据应用场景的与日俱增和自然人机交互需求的不断提高,现有的人机对话数据感-存-算时延大、多模态数据利用少、智能化程度低和拟人化效果差等问题更加凸显,已成为制约人机对话系统大规模智慧化应用的瓶颈.
关键词
人机对话
人工智能
多模态数据
多媒体信息
高并发
机器人
国家重大战略
关键共性技术
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
原文传递
题名
作者
出处
发文年
被引量
操作
1
基于双向伪标签自监督学习的跨人脸-语音匹配方法
朱明航
柳欣
于镇宁
徐行
郑书凯
《计算机研究与发展》
EI
CSCD
北大核心
2023
1
下载PDF
职称材料
2
高吞吐、低延迟场景下的智能人机对话关键技术及应用
李太豪
潘煜
金佳
曾令仿
裴冠雄
赖有献
汪严磊
郑书凯
阮玉平
《中国科技成果》
2023
0
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部