-
题名说话人感知的交叉注意力说话人提取网络
- 1
-
-
作者
李卓璋
许柏炎
蔡瑞初
郝志峰
-
机构
广东工业大学计算机学院
汕头大学理学院
-
出处
《广东工业大学学报》
CAS
2024年第3期91-101,共11页
-
基金
科技创新2030-“新一代人工智能”重大项目(2021ZD0111501)
国家优秀青年科学基金资助项目(62122022)
国家自然科学基金资助项目(61876043,61976052,62206064)。
-
文摘
目标说话人提取任务的目标是在一段混合音频中提取特定说话人的语音,任务设置上一般会给一段目标说话人注册音频作为辅助信息。现有的研究工作主要有以下不足:(1)说话人识别的辅助网络无法捕获学习注册音频中的关键信息;(2)缺乏混合音频嵌入和注册音频嵌入的交互学习机制。以上不足导致了现有研究工作在注册音频和目标音频之间存在较大差异时有说话人混淆问题。为了解决该问题,提出说话人感知的交叉注意力说话人提取网络(Speaker-aware Cross Attention Speaker Extraction Network,SACAN)。SACAN在说话人识别辅助网络引入基于注意力的说话人聚合模块,有效聚合目标说话人声音特性的关键信息和利用混合音频增强目标说话人嵌入。进一步地,SACAN通过交叉注意力构建交互学习机制促进说话人嵌入与混合音频嵌入融合学习,增强了模型的说话人感知能力。实验结果表明,SACAN相比基准方法在STOI和SI-SDRi分别提高了0.013 3、1.069 5 d B,并在说话人混淆相关评估和消融实验中验证了不同模块的有效性。
-
关键词
语音分离
目标说话人提取
说话人嵌入
交叉注意力
多任务学习
-
Keywords
speech separation
target speaker extraction
speaker embedding
cross attention
multi-task learning
-
分类号
TP391.2
[自动化与计算机技术—计算机应用技术]
-
-
题名“两学一做”视域下学习型学生党支部建设路径的研究
被引量:1
- 2
-
-
作者
刁嘉程
李卓璋
-
机构
广东工业大学计算机学院
-
出处
《科教文汇》
2018年第12期132-133,共2页
-
基金
2018年广东工业大学"大德育工程"项目--家庭经济困难学生帮扶路径育人机制建设(阶段成果)
2017年广东工业大学学生工作研究课题--新媒体视域下精准资助育人工作研究(项目标号2017XG09)阶段性成果
-
文摘
新形势下,党中央高度重视基层党组织的发展,进一步推进学习型政党的建设。高校学生党支部作为高校最基层的党组织,承担着培养中国特色社会主义合格建设者的育人重任。加强学习型学生党支部的建设,是新时期加强高校思想政治教育的必然要求,有利于提高学生党员的政治素养和党性觉悟,进一步坚定青年学生的理想信念。本文旨在"两学一做"视域下,通过更新学习理念、丰富学习内容、创新学习途径、健全学习机制,助力学习型学生党支部的建设,以充分发挥学生党员的先锋模范作用和基层党组织的战斗堡垒作用。
-
关键词
两学一做
学习型
学生党支部
-
Keywords
Party Building Studies
study-model CPC branches
CPC branches of college students
-
分类号
G640
[文化科学—高等教育学]
-