期刊文献+
共找到10篇文章
< 1 >
每页显示 20 50 100
Modified Cepstral Feature for Speech Anti-spoofing
1
作者 何明瑞 ZAIDI Syed Faham Ali +3 位作者 田娩鑫 单志勇 江政儒 徐珑婷 《Journal of Donghua University(English Edition)》 CAS 2023年第2期193-201,共9页
The hidden danger of the automatic speaker verification(ASV)system is various spoofed speeches.These threats can be classified into two categories,namely logical access(LA)and physical access(PA).To improve identifica... The hidden danger of the automatic speaker verification(ASV)system is various spoofed speeches.These threats can be classified into two categories,namely logical access(LA)and physical access(PA).To improve identification capability of spoofed speech detection,this paper considers the research on features.Firstly,following the idea of modifying the constant-Q-based features,this work considered adding variance or mean to the constant-Q-based cepstral domain to obtain good performance.Secondly,linear frequency cepstral coefficients(LFCCs)performed comparably with constant-Q-based features.Finally,we proposed linear frequency variance-based cepstral coefficients(LVCCs)and linear frequency mean-based cepstral coefficients(LMCCs)for identification of speech spoofing.LVCCs and LMCCs could be attained by adding the frame variance or the mean to the log magnitude spectrum based on LFCC features.The proposed novel features were evaluated on ASVspoof 2019 datase.The experimental results show that compared with known hand-crafted features,LVCCs and LMCCs are more effective in resisting spoofed speech attack. 展开更多
关键词 spoofed speech detection log magnitude spectrum linear frequency cepstral coefficient(LFCC) hand-crafted feature
下载PDF
基于图傅里叶变换的语音增强算法研究
2
作者 刘山民 徐珑婷 《计算机科学与应用》 2023年第4期689-697,共9页
在语音增强过程中,人们往往采用语音信号的频谱信息作为特征输入,再进行进一步的训练增强处理。最为常见的便是对语音信号进行短时傅里叶变换后取其幅度频谱作为特征输入,在语音恢复阶段,则将含有噪声语音的相位信息作为增强语音的相位... 在语音增强过程中,人们往往采用语音信号的频谱信息作为特征输入,再进行进一步的训练增强处理。最为常见的便是对语音信号进行短时傅里叶变换后取其幅度频谱作为特征输入,在语音恢复阶段,则将含有噪声语音的相位信息作为增强语音的相位信息进行语音的重构。但是,这一做法必然导致相位信息的缺失。本文提出将图傅里叶变换(GFT)分别与非负矩阵分解(NMF)算法以及全卷积神经网络(FCNN)模型相结合来实现含有噪声语音的增强,实验表明,图傅里叶变换–非负矩阵分解算法在语音增强上与短时傅里叶变换–非负矩阵分解算法表现相当,基于图傅里叶变换–全卷积神经网络的语音增强相较于基于短时傅里叶变换–全卷积神经网络的语音增强有更为优异的性能。 展开更多
关键词 语音增强 短时傅里叶变换 图傅里叶变换 非负矩阵分解 全卷积神经网络
下载PDF
工科专业实践类课程美育教学设计探索——以“工程与社会”课程为例
3
作者 贾逢德 阳云龙 +3 位作者 翟梦琳 姜国俊 徐珑婷 陆小辰 《纺织服装教育》 2023年第5期35-40,共6页
基于美育教学能有效提升学生人文素养和创新能力这一改革理念,将美育教学案例与工程理论教学深度结合,帮助学生提高美学素养,树立正确的职业道德观,传承和弘扬中华美育精神。针对“工程与社会”课程教学融合中存在的学生参与度不高、美... 基于美育教学能有效提升学生人文素养和创新能力这一改革理念,将美育教学案例与工程理论教学深度结合,帮助学生提高美学素养,树立正确的职业道德观,传承和弘扬中华美育精神。针对“工程与社会”课程教学融合中存在的学生参与度不高、美育案例脱离学生认知、美育考核指标不明确等问题,设计“课内+课外”“线上+线下”多平台混合式教学模式,调动生生互动、师生互动的积极性,完善美育教学内容,以达到润物无声地将美育融入工程教学。该教学模式有效地贴合“以美育人、以文化人”的宗旨,提升了“工程与社会”与美育深度融合的教学效果。 展开更多
关键词 “工程与社会” 美育 教学模式 工科专业
下载PDF
语音信号处理中鲁棒性压缩感知关键技术 被引量:8
4
作者 杨震 徐珑婷 《数据采集与处理》 CSCD 北大核心 2017年第2期232-245,共14页
压缩感知技术在许多领域都有广阔的应用前景。压缩感知关键技术主要包括稀疏矩阵的选取,观测矩阵的构造以及重构算法的设计。语音信号不同于一般信号,通常在观测矩阵和重构算法中有特殊的结构特征。在实际的应用中,噪声难以避免,而压缩... 压缩感知技术在许多领域都有广阔的应用前景。压缩感知关键技术主要包括稀疏矩阵的选取,观测矩阵的构造以及重构算法的设计。语音信号不同于一般信号,通常在观测矩阵和重构算法中有特殊的结构特征。在实际的应用中,噪声难以避免,而压缩感知系统中,重构系统是非线性的,且对噪声敏感,因而研究具有抗噪能力的鲁棒性压缩感知系统具有重要意义,也是压缩感知技术能否真正实用的关键之一。本文首先介绍了压缩感知的基本概念,然后分析各种噪声对压缩感知带来的影响,侧重从语音信号的观测矩阵和重构技术入手,介绍具有鲁棒性的压缩感知投影算子和重构算法,最后对未来可能的研究方向进行了展望。 展开更多
关键词 压缩感知 鲁棒性 重构算法 语音信号 投影算子
下载PDF
基于改进循环生成对抗神经网络的语音增强 被引量:2
5
作者 徐珑婷 田娩鑫 魏郅林 《东华大学学报(自然科学版)》 CAS 北大核心 2022年第5期70-76,共7页
为克服基于生成对抗网络的语音增强技术存在成对语音样本缺乏的问题,提出改进的循环一致性生成对抗网络(CycleGAN)的不成对数据生成模型。通过引入2-1-2D CNN生成器和PatchGAN鉴别器,使改进的CycleGAN-2-1-2D模型能更有效地学习语音样... 为克服基于生成对抗网络的语音增强技术存在成对语音样本缺乏的问题,提出改进的循环一致性生成对抗网络(CycleGAN)的不成对数据生成模型。通过引入2-1-2D CNN生成器和PatchGAN鉴别器,使改进的CycleGAN-2-1-2D模型能更有效地学习语音样本多维度的特征,并大大缩短了训练时长。选取LibriTTS语料库中的部分纯净语音作为训练集A,从语料库中选取其他样本加3种类型的噪声作为训练集B,训练集A和训练集B作为CycleGAN-2-1-2D模型的输入参数。设置CycleGAN-2D和NMF(nonnegative matrix factorization)的语音增强模型作为CycleGAN-2-1-2D模型的对照试验,通过仿真试验对3种模型生成的语音质量进行评估。研究数据表明:相较于NMF模型,CycleGAN-2-1-2D模型生成的语音质量有了较大的提升;相较于CycleGAN-2D模型,CycleGAN-2-1-2D模型对女声的增强效果有明显提升。 展开更多
关键词 语音增强 深度神经网络 循环生成对抗网络 非平行数据
下载PDF
一种基于压缩感知的说话人识别参数分析 被引量:2
6
作者 潘海琦 杨震 +1 位作者 徐珑婷 朱俊华 《数据采集与处理》 CSCD 北大核心 2015年第2期399-407,共9页
本文为在传统的说话人识别理论研究中"较少的特征参数量不能与较高的识别率共存"的难题找到了一种解决方案。本文基于压缩感知的理论,利用行阶梯观测矩阵进行信号的投影,改变了传统的梅尔频率倒谱系数(Mel-frequency cepstral... 本文为在传统的说话人识别理论研究中"较少的特征参数量不能与较高的识别率共存"的难题找到了一种解决方案。本文基于压缩感知的理论,利用行阶梯观测矩阵进行信号的投影,改变了传统的梅尔频率倒谱系数(Mel-frequency cepstral coefficient,MFCC)参数,从而提出了一种新的识别参数CSMFCC(Compressed sensing-MFCC)。该参数不仅使得参数存储量降低到少于原存储量的1/n(n为行阶梯观测矩阵的压缩比),而且明显提高了系统的鲁棒性。通过仿真实验证明了当压缩比n为4时,平均识别率能够提高到96%以上。 展开更多
关键词 说话人识别 压缩感知 识别率 CS-MFCC 鲁棒性
下载PDF
基于语谱图提取瓶颈特征的情感识别算法研究 被引量:7
7
作者 李姗 徐珑婷 《计算机技术与发展》 2017年第5期82-86,共5页
传统的谱特征(诸如MFCC)来源于对语谱图特征的再加工提取,但存在着因分帧处理引起相邻帧谱特征之间相关性被忽略的问题和所提取的谱特征与目标标签不相关的问题。这导致了从语谱图中提取的特征丢失了很多有用信息。为此,提出了获取深度... 传统的谱特征(诸如MFCC)来源于对语谱图特征的再加工提取,但存在着因分帧处理引起相邻帧谱特征之间相关性被忽略的问题和所提取的谱特征与目标标签不相关的问题。这导致了从语谱图中提取的特征丢失了很多有用信息。为此,提出了获取深度谱特征(Deep Spectral Feature,DSF)的算法。DSF的特征是把直接从语谱图中提取的谱特征用于深度置信网络(DBN)训练,进而从隐层节点数较少的瓶颈层提取到瓶颈特征。为了解决传统谱特征的第一种缺陷,采用相邻多帧语音信号中提取的特征参数构成DSF特征。而深度置信网络所具有的强大自学习能力以及与目标标签密切相关的性能,使得经过微调的DSF特征能够解决传统谱特征的第二个缺陷。大量的仿真实验结果表明,相对于传统MFCC特征,经过微调的DSF特征在语音情感识别领域的识别率比传统MFCC高3.97%。 展开更多
关键词 瓶颈特征 深度置信网络 谱特征 语谱图 情感识别
下载PDF
渐进式神经网络多维说话人信息识别技术 被引量:3
8
作者 陈海霞 徐珑婷 杨震 《南京邮电大学学报(自然科学版)》 北大核心 2019年第1期45-51,共7页
提出了一种识别多维语音信息的方法,用来同时识别说话人身份、性别和情感信息,选择身份特征参数I-vector向量表示语句特征。首先基于深度置信网络(DBN)设计了一个性别相关的多维语音识别基线系统,然后在基线系统基础上又提出了一种基于... 提出了一种识别多维语音信息的方法,用来同时识别说话人身份、性别和情感信息,选择身份特征参数I-vector向量表示语句特征。首先基于深度置信网络(DBN)设计了一个性别相关的多维语音识别基线系统,然后在基线系统基础上又提出了一种基于渐进式神经网络技术(Progressive Neural Network,ProgNets)的多维说话人信息识别方法。在性别相关的基础上,将辅助语音识别模型知识迁移学习到主语音识别模型中,进而增强语音识别性能。实验结果表明,基线系统识别结果比非同时识别的单维语音识别DBN模型的平均识别率提升了4.73%,而基于ProgNets系统的多维系统识别精度比基线系统高1.8%。 展开更多
关键词 I-vector特征向量 深度置信网络 渐进式神经网络 多维说话人信息识别
下载PDF
“感测技术”课程中智能纺织品传感器及其教学设计
9
作者 徐珑婷 田娩鑫 +1 位作者 陆小辰 赵萍 《纺织服装教育》 2022年第2期158-160,共3页
柔性传感器是智能纺织品实现感知功能的重要组成部分,其柔软、可弯曲等特点赋予可穿戴智能纺织品更好的性能。根据传感器的工作原理进行分类,分析近年来柔性传感器的研究成果,概述柔性传感器与纺织材料的结合方式和所适用专业领域的场景... 柔性传感器是智能纺织品实现感知功能的重要组成部分,其柔软、可弯曲等特点赋予可穿戴智能纺织品更好的性能。根据传感器的工作原理进行分类,分析近年来柔性传感器的研究成果,概述柔性传感器与纺织材料的结合方式和所适用专业领域的场景,为未来智能纺织品的创新和发展提供参考。把智能纺织品传感器相关内容引入“感测技术”课程,在融合学科知识的同时拓宽学生的知识面,是课程教学的一次新尝试。 展开更多
关键词 智能纺织品 柔性传感器 “感测技术”课程 教学设计
下载PDF
基于K-means算法的电动汽车充电站在线能量管理
10
作者 王琛焱 徐珑婷 《东华大学学报(自然科学版)》 CAS 北大核心 2022年第1期66-71,共6页
针对电动汽车的充电需求以及未知的实时电价,探讨完整的充电方案,提出一种电动汽车充电站能量管理在线算法,建立由风能、太阳能及电网供电的充电站充电成本优化问题。在电价、风能和太阳能发电量等系统信息已知的条件下,采用离线算法即... 针对电动汽车的充电需求以及未知的实时电价,探讨完整的充电方案,提出一种电动汽车充电站能量管理在线算法,建立由风能、太阳能及电网供电的充电站充电成本优化问题。在电价、风能和太阳能发电量等系统信息已知的条件下,采用离线算法即遗传算法搜索成本最小化问题的全局最优解。由于遗传算法需要已知所有时隙的系统信息,但这些信息是随机分布的,因此提出仅依赖当前信息的在线算法,即基于K-means聚类算法的在线能量管理方案。仿真结果表明,提出的K-means在线算法获得的平均成本优于遗传离线算法,且K-means在线算法收敛速度更快。因此,在电价、风能和太阳能发电量未知的情况下,采用K-means在线算法可控制充电成本。 展开更多
关键词 电动汽车 充电站 能量管理 在线算法 K-MEANS算法 遗传算法
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部