-
题名采用局部相位量化的合成语音检测方法
- 1
-
-
作者
徐嘉
简志华
金宏辉
杨曼
-
机构
杭州电子科技大学信工程学院
浙江省数据存储传输及应用技术研究重点实验室
-
出处
《电信科学》
北大核心
2024年第2期63-71,共9页
-
基金
国家自然科学基金资助项目(No.61201301,No.61772166)。
-
文摘
由于语音合成的便利性,合成伪装语音对说话人认证系统的安全构成了很大的威胁。为了进一步提升说话人认证系统的伪装语音检测能力,提出了一种利用语谱图频域信息的合成语音检测方法,它通过局部相位量化算法对语谱图频域信息进行描述。首先,将语谱图分为若干子块,然后对每个子块进行局部相位量化,经直方图统计分析后获得局部相位量化特征向量并将该特征向量作为随机森林分类器的输入特征,实现合成语音检测。实验结果表明,该方法进一步降低了合成语音检测系统的串联检测代价数值,并且具有更强的泛化能力。
-
关键词
说话人认证
伪装攻击
合成语音检测
局部相位量化
-
Keywords
speaker verification
spoofing attack
synthetic speech detection
LPQ
-
分类号
TP391.42
[自动化与计算机技术—计算机应用技术]
-
-
题名采用圆周局部三值模式纹理特征的合成语音检测方法
- 2
-
-
作者
金宏辉
简志华
杨曼
吴超
-
机构
杭州电子科技大学通信工程学院
浙江省数据存储传输及应用技术研究重点实验室
-
出处
《电信科学》
2023年第6期85-95,共11页
-
基金
国家自然科学基金资助项目(No.61201301,No.61772166,No.61901154)。
-
文摘
为了进一步提高合成语音检测的准确率,提出了一种采用圆周局部三值模式(CLTP)纹理特征的合成语音检测方法。该方法利用圆周局部三值模式提取语谱图中的纹理信息并作为语音的特征表示,采用深度残差网络作为后端分类器来判决语音真伪。实验结果表明,在ASVspoof 2019数据集上,与传统的常量Q倒谱系数(CQCC)和线性预测倒谱系数(LPCC)两种特征相比,该方法在等错误率(EER)上分别降低了54.29%和2.15%,与局部三值模式(LTP)纹理特征相比,该方法在等错误率上也降低了17.14%。圆周局部三值模式由于综合考虑了邻域内中心像素与周边像素之间以及各周边像素之间的差异,更加全面地获取了语谱图的纹理信息,提高了合成语音检测的准确率。
-
关键词
说话人验证
合成语音检测
圆周局部三值模式
深度残差网络
-
Keywords
speaker verification
synthetic speech detection
CLTP
deep residual network
-
分类号
TP391.42
[自动化与计算机技术—计算机应用技术]
-
-
题名基于中心对称局部二值模式的合成伪装语音检测方法
被引量:2
- 3
-
-
作者
徐嘉
简志华
金宏辉
吴超
游林
吴迎笑
-
机构
杭州电子科技大学通信工程学院
杭州电子科技大学网络空间安全学院
杭州电子科技大学计算机学院
-
出处
《电信科学》
2023年第1期72-78,共7页
-
基金
国家自然科学基金资助项目(No.61201301,No.61772166,No.61901154)。
-
文摘
针对基于局部二值模式的伪装语音检测方法的合成语音检测准确度较低的情况,提出了一种基于中心对称局部二值模式的伪装语音检测方法。该方法通过短时傅里叶变换得到语音信号的语谱图,再利用中心对称局部二值模式提取语谱图的纹理特征,并用该纹理特征训练随机森林分类器,从而实现真伪语音的判别。该方法综合考虑语谱图中像素点的数值大小和位置关系,包含了更加全面的纹理信息,并将特征维度降低至16维,有利于减少计算量。实验结果表明,在ASVspoof 2019数据集上,与传统的基于局部二值模式的伪装语音检测方法相比,所提方法将合成伪装语音的串联检测代价函数(t-DCF)降低了16.98%,检测速度提高了89.73%。
-
关键词
说话人验证
伪装语音检测
中心对称局部二值模式
随机森林
-
Keywords
speaker verification
spoofing speech detection
CSLBP
random forest
-
分类号
TP391.42
[自动化与计算机技术—计算机应用技术]
-
-
题名采用恒Q调制包络的合成语音伪装检测方法
- 4
-
-
作者
徐嘉
简志华
金宏辉
吴超
-
机构
杭州电子科技大学通信工程学院
浙江省数据存储传输及应用技术研究重点实验室
-
出处
《电信科学》
2023年第11期107-115,共9页
-
基金
国家自然科学基金资助项目(No.61201301,No.61772166,No.61901154)
-
文摘
针对传统的声学特征参数对合成语音伪装检测时存在的准确度低、未知类型合成语音检测效果较差、在噪声环境中表现欠佳的情况,提出了一种采用恒Q调制包络(constant Q modulation envelope,CQME)的合成伪装语音检测方法。该方法基于语音时域包络中包含的丰富信息,而合成语音与真实语音的包络在细节上存在较大差异,利用恒Q变换(constant Qtransform,CQT)得到语音调制包络谱,并计算每个频率成分的均方根,获得CQME特征向量。再用该特征向量训练随机森林分类器,实现真伪语音的判别。实验结果表明,在ASVspoof 2019数据集上,CQME特征训练的随机森林具有较高的检测性能,对未知类型的合成语音也具有较好的检测效果。并且在多种噪声条件下,该方法仍表现出较高的检测性能,具有很好的噪声鲁棒性。
-
关键词
合成语音
伪装语音检测
恒Q调制包络
随机森林
-
Keywords
synthetic speech
spoofing speech detection
constant Q modulation envelope
random forest
-
分类号
TP391.42
[自动化与计算机技术—计算机应用技术]
-
-
题名关于建筑工程造价预结算审核工作要点分析
被引量:6
- 5
-
-
作者
金宏辉
-
机构
浙江智信工程管理咨询有限公司
-
出处
《中国住宅设施》
2018年第5期99-100,共2页
-
文摘
本文主要对建筑工程造价预结算审核工作要点做出了分析,文章中首先介绍了建筑工程造价预结算审核内容,其中包括建筑工程费用计取审核、建筑工程定额套用审核程序、建筑工程量审核、明确建筑工程范围等五个方面,然后对当前建筑工程造价预结算审核现状进行了分析,其中主要包括造价虚假现象、报价不全面、管理问题多等现象。最后针对建筑工程造价预结算工作提出了几条建议,其中包括明确审核工作内容、提高价格审核质量、进行审核规划等三个方面。
-
关键词
工程造价
建筑
预结算
-
分类号
TU723.3
[建筑科学—建筑技术科学]
-