期刊文献+
共找到25篇文章
< 1 2 >
每页显示 20 50 100
采用恒Q调制包络的合成语音伪装检测方法
1
作者 徐嘉 简志华 +1 位作者 金宏辉 吴超 《电信科学》 2023年第11期107-115,共9页
针对传统的声学特征参数对合成语音伪装检测时存在的准确度低、未知类型合成语音检测效果较差、在噪声环境中表现欠佳的情况,提出了一种采用恒Q调制包络(constant Q modulation envelope,CQME)的合成伪装语音检测方法。该方法基于语音... 针对传统的声学特征参数对合成语音伪装检测时存在的准确度低、未知类型合成语音检测效果较差、在噪声环境中表现欠佳的情况,提出了一种采用恒Q调制包络(constant Q modulation envelope,CQME)的合成伪装语音检测方法。该方法基于语音时域包络中包含的丰富信息,而合成语音与真实语音的包络在细节上存在较大差异,利用恒Q变换(constant Qtransform,CQT)得到语音调制包络谱,并计算每个频率成分的均方根,获得CQME特征向量。再用该特征向量训练随机森林分类器,实现真伪语音的判别。实验结果表明,在ASVspoof 2019数据集上,CQME特征训练的随机森林具有较高的检测性能,对未知类型的合成语音也具有较好的检测效果。并且在多种噪声条件下,该方法仍表现出较高的检测性能,具有很好的噪声鲁棒性。 展开更多
关键词 合成语音 伪装语音检测 恒Q调制包络 随机森林
下载PDF
基于小波变换的语音伪装算法 被引量:4
2
作者 彭静玉 赵鹤鸣 《微电子学与计算机》 CSCD 北大核心 2004年第9期11-14,116,共5页
文章提出了一种基于小波变换的语音伪装算法。它把秘密语音嵌入到数字音频信号中实现保密通信。实验表明该算法的隐蔽性好,隐藏的数据量大。
关键词 信息隐藏 语音伪装 小波变换
下载PDF
一种基于音质评估的语音伪装通信新方法 被引量:1
3
作者 陈亮 张雄伟 《信号处理》 CSCD 2003年第5期411-415,共5页
研究一种语音伪装新方法,将保密语音替换成另外一种语音以便于在公网上安全传输。保密语音经2.4kb/低速率压缩编码后,依据设计的客观音质评估模型,将参数隐蔽地嵌入普通语音;检测时利用逆过程恢复保密语音。实验表明算法的信噪比较传统... 研究一种语音伪装新方法,将保密语音替换成另外一种语音以便于在公网上安全传输。保密语音经2.4kb/低速率压缩编码后,依据设计的客观音质评估模型,将参数隐蔽地嵌入普通语音;检测时利用逆过程恢复保密语音。实验表明算法的信噪比较传统算法提高约3.5dB,并在受到压缩、滤波等攻击时具有较高的鲁棒性。 展开更多
关键词 语音伪装通信 音质评估 遗传算法 语音信号处理 低速率压缩编码
下载PDF
语音伪装方法及其防御对策综述
4
作者 郑琳琳 孙蒙 +1 位作者 张雄伟 潘志欣 《信息技术与网络安全》 2020年第8期33-42,共10页
语音伪装是指以隐藏说话人身份为目的对说话人的个性特征进行的改变。近年来,随着智能语音交互技术和声纹认证产品的快速发展,语音伪装被应用到语音产品隐私保护中,但是也被不法分子用以实施违法犯罪行为。因此,语音伪装成为目前语音处... 语音伪装是指以隐藏说话人身份为目的对说话人的个性特征进行的改变。近年来,随着智能语音交互技术和声纹认证产品的快速发展,语音伪装被应用到语音产品隐私保护中,但是也被不法分子用以实施违法犯罪行为。因此,语音伪装成为目前语音处理和信息安全领域非常有实用意义的研究问题。在简要介绍语音伪装的典型模型和方法的基础上,梳理了语音伪装威胁量化评估方案,总结了近几年伪装语音的防御对策,分析了目前防御对策中存在的问题及技术难点,并对语音伪装的未来研究发展方向进行了展望。 展开更多
关键词 语音伪装 声纹识别 自动说话人确认 语音变换
下载PDF
基于中心对称局部二值模式的合成伪装语音检测方法 被引量:2
5
作者 徐嘉 简志华 +3 位作者 金宏辉 吴超 游林 吴迎笑 《电信科学》 2023年第1期72-78,共7页
针对基于局部二值模式的伪装语音检测方法的合成语音检测准确度较低的情况,提出了一种基于中心对称局部二值模式的伪装语音检测方法。该方法通过短时傅里叶变换得到语音信号的语谱图,再利用中心对称局部二值模式提取语谱图的纹理特征,... 针对基于局部二值模式的伪装语音检测方法的合成语音检测准确度较低的情况,提出了一种基于中心对称局部二值模式的伪装语音检测方法。该方法通过短时傅里叶变换得到语音信号的语谱图,再利用中心对称局部二值模式提取语谱图的纹理特征,并用该纹理特征训练随机森林分类器,从而实现真伪语音的判别。该方法综合考虑语谱图中像素点的数值大小和位置关系,包含了更加全面的纹理信息,并将特征维度降低至16维,有利于减少计算量。实验结果表明,在ASVspoof 2019数据集上,与传统的基于局部二值模式的伪装语音检测方法相比,所提方法将合成伪装语音的串联检测代价函数(t-DCF)降低了16.98%,检测速度提高了89.73%。 展开更多
关键词 说话人验证 伪装语音检测 中心对称局部二值模式 随机森林
下载PDF
基于DC-CNN的电子伪装语音还原研究 被引量:5
6
作者 王永全 施正昱 张晓 《计算机科学》 CSCD 北大核心 2019年第8期183-188,共6页
针对电子伪装语音还原研究在还原模型的构建方面并无突破性进展的状况,提出了一种基于扩大的因果卷积神经网络(Dilated Casual-Convolution Neural Network,DC-CNN)的电子伪装语音还原模型。该还原模型以DC-CNN为框架,对电子伪装语音历... 针对电子伪装语音还原研究在还原模型的构建方面并无突破性进展的状况,提出了一种基于扩大的因果卷积神经网络(Dilated Casual-Convolution Neural Network,DC-CNN)的电子伪装语音还原模型。该还原模型以DC-CNN为框架,对电子伪装语音历史采样点的声学信息与还原因子进行卷积和非线性映射运算。同时模型的神经网络采用跃层连接技术以优化深层传递,再经过压扩转换后输出还原语音。该模型具有非线性映射性、扩展性、多适应性与条件性、并发性等明显特点。在实验分析中,以3个基本变声功能:音调(pitch)、节拍(tempo)和速度(rate)对钢琴曲和英文语音分别进行电子伪装变声处理,再经模型还原,将还原语音与原始语音进行声纹特征比对、LPC数据分析和语音同一性的人耳测听辨识,结果表明,还原语音与原始语音的声纹特征十分吻合,且实现了高质量的共振峰波形复原,钢琴曲和英文语音的共振峰参数总体还原拟合率分别达到79.03%和79.06%,远超电子伪装语音与原始语音35%的相似比例,这说明该模型能有效削减语音中的电子伪装特征,较好地实现了电子伪装的钢琴曲和英文语音的还原。 展开更多
关键词 DC-CNN 电子伪装语音 还原语音 还原因子 门激活单元
下载PDF
基于DTW模型补偿的伪装语音说话人识别研究 被引量:7
7
作者 李燕萍 陶定元 林乐 《计算机技术与发展》 2017年第1期93-96,共4页
语音变声器及各种手机变声软件的出现,在提供了极其方便且丰富的娱乐交互体验的同时,也给语音通信带来了新的安全问题。由于其产生的电子伪装语音掩盖了语音本身的个性特征,对现有的说话人识别技术来说是一种挑战,且一旦被犯罪分子利用... 语音变声器及各种手机变声软件的出现,在提供了极其方便且丰富的娱乐交互体验的同时,也给语音通信带来了新的安全问题。由于其产生的电子伪装语音掩盖了语音本身的个性特征,对现有的说话人识别技术来说是一种挑战,且一旦被犯罪分子利用,后果将十分严重。因此,伪装语音说话人识别的研究成为当下的研究热点。提出一种针对电子伪装语音的说话人识别方法。对于由手机变声软件产生的电子伪装语音,提取该语音的梅尔倒谱系数(Mel Frequency Cepstral Coefficients,MFCC)作为特征参数,通过动态时间规整(Dynamic Time Warping,DTW)模型进行伪装程度鉴定,再利用矢量量化(Vector Quantization,VQ)模型进行说话人识别,从而设计了DTW与VQ相结合的电子伪装语音说话人识别系统。实验结果表明:该系统能够有效解决VQ说话人识别系统对电子伪装语音识别率过低的问题,识别效果得到了明显改善。 展开更多
关键词 电子伪装语音 梅尔倒谱系数 说话人识别 动态时间规整 矢量量化
下载PDF
伪装语音的自动话者识别研究 被引量:4
8
作者 张翠玲 谭铁军 刘昇 《刑事技术》 2007年第2期18-21,共4页
本文以语音自动话者识别系统为平台,对实际案件中出现频率较高的10种伪装语音类型进行自动话者识别测试。通过对20位发音人的正常语音和10种类型伪装语音的话者辨认和话者确认测试,分析不同语音伪装类型对自动话者识别的影响。该结果对... 本文以语音自动话者识别系统为平台,对实际案件中出现频率较高的10种伪装语音类型进行自动话者识别测试。通过对20位发音人的正常语音和10种类型伪装语音的话者辨认和话者确认测试,分析不同语音伪装类型对自动话者识别的影响。该结果对于深入认识伪装语音的特性及其话者识别研究具有重要意义,也为自动话者识别技术的改进提供了参考。 展开更多
关键词 伪装语音 自动话者识别 话者辨认 话者确认
下载PDF
基于GMM统计特性的电子伪装语音鉴定研究 被引量:6
9
作者 李燕萍 林乐 陶定元 《计算机技术与发展》 2017年第1期103-106,共4页
数字多媒体技术的发展使多媒体信息得到广泛使用和传播,给人类的信息交流带来极大的便利。随着语音相关技术的发展与逐渐成熟,对于语音信号处理的应用也越来越广泛。数字多媒体信息易于修改的特点,使其面临着恶意篡改带来的严重危机。... 数字多媒体技术的发展使多媒体信息得到广泛使用和传播,给人类的信息交流带来极大的便利。随着语音相关技术的发展与逐渐成熟,对于语音信号处理的应用也越来越广泛。数字多媒体信息易于修改的特点,使其面临着恶意篡改带来的严重危机。近年来,手机应用软件市场上出现了大量的变声软件,例如微信变声器、超级变声器等等,类似变声器的下载量动辄上百万,这些应用软件可使说话人的声音发生巨大的改变,致使一般的听话人无法辨认发音人的身份、年龄乃至性别,即使是对话者非常熟悉的人也很难识别出说话者的身份。提出了一种鉴定电子伪装语音的方法,通过GMM模型建模,将其均值矢量构成组合特征,然后基于SVM分类器进行训练和鉴别。通过对比语音伪装前后的梅尔倒谱特征参数的统计特性变化,对特征参数的变化规律进行了分析研究。实验结果表明,提出的方法对电子伪装语音的鉴定正确率达到90%。 展开更多
关键词 变声软件 电子伪装语音 梅尔倒谱系数 支持向量机 高斯混合模型
下载PDF
基于Praat软件的电子伪装语音识别研究
10
作者 胡晓光 刘天宇 +1 位作者 杨昊易 蔡能斌 《中国人民公安大学学报(自然科学版)》 2021年第2期1-6,共6页
为探究变音软件的变音规律,总结变音软件变音原理。以市面上常见的4款变音软件作为研究对象,利用praat软件对3名实验者变音前后的声音参数(音强、基频、共振峰频率等)进行测定与分析,并对变声结果进行变调分析。发现变音软件主要有改变... 为探究变音软件的变音规律,总结变音软件变音原理。以市面上常见的4款变音软件作为研究对象,利用praat软件对3名实验者变音前后的声音参数(音强、基频、共振峰频率等)进行测定与分析,并对变声结果进行变调分析。发现变音软件主要有改变基频和进行复杂运算两种变音原理,基于此提出对变声进行相应比例的变调,可以得到与原声听觉效果和声学参数上均契合较好的恢复语音。在案件的侦查初期提供指向嫌疑人的线索,也为打击电信诈骗的违法犯罪活动提供了一种新思路。 展开更多
关键词 praat 电子伪装语音 测定与分析
下载PDF
基于联合特征与随机森林的伪装语音检测 被引量:4
11
作者 于佳祺 简志华 +3 位作者 徐嘉 游林 汪云路 吴超 《电信科学》 2022年第6期91-99,共9页
为了能较为全面地描述语音信号的特征信息,提高伪装检测率,提出了一种基于均匀局部二值模式纹理特征与常数Q倒谱系数声学特征相结合,并以随机森林为分类模型的伪装语音检测方法。利用均匀局部二值模式提取语音信号语谱图中的纹理特征矢... 为了能较为全面地描述语音信号的特征信息,提高伪装检测率,提出了一种基于均匀局部二值模式纹理特征与常数Q倒谱系数声学特征相结合,并以随机森林为分类模型的伪装语音检测方法。利用均匀局部二值模式提取语音信号语谱图中的纹理特征矢量,并与常数Q倒谱系数构成联合特征,再用所获得的联合特征矢量训练随机森林分类器,从而实现了伪装语音检测。实验中,分别对其他特征参数以及支持向量机分类器模型所构建的几种伪装检测系统进行了性能对照,结果表明,所提联合特征与随机森林模型相结合的语音伪装检测系统具有最优的检测性能。 展开更多
关键词 伪装语音检测 声学特征 纹理特征 均匀局部二值模式 随机森林
下载PDF
面向复杂声学环境的伪装语音检测 被引量:1
12
作者 周晔 章坚武 程继承 《传感技术学报》 CAS CSCD 北大核心 2022年第10期1355-1362,共8页
随着技术更迭,最新语音合成和语音转换模型生成的伪装语音在感知上与真正语音无法区分,这严重威胁着公众的个人信息安全。现有的检测方法虽有可观进展,但仍存在检测声学环境单一、对未知欺骗攻击泛化能力差等问题。针对以上问题,提出了... 随着技术更迭,最新语音合成和语音转换模型生成的伪装语音在感知上与真正语音无法区分,这严重威胁着公众的个人信息安全。现有的检测方法虽有可观进展,但仍存在检测声学环境单一、对未知欺骗攻击泛化能力差等问题。针对以上问题,提出了一种基于深度残差收缩网络(Deep Residual Shrinkage Networks,DRSN)的多特征联合语音欺骗检测方法,首先DRSN利用基于深度注意力机制的自适应阈值学习模块和软阈值模块提高了在复杂声学环境下的特征学习能力,再选取合适的声学特征构建单类特征-DRSN检测模型,最后执行多模型联合检测以实现互补,进一步提升整体性能。使用ASVspoof2019数据集的实验结果表明,相较于最佳基线系统,本方法在t-DCF和EER性能指标上分别降低47%和53%。 展开更多
关键词 伪装语音检测 欺骗对策 复杂声学环境 DRSN
下载PDF
基于语音高频信息的伪装语音检测算法 被引量:2
13
作者 张立 严迪群 王让定 《数据通信》 2017年第6期44-47,共4页
用语音合成或转换技术可以方便地生成的具有目标说话人声纹特性的伪装语音,这类语音一直是声纹识别系统的一个安全隐患。本文利用了伪装语音与自然语音在语音高频信息上的区别,提出了一个能同时检测多种伪装语音类型的鉴别算法。实验中... 用语音合成或转换技术可以方便地生成的具有目标说话人声纹特性的伪装语音,这类语音一直是声纹识别系统的一个安全隐患。本文利用了伪装语音与自然语音在语音高频信息上的区别,提出了一个能同时检测多种伪装语音类型的鉴别算法。实验中使用了SAS数据库,实验结果表明,提出的算法能检测SAS数据库中9种方法生成的伪装语音,其中,检测参与模型训练的伪装语音的平均等错误概率为0.18%,检测未参与模型训练的伪装语音的平均等错误概率为1.31%。 展开更多
关键词 伪装语音 语音合成 语音转换 高频信息
下载PDF
基于i⁃vector的电子伪装语音鲁棒还原方法研究 被引量:1
14
作者 郑琳琳 张雄伟 +2 位作者 孙蒙 李嘉康 张星昱 《数据采集与处理》 CSCD 北大核心 2020年第5期880-891,共12页
语音的电子伪装是指采用变声设备或语音处理软件改变说话人的个性特征,以达到故意隐藏该说话人身份的目的。电子伪装语音还原是指通过技术手段将伪装语音变回原声,这对基于语音的身份鉴别有重要意义。本文将频域和时域伪装语音的还原问... 语音的电子伪装是指采用变声设备或语音处理软件改变说话人的个性特征,以达到故意隐藏该说话人身份的目的。电子伪装语音还原是指通过技术手段将伪装语音变回原声,这对基于语音的身份鉴别有重要意义。本文将频域和时域伪装语音的还原问题抽象为伪装因子的估计问题,通过基于i⁃vector的自动说话人确认方法估计伪装因子,并引入对称变换进一步提高估计效果。该方法借助于i⁃vector的噪声鲁棒性,提高了真实含噪场景下伪装因子的估计精度,从而改进了噪声条件下电子伪装语音的还原效果。在干净语音库TIMIT上训练i⁃vector并在含噪语音库VoxCeleb1上对本文方法进行测试,结果表明,伪装因子估计的错误率从基线系统的9.19%降低为4.49%,还原语音在自动说话人确认等错误率和听觉感知方面也取得了提升。 展开更多
关键词 电子伪装语音 伪装因子估计 自动说话人确认 噪声鲁棒性
下载PDF
伪装语音的听觉识别研究 被引量:3
15
作者 张巍 《科技视界》 2016年第13期10-12,共3页
在涉及语音的案件当中,犯罪分子为了掩盖身份,逃避打击,常常采用各种方法对他们的声音进行伪装,从而给案件侦破和语音鉴定工作带来很大困难。因此,对伪装语音进行研究尤为重要。本文采集了10位发音人的正常语音以及提高基频、降低基频... 在涉及语音的案件当中,犯罪分子为了掩盖身份,逃避打击,常常采用各种方法对他们的声音进行伪装,从而给案件侦破和语音鉴定工作带来很大困难。因此,对伪装语音进行研究尤为重要。本文采集了10位发音人的正常语音以及提高基频、降低基频、加快语速、减慢语速、捏鼻伪装、咬物伪装、捂嘴伪装、嚼物伪装、耳语伪装和变更方言10种伪装方式的语音样本。另外,因为不同人对声音的敏感程度和对语音的识别依据不同,所以识别结果也就不尽相同。本文的研究结果为伪装语音等疑难案件的检验鉴定提供了一定的参考和借鉴,对于法庭话者鉴别技术应用和发展具有重要意义。 展开更多
关键词 伪装语音 听觉识别 语音检验 正确识别率
下载PDF
基于语音信号和混沌序列的非对称图像隐藏方案 被引量:1
16
作者 张小红 闵乐泉 《北京科技大学学报》 EI CAS CSCD 北大核心 2005年第6期754-759,共6页
基于广义混沌同步系统(GS)和广义离散Sinai映射,提出了具有非对称密钥的数字图像安全通讯方案.方案能通过一个常规的语音信号隐藏几乎所有计算机所能识别的图像文件,以实现信息的伪装与隐藏,且含有24个密钥数并能无损恢复隐藏图像... 基于广义混沌同步系统(GS)和广义离散Sinai映射,提出了具有非对称密钥的数字图像安全通讯方案.方案能通过一个常规的语音信号隐藏几乎所有计算机所能识别的图像文件,以实现信息的伪装与隐藏,且含有24个密钥数并能无损恢复隐藏图像,密钥空间可达到10^(360).该方案能使接收方利用非对称密钥对收到的密文进行数据源真伪性认证和解密,适用于网络数字通讯语音伪装中的图像传输.对密钥空间、密钥参数敏感性和加密图像的相关性等分析表明该方案具有较高的安全性. 展开更多
关键词 广义混沌同步 sinai映射 图像处理 语音伪装 图像加密 数据源认证
下载PDF
基于深度学习的自然与表演语音情感识别 被引量:15
17
作者 王蔚 胡婷婷 冯亚琴 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2019年第4期660-666,共7页
语音是情感表达的重要途径,自然状态和表演状态下的语音所蕴含的情感信息并不完全相同.为了探索自然状态和表演状态下语音情感识别的差异,采用深度学习算法分析了IEMOCAP公用数据集,对自然状态和表演状态下的中性、愤怒、开心和悲伤等... 语音是情感表达的重要途径,自然状态和表演状态下的语音所蕴含的情感信息并不完全相同.为了探索自然状态和表演状态下语音情感识别的差异,采用深度学习算法分析了IEMOCAP公用数据集,对自然状态和表演状态下的中性、愤怒、开心和悲伤等四类情绪语音数据进行实验:首先提取语音数据的声学特征(对比了emobase2010特征集和eGeMAPs特征集),然后利用卷积神经网络(Convolutional Neural Networks,CNN)对自然与表演状态下的语音情感进行识别,比较了两种状态下的情感识别率,再利用混淆矩阵分析两种状态下不同情绪之间的误分率和相似性.实验结果显示,自然状态下的情感识别率明显高于表演状态下,还发现愤怒和悲伤在两种状态下的误分率有明显区别.该现象对理解情绪的表达机制有启发意义。 展开更多
关键词 情感类别 语音情感识别 深度学习 伪装语音
下载PDF
国际司法语音学会2002年年会情况简介
18
作者 李敬阳 《刑事技术》 2003年第2期3-4,共2页
关键词 国际司法语音学会 2002年 声纹鉴定 伪装语音 专家系统
下载PDF
录音证据中耳语伪装语声宽带声纹不变性及其机理的研究
19
作者 王英利 《公安应用技术通讯》 1998年第2期21-23,共3页
关键词 耳语伪装 录音证据 语声 语音伪装 宽带声纹图
下载PDF
电声伪装语音的声学研究 被引量:2
20
作者 张翠玲 赵晓波 《中国刑警学院学报》 2008年第2期53-55,共3页
采用听视觉相结合的方法对4名成年话者的自然语音和电声伪装语音进行了声学特性的比较研究。通过对两种语音的共振峰频率分布、基频、音强、时长等语音参数的形态比较和统计分析,对电声伪装语音的特点、参数的变化以及伪装对话者识别率... 采用听视觉相结合的方法对4名成年话者的自然语音和电声伪装语音进行了声学特性的比较研究。通过对两种语音的共振峰频率分布、基频、音强、时长等语音参数的形态比较和统计分析,对电声伪装语音的特点、参数的变化以及伪装对话者识别率的影响等问题进行了归纳总结。 展开更多
关键词 伪装语音 电声伪装 法庭话者识别
原文传递
上一页 1 2 下一页 到第
使用帮助 返回顶部