合成语音的声纹鉴定分析--以两名AI虚拟主播语音为基础被引量：2

Voiceprint Identification Analysis of Speech Synthesis:Based on the Voice of Two AI Virtual Announcers

下载PDF

导出

摘要目的探究现阶段的AI合成语音与真人语音在声纹检验方面的差异。方法通过收集两名AI虚拟主播及其各自原型的语音,以声纹鉴定的角度进行听觉感知、语谱分析两个方面的研究。结果合成语音在听觉感知上仍能发现缺乏情感和自然度、断句错误等问题,基于实验所用语音高频共振峰的相对稳定性,合成语音与其原型的差异主要表现在4 kHz以上的高频共振峰上,有些音节在3 kHz以上即能显出差别,合成语音部分音节内的辅音-元音过渡段缺失。结论在当前技术水平下,合成语音在处理韵律问题上有待提高,听觉分析可作判断合成语音的声纹检验参考。在语谱分析中能在合成语音和真人语音的高频图谱以及部分音节的辅音-元音过渡中呈现差异。 Objective To explore the differences between AI-synthesized speech and human speech in voiceprint inspection at the present stage.Methods By collecting the voices of two AI virtual anchors and their respective prototypes,two aspects of auditory perception and language spectrum analysis were conducted from the perspective of voiceprint identification.Results Synthetic speech still suffers from lack of emotion,unnatural speech,and punctuation errors in auditory perception.Based on the relative stability of the high-frequency formants of the speech used in the experiment,the difference between the synthesized speech and its prototype was mainly manifested in the high-frequency resonance above 4 kHz.On the peak,some syllables can show differences above 3 kHz,and the consonant-vowel transition in some syllables of synthesized speech is missing.Conclusion At the current level of technology,synthetic speech needs to be improved in dealing with prosody issues,and auditory analysis can be used as a reference for voiceprint test for judging synthetic speech.In the spectral analysis,differences can be shown in the high-frequency maps of synthetic and real speech and the consonant-vowel transitions of some syllables.

作者张学海杨璐铭 ZHANG Xuehai;YANG Luming(Forensic Science Center of Guangdong Provincial Public Security Bureau,Guangzhou 510050,China)

机构地区广东省公安厅刑事技术中心

出处《中国司法鉴定》 2022年第2期69-72,共4页 Chinese Journal of Forensic Sciences

关键词 AI虚拟主播合成语音声纹鉴定 AI virtual announcer synthetic speech voiceprint identification

分类号 D915.13 [政治法律—诉讼法学] TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献1

1白海莉.情感语音合成技术或对声纹鉴定准确性产生影响[J].科技创新与应用,2018,8(36):24-24. 被引量：6

二级参考文献8

1井晓阳,罗飞,王亚棋.汉语语音合成技术综述[J].计算机科学,2012,39(S3):386-390. 被引量：13
2王英利,李敬阳,曹洪林.声纹鉴定技术研究[J].警察技术,2012(4):53-56. 被引量：28
3张建明,詹智财,成科扬,詹永照.深度学习的研究与发展[J].江苏大学学报（自然科学版）,2015,36(2):191-200. 被引量：62
4郭丽丽,丁世飞.深度学习研究进展[J].计算机科学,2015,42(5):28-33. 被引量：201
5张斌,全昌勤,任福继.语音合成方法和发展综述[J].小型微型计算机系统,2016,37(1):186-192. 被引量：29
6韩超.语音合成技术的功能设计和实现[J].科技创新与生产力,2016(12):84-87. 被引量：1
7高莹莹,朱维彬.面向情感语音合成的言语情感描述与预测[J].清华大学学报（自然科学版）,2017,57(2):202-207. 被引量：5
8侯一民,周慧琼,王政一.深度学习在语音识别中的研究进展综述[J].计算机应用研究,2017,34(8):2241-2246. 被引量：81

共引文献5

1王周宏,王能超.离散积分小波变换的快速算法[J].应用数学,2000,13(2):27-30.
2刘一鸣,高玥.人工智能语音在有声读物中的应用研究[J].出版发行研究,2019,0(11):35-39. 被引量：16
3符式培,吴宗源,邱枫.有声读物中智能语音的应用[J].中国科技投资,2020(33):61-61.
4白曦龙,冯佳.基于ChaffMatrix的光载声音声纹变化识别系统设计[J].激光杂志,2022,43(1):174-178.
5葛霖霖,敬钊君.基于AI的智能交换功能拉杆箱设计[J].信息记录材料,2023,24(1):118-120.

同被引文献15

1冯雅心,汪高武.脱口秀演员、非演员和AI对喜剧脚本语音呈现的差异[J].中国语音学报,2021(2):70-77. 被引量：1
2马秋武.两种不同的研究范式:语言与语言学[J].天津外国语大学学报,2024,31(1):32-43. 被引量：3
3聂珍钊.论科学时代的机器翻译[J].天津外国语大学学报,2023,30(6):1-10. 被引量：4
4胡壮麟.韩礼德谈机器翻译[J].天津外国语大学学报,2023,30(1):1-7. 被引量：5
5姜英,王延江,林青,刘伟锋.基于卷积神经网络与Bayesian决策的图像识别与分类记忆建模[J].中国科学：技术科学,2017,47(9):977-984. 被引量：4
6王传栋,叶青,姚橹,刘尚东,季一木,王汝传.基于大数据的网络恶意行为及特征关联分析[J].太原理工大学学报,2018,49(2):264-273. 被引量：22
7罗浩,闫光辉,张萌,包峻波,李俊成,刘婷.基于证据理论的多关系网络重要节点挖掘方法[J].计算机学报,2020,43(12):2398-2413. 被引量：9
8蔡浩,郭宏亮.基于多分类器DS证据理论融合的水果识别研究[J].中国农机化学报,2021,42(2):184-189. 被引量：6
9王学光,诸珺文,张爱新.基于MFCC特征的声纹同一性鉴定方法[J].计算机科学,2021,48(12):343-348. 被引量：16
10原智.手机变声器语音与正常语音声纹特征的比较研究[J].江西警察学院学报,2021(6):38-47. 被引量：1

引证文献2

1王学光,诸珺文,张爱新.一种三维度基于改进MFCC特征模型的AI克隆语音源鉴定方法[J].计算机科学,2023,50(11):177-184. 被引量：3
2王帅.合成语音与自然语音的音高差异——从18种语言核心词看合成语音的音高特点[J].天津外国语大学学报,2024,31(5):88-98.

二级引证文献3

1诸珺文.从《刑法修正案(十一)》再看我国少年司法理念的落实[J].东南大学学报（哲学社会科学版）,2024,26(S01):95-101.
2江波翰,王新伟.特征参数比对法在识别AI合成语音中的研究[J].信息与电脑,2023,35(24):174-177.
3王学光,诸珺文.涉罪人工智能刑罚的正当性——以东西方认识论互补视角为切入点[J].华东理工大学学报（社会科学版）,2024,39(2):106-119. 被引量：1

1帕丽旦·木合塔尔,吾守尔·斯拉木,买买提阿依甫.HMM与神经网络相融合的低资源语音合成方法[J].计算机仿真,2021,38(12):203-211. 被引量：2
2阮蓬.简谈司法鉴定中声音影像的特征比较应用[J].中国新通信,2022,24(1):139-140. 被引量：2
3俞杰.犯罪嫌疑人捏鼻伪装语音鉴定中声纹特征参数选取分析[J].西部公安论坛,2021,19(4):16-21.
4胡安琪.论听觉分析在高师院校视唱练耳教学中的实践与探索[J].戏剧之家,2022(2):113-114.
5李福来,陈娥.尼美哈尼话与大寨哈尼话的语音对比研究[J].红河学院学报,2022,20(2):8-10.
6阿泽亚.从实验语音学视角探析蒙古国蒙古语口语中辅音/P/的脱落现象[J].内蒙古社会科学（蒙文版）,2021(4):50-53.
7陈子谦,王虹.合成语音的语音同一认定研究[J].广东公安科技,2021,29(3):43-46. 被引量：1
8梁栋.无调性音乐作品中“集合”的听觉分析方法探索[J].四川戏剧,2021(11):122-124.
9王晓博,金颖,宋旸.不同视觉感知自然度水景照片对个体认知的影响[J].景观设计学（中英文）,2021,9(5):32-45. 被引量：2
10徐思佳,胡玲,李绥.国内外韧性社区研究进展及启示--基于CiteSpase可视化研究[J].城市建筑,2022,19(3):39-44. 被引量：2

中国司法鉴定

2022年第2期

浏览历史

内容加载中请稍等...

合成语音的声纹鉴定分析--以两名AI虚拟主播语音为基础被引量：2

参考文献1

二级参考文献8

共引文献5

同被引文献15

引证文献2

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

合成语音的声纹鉴定分析--以两名AI虚拟主播语音为基础 被引量：2

参考文献1

二级参考文献8

共引文献5

同被引文献15

引证文献2

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

合成语音的声纹鉴定分析--以两名AI虚拟主播语音为基础被引量：2