HR-DCGAN方法的帕金森声纹样本扩充及识别研究被引量：9

Study on Augmentation and Recognition of Parkinson’s Voiceprint Samples by HR-DCGAN Method

下载PDF

导出

摘要声纹作为人类重要的生物特征,可应用于帕金森等疾病的判别,但现存的患者声纹数据集及样本偏少,故提出HR-DCGAN(High Resolution Deep Convolutional Generative Adversarial Network)进行样本扩充,进而采用深度学习方法区分帕金森患者和健康人.HR-DCGAN通过增加网络层数并结合特征匹配方法生成高分辨的语谱图,依据结构相似度指标(Structural Similarity Index,SSIM)筛选出高相似度的语谱图以扩充样本.构建VGG16提取声纹特征并分类有效地提高识别准确率,使用Dropout方法抑制过拟合问题进而达到正则化效果.在Sakar数据集上进行了多种特征提取方法,多分类方法的对比实验,结果表明HR-DCGAN-VGG16混合模型能够获得最高声纹识别准确率90. 5%和特异性91%,能有效区分帕金森患者和健康人,解决了少量声纹数据下对帕金森患者的早期高效筛查问题. As an important biological feature of human beings,voiceprint can be applied to identify diseases such as Parkinson’s Disease,but existing patient voiceprint datasets and samples are less,so HR-DCGAN( High Resolution Deep Convolutional Generative Adversarial Network) is proposed for sample augment,and then deep learning method is used to distinguish between Parkinson’s patients and healthy people. HR-DCGAN generates high-resolution spectrogram by increasing the number of network layers and combining feature matching method,and selects high-similarity spectrogram based on Structural Similarity Index values to augment the samples. Constructing VGG16 to extract the voiceprint features and classify them effectively to improve the recognition accuracy. The Dropout method is used to suppress the over-fitting problem and achieve the regularization effect. Comparative experiments of a variety of extraction methods and multi-classification methods were performed on the Sakar dataset,the results show that the HR-DCGANVGG16 hybrid model can achieve the highest voiceprint recognition accuracy of 90. 5% and specificity of 91%,which can effectively distinguish between Parkinson’s patients and healthy people,and solve the problem of early and efficient screening of Parkinson’s patients with a small amount of voiceprint samples.

作者王娟徐志京 WANG Juan;XU Zhi-jing(School of Information Engineering,Shanghai Maritime University,Shanghai 201306,China)

机构地区上海海事大学信息工程学院

出处《小型微型计算机系统》 CSCD 北大核心 2019年第9期2026-2032,共7页 Journal of Chinese Computer Systems

基金国家自然科学基金项目(61673259)资助

关键词帕金森病 HR-DCGAN 语谱图样本扩充 VGG16 Parkinson’s Disease HR-DCGAN spectrogram sample augment VGG16

分类号 TN912 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献1

1张玉海,杜怀栋,陈惠军,朱琴华,王正敏.帕金森病的嗓音特征[J].听力学及言语疾病杂志,2001,9(2):84-86. 被引量：10

二级参考文献7

1Hertrich I,Achermann H.Gender- specific vocal dysfunctions in Parkinson’s disease: electroglottographic and acoustic analyses[].Annals of Otology Rhinology Laryngology.1995
2Riming LO,Titze IR,Scherter,et al.Acoustic analysis of voices of pa-tients with neurologic disease: rationale and preliminary data[].Annals of Otology Rhinology Laryngology.1988
3Hanson DG. Gerratt BR,Ward PH,et al.Cinegraphic observations oflaryngeal function in Parkinson’s disease[].Laryngoscope.1984
4Streifler M,Hofman S.Disorders of verbal expression in parkinsonism[].Advances in Neurology.1984
5Forrest K,Weismer G,Turner GS.Kinematic, acoustic, and perceptual analyses of connected speech produced by parkinsonian and normalgeriatric adults[].The Journal of The Acoustical Society of America.1989
6Patcairn TK,Clemie S,Gray JM,et al.Impressions of parkinsonian patients from their recorded voices[].British Journal of Disorders of Communication.1990
7Baker KK,Rimig LO,Luschei ES,et al.Thyroarytenoid muscle activityassociated with hypophonia in Parkinson’s disease and aging[].Neurology.1998

共引文献9

1高春丽,周梁,王坚,李采,蒋家琪.帕金森病患者的发音和言语障碍及治疗学进展[J].中华老年医学杂志,2006,25(9):712-715. 被引量：3
2何维佳,李胜利.运动性构音障碍言语声学水平客观评价的研究进展[J].中国康复理论与实践,2010,16(2):118-120. 被引量：11
3何维佳,李胜利.成人痉挛型构音障碍普通话元音声学分析[J].中国康复理论与实践,2010,16(8):764-767. 被引量：8
4李勇明,张成,王品,谢廷杰,曾孝平,张艳玲,承欧梅,颜芳.面向帕金森病语音数据挖掘的分包融合集成算法[J].生物医学工程学杂志,2019,36(4):548-556. 被引量：3
5刘杰,李利,余波,黄昭鸣.1～3期帕金森病患者的嗓音特征研究[J].听力学及言语疾病杂志,2020,28(1):28-30. 被引量：5
6芮荣祥,刘艳霞,王一昊,田茂再.高维条件均值假设检验及其在帕金森症诊断中的应用[J].数理统计与管理,2021,40(4):571-584. 被引量：1
7黄方亮,许欢庆,沈同平,金力,俞磊.结合残差神经网络和语音诊断的帕金森病识别研究[J].齐鲁工业大学学报,2022,36(1):36-43.
8张子豪,赵德春,王子琼,韦莉.基于样本增强的帕金森病识别算法研究[J].生物医学工程学杂志,2024,41(1):17-25.
9孙永柱,崔鹏程,陈文弦,李贵泽,孙安.嗓音语图频谱分析对帕金森病患者的诊断意义[J].中国临床康复,2002,6(23):3512-3513. 被引量：6

同被引文献58

1王宇,刘文予,罗宁.基于扩充数据源的系统调用异常检测算法[J].计算机与数字工程,2006,34(1):13-16. 被引量：3
2张涛,洪文学,李铭婷,赵勇,孟辉.基于多维筛分类器的可视化帕金森病诊断[J].燕山大学学报,2010,34(2):180-184. 被引量：4
3李祚林,李晓辉,马灵玲,胡玥,唐伶俐.面向无参考图像的清晰度评价方法研究[J].遥感技术与应用,2011,26(2):239-246. 被引量：43
4张涛,洪文学,常凤香,刘旭龙.基于元音分类度的帕金森病语音特征分析[J].中国生物医学工程学报,2011,30(3):476-480. 被引量：6
5佟玉珊,杨新玲.雷沙吉兰治疗帕金森病的Meta分析[J].中国循证医学杂志,2014,14(2):205-210. 被引量：6
6张玉海,杜怀栋,陈惠军,朱琴华,王正敏.帕金森病的嗓音特征[J].听力学及言语疾病杂志,2001,9(2):84-86. 被引量：10
7张静,罗传仙,杨丰源,黄光磊,陈泽昊,李喆,盛戈皞.直流XLPE电缆绝缘泄漏电流与局部放电试验特征研究[J].高压电器,2019,55(2):140-148. 被引量：16
8史长城,田港,楼江,吴静.选择性5-羟色胺再摄取抑制剂治疗帕金森病伴抑郁有效性与安全性的系统评价[J].中国循证医学杂志,2015,15(4):439-444. 被引量：4
9王晴,罗璨,袁振华,卢祖能.辅酶Q10治疗帕金森病临床效果的Meta分析[J].中国循证医学杂志,2016,16(6):706-711. 被引量：4
10李勇明,杨刘洋,刘玉川,王品,邱明国,谢文宾,张小恒.基于语音样本重复剪辑和随机森林的帕金森病诊断算法研究[J].生物医学工程学杂志,2016,33(6):1053-1059. 被引量：8

引证文献9

1刘文浩,李文泽,王洪雨,吴毅江,王干军,Ashfaque Ahmed Bhatti,彭小圣.基于可变噪音的高压电缆局部放电样本扩充[J].广东电力,2020,33(9):35-41. 被引量：3
2徐志京,张铁海.加权全序列卷积神经网络方法的帕金森声纹识别研究[J].小型微型计算机系统,2020,41(12):2683-2688. 被引量：4
3张涛,蒋培培,张亚娟,曹玉阳.基于时频混合域局部统计的帕金森病语音障碍分析方法研究[J].生物医学工程学杂志,2021,38(1):21-29. 被引量：4
4甘岚,沈鸿飞,王瑶,张跃进.基于改进DCGAN的数据增强方法[J].计算机应用,2021,41(5):1305-1313. 被引量：22
5郭伟,庞晨.改进生成式对抗网络的图像数据集增强算法[J].电讯技术,2022,62(3):281-287. 被引量：5
6张静,农昌瑞,杨智勇,刘镇毓,曾庆松.改进DCGAN的飞机蒙皮图像生成方法[J].兵器装备工程学报,2022,43(3):286-292. 被引量：3
7张涛,林丽琴,张亚娟,牛晓霞.帕金森语音障碍的Mel变换域局部梯度统计分析[J].计算机科学与探索,2022,16(10):2345-2356.
8朱家英,徐志京.基于动态注意力机制和多模态循环融合的帕金森氏症识别[J].计算机应用研究,2023,40(2):481-487. 被引量：2
9张子豪,赵德春,王子琼,韦莉.基于样本增强的帕金森病识别算法研究[J].生物医学工程学杂志,2024,41(1):17-25.

二级引证文献42

1聂岩,蒋鹏飞,边防,贾方圆.基于Unet和SVM耦合的遥感影像地物分类优化改进研究[J].新一代信息技术,2023,6(18):7-12.
2岑逸翔,孙绍哲,谢玮松,刘杨,杨晓琴.一种基于生成对抗网络的电波传播数据增强方法[J].电声技术,2023,47(2):134-137.
3王海荣,李伟波,万权,鄢华,向锐.审计调查中人脸识别算法的研究与应用[J].电脑知识与技术,2021,17(10):12-18. 被引量：1
4徐敏锐,李云,卢树峰,窦晓波,陈刚,郭家豪.基于D-S证据组合规则的双模型融合局部放电模式识别方法[J].电力自动化设备,2021,41(11):153-159. 被引量：10
5马国祥,严传波,张志豪,森干.基于数据增强的CT图像病灶检测方法[J].计算机系统应用,2021,30(10):187-194. 被引量：2
6张美晨,赵丽娟,王雅东.基于CPS感知分析的煤岩截割状态识别系统[J].煤炭学报,2021,46(12):4071-4087. 被引量：9
7王端生,管一弘,杨雄飞,崔云月,罗亚桃,黄岗.一种基于多神经网络的烟支缺陷分类与定位方法[J].软件导刊,2022,21(2):184-188. 被引量：4
8黄方亮,许欢庆,沈同平,金力,俞磊.结合残差神经网络和语音诊断的帕金森病识别研究[J].齐鲁工业大学学报,2022,36(1):36-43.
9李宝琴,吴俊勇,强子玥,覃柳芸,郝亮亮.基于改进DCGAN的电力系统暂态稳定增强型自适应评估[J].电力系统自动化,2022,46(2):73-82. 被引量：24
10郭伟,庞晨.改进生成式对抗网络的图像数据集增强算法[J].电讯技术,2022,62(3):281-287. 被引量：5

1董春林.两种唱名法与钢琴即兴伴奏教学尝试[J].北方音乐,2019,39(15):213-214.
2许文杰,束红.基于MOOC平台的学习监督系统设计与研究[J].电脑知识与技术,2019,15(8):99-100.
3马金成,常辉.在铍铜板带生产系统中实现多分卷数据的提取[J].电脑编程技巧与维护,2019(9):118-120.
4卓嘎,次仁尼玛.基于Matlab的藏语语音频谱仿真和分析[J].电子设计工程,2019,27(19):170-173. 被引量：2
5刘建,黄娇洁.一种算法对于深层神经网络训练速度的提升[J].电脑知识与技术,2019,15(8X):207-209. 被引量：1
6侯丽敏,刘焕成,施晓宇,张新鹏.基于人工神经网络的鼾声相关信号的分类[J].复旦学报（自然科学版）,2019,58(4):530-536. 被引量：3
7曾洪根.寻找差异解决盈亏[J].数学小灵通（烧脑版）（中高年级）,2019(7):14-15. 被引量：1
8鲁娟,张振坤,廖小平,马俊燕.切削加工表面粗糙度组合预测模型研究[J].机械科学与技术,2019,38(9):1451-1456. 被引量：7
9侯代文,张虹,邓磊明.基于ZOOM-FFT的雷靶监测信号处理方法[J].电子设计工程,2019,27(17):38-42. 被引量：1
10苏鹏.电气自动化在工业机械控制中的应用探讨[J].内燃机与配件,2019(17):219-220. 被引量：8

小型微型计算机系统

2019年第9期

浏览历史

内容加载中请稍等...

HR-DCGAN方法的帕金森声纹样本扩充及识别研究被引量：9

参考文献1

二级参考文献7

共引文献9

同被引文献58

引证文献9

二级引证文献42

相关作者

相关机构

相关主题

浏览历史

HR-DCGAN方法的帕金森声纹样本扩充及识别研究 被引量：9

参考文献1

二级参考文献7

共引文献9

同被引文献58

引证文献9

二级引证文献42

相关作者

相关机构

相关主题

浏览历史

HR-DCGAN方法的帕金森声纹样本扩充及识别研究被引量：9