基于余弦相似度的动态语音特征提取算法被引量：9

A hierarchical clustering approach for speech feature extraction based on cosine similarity

下载PDF

导出

摘要为进一步研究语音特征提取方法,分析了基于逆离散余弦变换倒谱系数(IDCT CC)的语音特征,利用频域语音信号间的余弦相似度(cosine similarity)特性将IDCT CC进行层次聚类,得到14维频域语音特征向量(feature vector),称之为C-vector。实验中,建立基于高斯混合模型(Gaussian mixture model,GMM)的说话人识别模型对C-vector进行识别精度和时间的讨论,并与经典的梅尔频率倒谱系数和等频域倒谱系数(histogram of DCT cepstrum coefficients,HDCC)进行对比实验。通过具体的实验结果比较,提出的C-vector在识别精度方面比MFCC和HDCC分别高出7%和5%。而且,C-vector在多人语音集下表现出的识别能力更为优异。

作者艾佳琪左毅刘君霞贺培超李铁山陈俊龙 Ai Jiaqi;Zuo Yi;Liu Junxia

机构地区大连海事大学航海学院

出处《计算机应用研究》 CSCD 北大核心 2020年第S02期147-149,共3页 Application Research of Computers

基金国家自然科学基金资助项目(61751202,61751205,U1813203,61803064,71831002,51939001,61976033) 辽宁省兴辽英才计划项目(XLYC1807046,XLYC1908018) 大连市科技创新基金资助项目(2018J11CY022) 辽宁省自然科学基金资助项目(3132019501,3132019502) 中央高校基本科研业务费资助项目(3132019345)

关键词说话人识别语音特征梅尔频率倒谱系数(Mel-frequency cepstral coefficients MFCC) 逆离散余弦变换倒谱系数(inrerse discrete cosine tromsform cepstrwm coefficient IDCT CC) 余弦相似度层次聚类分析

分类号 TN912.3 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献12

1吴献超,刘莎,侯晓荣,景海斌.掌纹识别的一种新的特征提取方法[J].计算机应用研究,2009,26(7):2777-2779. 被引量：1
2田启川,张润生.生物特征识别综述[J].计算机应用研究,2009,26(12):4401-4406. 被引量：36
3岳喜才,叶大田.文本无关的说话人识别:综述[J].模式识别与人工智能,2001,14(2):194-200. 被引量：8
4余玲飞,刘强.基于深度循环网络的声纹识别方法研究及应用[J].计算机应用研究,2019,36(1):153-158. 被引量：27
5周萍,沈昊,郑凯鹏.基于MFCC与GFCC混合特征参数的说话人识别[J].应用科学学报,2019,37(1):24-32. 被引量：42
6JIANG Wenbin,LIU Peilin,WEN Fei.Speech Magnitude Spectrum Reconstruction from MFCCs Using Deep Neural Network[J].Chinese Journal of Electronics,2018,27(2):393-398. 被引量：9
7罗海涛.语音信号的前期处理[J].福建电脑,2018,34(5):91-92. 被引量：6
8张震,王化清.语音信号特征提取中Mel倒谱系MFCC的改进算法[J].计算机工程与应用,2008,44(22):54-55. 被引量：29
9周春晖,卢荣,潘姿蓉.说话人识别特征参数MFCC的提取与分析[J].电子技术与软件工程,2016(22):90-90. 被引量：4
10谷重阳,徐浩煜,周晗,张俊杰.基于词汇语义信息的文本相似度计算[J].计算机应用研究,2018,35(2):391-395. 被引量：27

二级参考文献95

1王伟,邓辉文.基于MFCC参数和VQ的说话人识别系统[J].仪器仪表学报,2006,27(z3):2253-2255. 被引量：30
2孙冬梅,裘正定.生物特征识别技术综述[J].电子学报,2001,29(z1):1744-1748. 被引量：142
3郭铭,陈云凤.自动发音人识别中测试文本选择的研究[J].声学学报,1993,18(2):148-153. 被引量：3
4韦岗,陆以勤,欧阳景正.混沌、分形理论与语音信号处理[J].电子学报,1996,24(1):34-39. 被引量：33
5卢官明,李海波,刘莉.生物特征识别综述[J].南京邮电大学学报（自然科学版）,2007,27(1):81-88. 被引量：32
6林琳,王树勋,郭纲.短语音说话人识别新方法的研究[J].系统仿真学报,2007,19(10):2272-2275. 被引量：10
7汪加才,张金城,江效尧.一种有效的可视化孤立点发现与预测新途径[J].计算机科学,2007,34(6):200-203. 被引量：5
8王科俊,侯本博.步态识别综述[J].中国图象图形学报,2007,12(7):1152-1160. 被引量：43
9张雄伟,陈亮,杨吉斌.现代语音技术及应用[M].北京:机械工业出版社.2003.
10Fakhr W,Salam A A,Hamdy N.Enhancement of mismatched conditions in speaker recognition for multimedia applications [J].IEEE International Conference on Acoustics,Speech,and Signal Processing, 2004.

共引文献184

1刘河庆,梁玉成.政策内容再生产的影响机制——基于涉农政策文本的研究[J].社会学研究,2021(1):115-136. 被引量：37
2崔琳,王芷悦.基于LFBank与FBank混合特征的声纹识别研究[J].计算机科学,2022,49(S02):621-625. 被引量：2
3王大巍.基于Windows CE的语音口令识别系统的设计[J].电子技术（上海）,2010(11):40-41.
4毛大伟,曹华,木拉提.哈米提,童勤业.基于美尔倒谱系数和复杂性的说话人识别[J].生物医学工程学杂志,2006,23(4):882-886. 被引量：2
5李健,戴天虹.说话人识别特征提取中改进算法的研究[J].森林工程,2009,25(2):38-40. 被引量：3
6周燕.遗传算法与BP神经网络相结合的说话人识别系统[J].传感器与微系统,2009,28(6):98-100. 被引量：7
7李建文,张晋平.基于改进语音特征提取方法的语音识别[J].微电子学与计算机,2009,26(7):230-233. 被引量：8
8唐建,何劲松.模糊相关性文本无关矢量量化说话人辨认研究[J].系统仿真学报,2009,21(14):4351-4355.
9于晓明,柏松.基于前向-后向HMM的连续语音识别系统的研究[J].计算机工程与设计,2009,30(18):4339-4341. 被引量：5
10袁正午,肖旺辉.改进的混合MFCC语音识别算法研究[J].计算机工程与应用,2009,45(33):108-110. 被引量：18

同被引文献85

1何惠.中国水文站网[J].水科学进展,2010,21(4):460-465. 被引量：23
2门宝辉,梁川.基于变异系数权重的水质评价属性识别模型[J].哈尔滨工业大学学报,2005,37(10):1373-1375. 被引量：75
3郭兴吉,范秉琪.基于特征的音频比对技术[J].河南师范大学学报（自然科学版）,2006,34(2):35-38. 被引量：15
4丰月姣,贺兴时.二阶隐马尔科夫模型的原理与实现[J].价值工程,2009,28(12):103-105. 被引量：6
5徐宗学,程磊.分布式水文模型研究与应用进展[J].水利学报,2010,40(9):1009-1017. 被引量：146
6邓瑞,肖纯智,高勇.基于MFCC相似度和谱熵的端点检测算法[J].现代电子技术,2013,36(21):67-69. 被引量：6
7刘金涛,宋慧卿,王爱花.水文相似概念与理论发展探析[J].水科学进展,2014,25(2):288-296. 被引量：29
8李珂,秦毅,李子文,房晶.秦岭北麓部分区域的水文相似性初步分区[J].水资源与水工程学报,2014,25(2):184-187. 被引量：5
9吴碧琼,周理,黎小东,张洪波,王小霞.基于BTOPMC的无资料区水文模拟及相似性分析[J].人民长江,2015,46(4):21-25. 被引量：7
10庄严,于凤芹.结合节拍语义和MFCC声学特征的音乐流派分类[J].计算机工程与应用,2015,51(3):197-201. 被引量：7

引证文献9

1崔琳,王芷悦.基于LFBank与FBank混合特征的声纹识别研究[J].计算机科学,2022,49(S02):621-625. 被引量：2
2任思潜,吴娟.RF航段自动路径规划研究[J].现代计算机,2021,27(24):89-92.
3梅家俊,王卫民,戴兴雨.基于二阶隐马尔可夫模型的连续手语识别[J].计算机系统应用,2022,31(4):375-380. 被引量：1
4屈晓渊,崔青.基于梅尔频率倒谱系数的音频分类研究[J].电子设计工程,2022,30(9):82-87. 被引量：7
5汤春球,陈琳,刘天福.基于STM32的振动故障监测系统设计[J].自动化与仪表,2022,37(5):59-62.
6唐维康,邵玉斌,龙华,杜庆治,彭艺,陈亮.基于谱峰值点特征的汉语音节匹配算法[J].激光与光电子学进展,2022,59(7):121-129.
7战王雷,张宁.基于GAMMATONE的音频感知哈希认证[J].网络安全技术与应用,2022(11):33-35.
8张帅,黄领梅,张高锋.基于不同相似度方法的秦岭北麓典型流域相似度研究[J].水资源与水工程学报,2023,34(6):10-15.
9相增辉,张国梁,庞渊源,陈鑫,王鑫.基于深度卷积神经网络的智能机器人语音自动识别方法[J].自动化技术与应用,2024,43(4):43-46.

二级引证文献10

1赵扬青,彭智才,蒋雨涵,陈佳瑜,陈子怡,赵舒悦.音频的梅尔频率倒谱系数特征抽取过程[J].信息技术与信息化,2023(1):104-111. 被引量：2
2汪晟磊,宋星,杨彦青.智能家居语音控制系统的设计[J].自动化与仪器仪表,2023(4):117-122. 被引量：2
3文丽萍.噪声环境下基于小波变换的普通话智能测试系统设计[J].自动化与仪器仪表,2023(5):153-157.
4赵乾坤,刘峰,梁秀兵,汪涛,宋永强.基于时延神经网络模型的舰船辐射噪声目标识别[J].应用声学,2023,42(5):1033-1041.
5杨治学,李芳,孙杰.基于改进MFCC和GMM的语音性别识别分析[J].电子技术（上海）,2023,52(8):42-45.
6崔丽霞,许利显.基于Bi LSTM-CTC的语音识别系统研究[J].自动化与仪器仪表,2023(10):90-94.
7戴雯菊,金宇,黄宇.基于小波神经网络的调度人员带噪声纹识别方法[J].信息与电脑,2023,35(19):152-154.
8张晋宁.基于神经网络的视觉语音识别系统[J].电声技术,2023,47(11):101-104.
9陶雨昂.MFCC特征训练技术在声纹识别中的应用[J].集成电路应用,2024,41(2):386-387.
10Xianwei Jiang,Yanqiong Zhang,Juan Lei,Yudong Zhang.A Survey on Chinese Sign Language Recognition:From Traditional Methods to Artificial Intelligence[J].Computer Modeling in Engineering & Sciences,2024,140(7):1-40.

1谢跃,包永强.面向语音情感识别的改进长短时记忆网络研究[J].南京工程学院学报（自然科学版）,2020,18(3):32-36. 被引量：1
2杨惠贤,贾琪.政府补贴、资本结构与新能源企业价值——基于动态面板模型的研究[J].西安石油大学学报（社会科学版）,2021,30(1):16-24. 被引量：3
3毛文青,管业鹏.基于LPBMFCC的文本无关说话人识别[J].电子测量技术,2020,43(19):169-176.
4靳华中,徐雨东,李晴晴,李文萱.一种新的引入MFCC的语音去噪模型[J].湖北工业大学学报,2021,36(1):57-60. 被引量：1
5夏向玲,雷磊,沈丹凤.基于深度卷积神经网络的异常心音识别算法[J].中国数字医学,2020,15(12):71-74.
6杨雪祎.基于GMM的导游服务语音评分算法研究[J].科技风,2021(5):69-70. 被引量：1
7孙佳雷,孔军.基于粒子群优化的图像分割方法[J].信息技术与信息化,2021(1):149-151.
8闫宏宸,肖熙.概率线性判别分析在语音命令词置信度判决中的应用[J].计算机系统应用,2021,30(1):54-62. 被引量：1
9曹富奎,白天,许晓珑.基于公路监控视频的车辆检测和分类[J].计算机系统应用,2020,29(10):267-273. 被引量：5
10赵同领,赵劲民,曽琪烽,王中海,庞军.我国医疗卫生机构收入对支出的影响研究——基于动态面板数据回归模型的实证分析[J].卫生软科学,2021,35(2):55-58.

计算机应用研究

2020年第S02期

浏览历史

内容加载中请稍等...

基于余弦相似度的动态语音特征提取算法被引量：9

参考文献12

二级参考文献95

共引文献184

同被引文献85

引证文献9

二级引证文献10

相关作者

相关机构

相关主题

浏览历史

基于余弦相似度的动态语音特征提取算法 被引量：9

参考文献12

二级参考文献95

共引文献184

同被引文献85

引证文献9

二级引证文献10

相关作者

相关机构

相关主题

浏览历史

基于余弦相似度的动态语音特征提取算法被引量：9