语音信号多维特征参数可视化被引量：2

Visualization of Multi-dimensional Feature Parameters of Speech Signals

下载PDF

导出

摘要传统的多维可视化技术不能满足语音信号多维特征参数可视化的需求,论文研究了一种新的多维可视化方法,该方法以三维Splatting算法为基础,在其他维度上逐维展开,能较直观地显示多维特征的分布规律。说话人的MFCC特征参数是典型的多维特征参数,应用多维可视化技术分析了说话人识别中经过端点检测后识别率往往略有下降的原因,还进一步证明了统计模式识别的前提条件:训练样本与测试样本的分布要保持一致,否则会明显影响识别性能。 The traditional multi-dimensional visualization technology can not meet the requirements of multi-dimensional feature parameters visualization of speech signals.This paper studies a new multi-dimensional visualization method based on the three-dimensional Splatting algorithm,which is developed on other dimensions.It can display the distribution law of multi-dimensional features more intuitively.The speaker’s MFCC feature parameters are typical multi-dimensional feature parameters.The multi-dimensional visualization technique is used to analyze the reasons why the recognition rate is slightly decreased after endpoint detection in speaker recognition.The preconditions for statistical pattern recognition are also proved that training samples should be consistent with the test sample distribution,otherwise the recognition performance will be significantly affected.

作者江军亮张二华张丽娜 JIANG Junliang;ZHANG Erhua;ZHANG Lina(School of Computer Science and Engineering,Nanjing University of Science and Technology,Nanjing 210094)

机构地区南京理工大学计算机科学与工程学院

出处《计算机与数字工程》 2020年第7期1776-1783,共8页 Computer & Digital Engineering

基金军委装备发展部十三五装备预研领域基金项目(编号:61403120102)资助。

关键词多维可视化 SPLATTING 语音特征端点检测 multi-dimensional visualization Splatting speech feature endpoint detection

分类号 TN912.3 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献5

1张二华,高林,马仁安,杨静宇.三维地震数据可视化原理及方法[J].CT理论与应用研究（中英文）,2007,16(3):20-28. 被引量：11
2孙志刚,张加万,孙济洲.一种改进的Splatting体绘制方法[J].天津大学学报（自然科学与工程技术版）,2003,36(5):626-630. 被引量：3
3杜晓青,于凤芹.基于发声机理与人耳感知特性的说话人识别[J].计算机工程,2013,39(11):197-199. 被引量：3
4王满洪,张二华,王明合.基于双门限算法的端点检测改进研究[J].计算机与数字工程,2017,45(11):2223-2228. 被引量：10
5戚森昱,杜京霖,钱沈申,殷复莲.多维数据可视化技术研究综述[J].软件导刊,2015,14(7):15-17. 被引量：10

二级参考文献54

1陈振标,徐波.基于子带能量特征的最优化语音端点检测算法研究[J].声学学报,2005,30(2):171-176. 被引量：22
2张仁志,崔慧娟.基于短时能量的语音端点检测算法研究[J].电声技术,2005,29(7):52-54. 被引量：45
3宋枫溪,高秀梅,刘树海,杨静宇.统计模式识别中的维数削减与低损降维[J].计算机学报,2005,28(11):1915-1922. 被引量：44
4陈杰,张玲华.说话人识别中语音特征参数的研究[J].信息技术,2006,30(11):88-89. 被引量：6
5[1]Dorn G.Visualization in 3-D seismic interpretation[J].The Leading Edge,1995,14(10):1045-1049.
6[2]Geoffrey A D.Modern 3-D seismic interpretation[J].The Leading Edge,1998,17(9):1262-1269.
7[3]Andre Gerhardt,Anselmo Paiva,Ana Elisa Schmidt,et al.Requisites of 3-D seismic data volume rendering[C].GOCAD ENSG Conference,1998.
8[4]Kidd G D.Fundamentals of 3-D seismic volume visualization[J].The Leading Edge,1999,18(6):702-709.
9[6]Levoy M.Display of surfaces from volume data[J].IEEE Computer Graphics and Application,1988,8(3):29-37.
10[7]Levoy M.Volume rending by adaptive refinement[R].UNC Technical Report 88030,1988.

共引文献32

1王衡,姬红兵,高新波.基于方向重建滤波核的Splatting新算法[J].西安电子科技大学学报,2005,32(4):532-537. 被引量：4
2张娟,王昌元,鲁雯,侯庆峰,张会如.医学图像三维重建的算法研究[J].中国医学装备,2008,5(8):19-21. 被引量：7
3郭艳,韩志林,王亮亮.区域地震速度模型分析与应用系统的实现[J].计算机工程与应用,2009,45(31):69-72. 被引量：1
4徐赛花,张二华.基于CUDA的三维数据并行可视化[J].CT理论与应用研究（中英文）,2011,20(1):47-54. 被引量：7
5汪在荣,刘益和.三维地震数据体的切片播放算法[J].四川理工学院学报（自然科学版）,2011,24(4):431-435. 被引量：1
6俞洲,孟新,彭晓东.基于CUDA海量空间数据实时体绘制研究[J].计算机工程与设计,2012,33(2):688-694. 被引量：5
7甘文杰,别红霞.基于三维计算机图形库的地震数据可视化关键技术[J].网络新媒体技术,2012,1(1):34-38.
8段忠祥,李国和,臧金晓,姜芳,吴卫江,赵建辉.基于GPU的三维地震数据场体绘制方法[J].计算机应用与软件,2013,30(10):21-25. 被引量：2
9潘忠英.基于OpenGL的三维可视化方法研究[J].计算机与数字工程,2014,42(3):512-516. 被引量：11
10李国和,段忠祥,吴卫江,洪云峰,刘智渊,程远.针对全空子数据体的GPU体绘制[J].中国图象图形学报,2014,19(4):577-582. 被引量：2

同被引文献26

1陈红.基于语音可视化的大学生英语朗读语篇韵律特征研究[J].西南科技大学学报（哲学社会科学版）,2019,36(1):82-88. 被引量：1
2刘庆峰,江源,胡亚军,刘利娟.基于听感量化编码的神经网络语音合成方法研究[J].电子科技,2019,32(9):76-79. 被引量：2
3智娜,李爱军.基于可视化发音模型的语音训练研究[J].外国语,2020,43(1):59-74. 被引量：8
4肖昌明,肖涵,易灿灿.基于广义交叉阈值同步压缩小波的超声信号特征提取方法[J].机械强度,2020,42(3):523-528. 被引量：4
5司海飞,胡兴柳,史震,李仕勇.基于联合特征参数提取的非合作信号调制识别算法[J].通信学报,2020,41(7):172-185. 被引量：14
6刘永.可视化语音实验室构建研究[J].电子世界,2020(13):65-66. 被引量：1
7李丽亚,闫宏印.融合递归求逆滤波的机器人混合语音识别方法[J].计算机仿真,2020,37(8):277-280. 被引量：5
8张学津.基于Praat软件的可视化高职英语语音课堂改革[J].武汉工程职业技术学院学报,2020,32(3):79-82. 被引量：2
9韩博,韩媛媛,许允斗,郑东,姚建涛,赵永生.基于螺旋理论的四面体可展机构运动特性与动力学分析[J].机器人,2020,42(1):21-28. 被引量：10
10薛旭升,张旭辉,毛清华,郑健康,王曼.基于双目视觉的掘进机器人定位定向方法研究[J].西安科技大学学报,2020,40(5):781-789. 被引量：13

引证文献2

1王文敏,李胜辉.可视语音合成技术的3D通信关键技术研究[J].单片机与嵌入式系统应用,2021,21(11):42-46.
2金豪圣.基于VMD的智能机器人语音信号特征参数提取方法[J].电子设计工程,2023,31(22):130-133.

1翟强,程洪,黄瑞,詹慧琴,赵洋,李骏.智能汽车中人工智能算法应用及其安全综述[J].电子科技大学学报,2020,49(4):490-498. 被引量：21
2陈鹏宇.大规模城市建筑物的一种混合LOD实时绘制算法[J].现代计算机,2020,26(1):3-7. 被引量：3
3蒋正锋,黄勇萍.基于多参数融合优化的隐马尔科夫模型的设计[J].现代计算机,2020,26(18):28-32. 被引量：1
4周慧,任海平.基于卡方距离的直觉模糊相似度聚类算法[J].重庆理工大学学报（自然科学）,2020,34(8):238-246. 被引量：6
5曾歆,张雄伟,孙蒙,苗晓孔,姚琨.基于GMM模型和LPC-MFCC联合特征的声道谱转换研究[J].声学技术,2020,39(4):451-455. 被引量：8

计算机与数字工程

2020年第7期

浏览历史

内容加载中请稍等...

语音信号多维特征参数可视化被引量：2

参考文献5

二级参考文献54

共引文献32

同被引文献26

引证文献2

相关作者

相关机构

相关主题

浏览历史

语音信号多维特征参数可视化 被引量：2

参考文献5

二级参考文献54

共引文献32

同被引文献26

引证文献2

相关作者

相关机构

相关主题

浏览历史

语音信号多维特征参数可视化被引量：2