低信噪比环境下基于PR的音频分割

Composed Speech and Music Sound Separation Based on PR under Low SNR

下载PDF

导出

摘要针对当前不同的非白噪声背景研究很少,根据噪音、语音和音乐的性质并且结合统计学理论,提出一种在不同噪声背景下低信噪比的语音/音乐分割算法。以往的检测算法很少考虑低信噪比的环境,首先从音频数据中提取新的特征参数概率密度比(probability density ratio,PR)和概率密度比过零率(probability density ratio crossing rate,PRCR),特征参数在低信噪比环境下亦能明显表征语音和音乐的不同特性,然后根据音频的特性对PRCR进行修正,再基于此修正的特征参数对语音和音乐进行改变点检测,最后得到分割结果。实验结果显示,在信噪比达到5dB时分割点准确率达到85%以上,具有良好的鲁棒性。 In this paper, a detection algorithm for composed speech and music sound under low SNR noisy environment was adopted. Nevertheless, most of the algorithms proposed before did not consider the audio signals under a low SNR noisy environment, especially under different noise which is not white noise. The algorithm, which is based on the character among noisy, speech and music and combined with the statistical theory, firstly extracted the new characteristic parameters of probability density ratio （PR） and probability density ratio crossing rate （PRCR） from the audio, which can attribute the difference between speech and music even in low SNR, and then modified the PRCR according the property of audio, detected the change - points of speech and music based on these characteristic parameters, eventually the segmentation can be showed from the change - points. The experimental result revealed that the rate of accurate can reach to more than 85% when the SNR equals to 5dB, which shows the advantages of robust.

作者李昌莲余小清许雪琼万旺根

机构地区上海大学通信与信息工程学院

出处《计算机仿真》 CSCD 北大核心 2010年第6期354-357,共4页 Computer Simulation

基金国家自然科学基金项目(60872115) 上海市科委国际合作项目(075107035) 上海市教委电路与系统重点学科(J50104)

关键词低信噪比概率密度比概率密度比过零率 Low SNR noisy environment Probability density ratio （PR） Probability density ratio crossing rate（PRCR）

分类号 TN912.3 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献9

1杜军.基于模板的音频检索方法研究[J].山东师范大学学报（自然科学版）,2008,23(2):139-140. 被引量：2
2张一彬,周杰,边肇祺,张大鹏.一种新的基于分类的音频流分割方法[J].电子学报,2006,34(4):612-617. 被引量：10
3J Foote. Automatic audio segmentation using a measure of audio novelty[C], in proc, ICME, 2000 - 1.
4倪宁,卢刚,卜佳俊.基于音频分析的视频场景检测[J].计算机仿真,2006,23(8):184-187. 被引量：3
5魏宇虹,韩纪庆,张磊.一种基于HMM模型的音频场景分析技术[J].计算机工程与应用,2003,39(20):85-86. 被引量：2
6Cheng Shih - Sian, Wang Hsin - Min, Fu Hsin - Chia. BIC - based audio segmentation by divide - and - conquer, ICASSP. 2008. 4841 - 4844.
7He Xin, Zhou Xian - Zhong. Audio classification by hybrid support vector machine / hidden Markov model, World Joumal of Modelling and Simulation, ISSN 1746 - 7233,2005,1 : 56 - 59.
8Jiang Hao, Lin Tony, Zhang Hong- jiang. Video segmentation with the support of audio segmentation and classification [ C ]. In : Proceedings of the IEEE International Conference on Multimedia and Expo (ICME 2000), Vol3. NY: IEEE, 2000. 1507 -1510.
9S Cheng, H Wang. METRIC - SEQDAC : A Hybrid Approach for Audio Segmentation[ C]. ICSLP, 2004.

二级参考文献29

1杨晓娟,孟祥增.Web图像搜索系统设计[J].山东师范大学学报（自然科学版）,2007,22(1):71-72. 被引量：3
2李桂芳,刘培玉.一种基于改进遗传算法的文本特征选择方法[J].山东师范大学学报（自然科学版）,2007,22(2):17-19. 被引量：4
3贾磊徐波.基于检测熵变化趋势的音频特征跳变点检测[A]..第6届全国人机语言通讯学术会议[C].,2001.19～24.
4J Saunder.Real-time discriminative of broadcast speech/music[C].In: Proceedings of ICASSP96,1996:993-996.
5E Scheirer,M Slaney.Construction and evaluation of a robust multifeature speech/music discriminator[C].In :Proceedings of ICASSP97, 1997 : 1331-1334.
6Z Liu,J Huang,Y Wang.Audio feature extraction and analysis for scene classification[C].In:Proceedings of IEEE 1st Multimedia Work shop, 1997 : 343-348.
7Darryl Godsmark,Guy J Brown.A blackboard architecture for computational auditory scene analysis[J].Speech Communication,1999;27: 351-366.
8T Zhang,C Kuo.Audio content analysis for online audiovisual data segmentation and classification[J].IEEE Trans On Speech and Audio Processing, 2001 ; 9 (4) : 441 -457.
9Chou W, Gu L. Robust singing detection in speech/music discriminator design[ A]. In. Proc ICASSP[ C ].Salt Lake City, USA : IEEE,2001,2:865 - 868.
10Ajmera J, Mccowan I A, Bourlard H. Robust HMM-based speech/music segmentation [ A ]. In: Proc ICASSP[ C]. Orlando, USA: IEEE,2002 ,1:297 -300.

共引文献13

1王志明,周序生.基于定长窗分层检测的音频分割算法[J].中小企业管理与科技,2009(21):296-297.
2王志明,张瑞杰,李弼程.基于分层熵检测的音频分割算法[J].科学技术与工程,2009,9(17):5012-5016. 被引量：1
3王志明,周序生.基于定长窗分层检测的音频分割算法[J].计算机仿真,2009,26(9):350-354. 被引量：1
4杜军.结合ICA预处理的麦克风阵列语音增强系统[J].山东师范大学学报（自然科学版）,2009,24(1):148-149.
5王志明.一种有效的音频分割算法[J].湖南理工学院学报（自然科学版）,2009,22(3):37-40. 被引量：3
6张瑞杰,李弼程,屈丹.基于可信度变化趋势的音频分割算法[J].计算机工程,2010,36(8):177-179. 被引量：3
7蒋盛益,李霞,李碧,王连喜.音乐情感自动分析研究[J].计算机工程与设计,2010,31(18):4112-4115. 被引量：8
8芮瑞,鲍长春.基于非线性动力学的乐器分类方法[J].电子学报,2012,40(7):1481-1488. 被引量：2
9黄强,吴一波,何飞,纪震.基于衰减因子的虚拟环绕系统听音区扩大方法[J].电子学报,2012,40(11):2342-2345.
10廖伟,袁纵横.基于自适应阈值与基频检测的自发性口语音频分割算法[J].计算机应用与软件,2015,32(4):133-136.

1糜增元.基于内容的数字音频快速检索技术综述[J].中国新通信,2016,18(4):120-120.
2孙卫国,夏秀渝,乔立能,叶于林.面向音频检索的音频分割和标注研究[J].微型机与应用,2017,36(5):38-41. 被引量：5
3刘庭辉,刘舜,徐维超.基于功率谱角度的AUC变点检测算法[J].电子世界,2017,0(7):103-103.
4刘璐,夏军,尹涵春.白场和对比度对视觉感知图像清晰度的影响[J].应用科学学报,2005,23(3):278-281. 被引量：1
5罗平娟.IPv6在校园网中的应用设计[J].科技信息,2010(21).
6赖国庭,尹俊勋,喻华文.空间相关莱斯快衰落信道下的MIMO系统性能[J].华南理工大学学报（自然科学版）,2006,34(6):21-24. 被引量：3
7宣丽萍.音频跳变点的分割熵检测算法[J].黑龙江科技学院学报,2008,18(3):199-201.
8刘少辉,张陆勇,徐世辉,陈明刚.基于割点的路由缓存技术研究[J].无线电工程,2010,40(2):1-3.
9李稀敏,洪青阳,黄晓丹.基于说话人的音频分割与聚类[J].心智与计算,2010,0(2):139-147. 被引量：5
10杨东沿,赵伟,孔明明.基于端点检测的广播音频分割与分类[J].现代计算机（中旬刊）,2016(4):46-49. 被引量：3

计算机仿真

2010年第6期

浏览历史

内容加载中请稍等...

低信噪比环境下基于PR的音频分割

参考文献9

二级参考文献29

共引文献13

相关作者

相关机构

相关主题

浏览历史