-
题名一种基于分层结构的音乐自动分类方法
被引量:7
- 1
-
-
作者
杜威
林浒
孙建伟
于波
姚恺丰
-
机构
中国科学院沈阳计算技术研究所
中国科学院大学
国家电网公司东北分部国网东北电力调控分中心
-
出处
《小型微型计算机系统》
CSCD
北大核心
2018年第5期888-892,共5页
-
文摘
音乐分类在音乐信息检索中占据重要地位,自动的音乐分类方法可以在降低花费的同时取得良好的精准度.传统的平面型音乐流派分类方法主要从全体数据集出发使用若干特征作为分类依据,导致分类效果并不太好.本文考虑了音乐文件本身的属性,结合统计学方面的特征,提出了基于分层结构的分类方法.该方法首先使用K-Means聚类方法以分析不同类别间的关系,并构造类别层次关系图,在此基础上使用支持向量机方法进行分类,通过使用不同的特征集合,保证了分类的准确率.该方法在GTZAN数据集上进行了相关实验,实验结果表明本文所提出的方法能够取得较好的分类准确率.
-
关键词
音乐流派
特征抽取
自动分类
分层结构
-
Keywords
music genre classification
feature extraction
classification automatically
hierarchical structure
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于改进能熵比的维纳滤波语音增强算法
被引量:4
- 2
-
-
作者
王帅
蒲宝明
李相泽
张笑东
姚恺丰
-
机构
中国科学院大学
中国科学院沈阳计算技术研究所
东北大学计算机科学与工程学院
国家电网公司东北分部国网东北电力调控分中心
-
出处
《计算机系统应用》
2017年第11期124-131,共8页
-
文摘
为了提高低信噪比环境下语音增强的效果、算法的鲁棒性.在基于维纳滤波算法的基础上,结合基于频域特征的语音端点检查算法,提出了一种新的语音增强算法.端点检测算法使用小波包ERB子带的谱熵和改进的频域能量的能熵比法.其中,小波包ERB子带的谱熵考虑了人耳听觉掩蔽模型和语音与噪声信号之间的频率分布之间的不同;频域能量利用了有语音帧和无语音帧的能量不同.维纳滤波算法实时采集语音数据并使用新的参数来区别无语音段和有语音段,并在无语音段平滑更新噪声谱.实验结果表明,该端点检测算法能够很好的区分有语音段和无语音段,这就使得在低信噪比的情况下语音增强效果得到了提升,同时算法的鲁棒性和实时性也得到了保障.在与其他两种算法对比中,得到了更好的语音增强效果.
-
关键词
维纳滤波
语音增强
小波包ERB子带
能熵比
人耳掩蔽模型
-
Keywords
Wiener filtering
speech enhancement
wavelet packet equivalent rectangular bandwidth sub-band
energy to entropy ratio
masking properties of human auditory
-
分类号
TN912.35
[电子电信—通信与信息系统]
-