-
题名基于特征选择的方言辨别模型
- 1
-
-
作者
艾虎
李菲
-
机构
贵州警察学院刑事技术系
贵州师范大学外国语学院
-
出处
《信息技术》
2024年第10期102-110,119,共10页
-
基金
贵州省教育厅创新群体项目(黔教合KY字[2021]023)。
-
文摘
为了从语音样本中选择数量最少的相关特征变量,并让基于随机森林(RF)的贵州汉语方言辨别模型达到所需的精度。该研究采用基于随机森林的差异排序向后消除法(SDBE),利用Python 3.6,对贵州3个市县群的汉语方言语音样本进行特征选择,并与其他先进的特征选择方法进行比较,最后对随机森林分类模型进行改进。结果显示,该方法从39个特征变量中选取了8个最相关的梅尔频率倒谱系数(MFCC),显著优于与之比较的特征选择方法。经过改进的随机森林模型分类精确度为96.64%。该研究采用的特征选择算法和改进的随机森林模型,让方言辨别模型的性能得到显著提升。
-
关键词
汉语方言辨识
梅尔频率倒谱系数
特征选择
随机森林
向后消除法
-
Keywords
Chinese dialect identification
Mel Frequency Cepstrum Coefficient
feature selection
Random Forest
backward elimination
-
分类号
TP391.42
[自动化与计算机技术—计算机应用技术]
-