-
题名语音数据特征聚类分析
- 1
-
-
作者
丰天韵
阮俊豪
王卓琛
-
机构
武汉邮电科学研究院
南京烽火天地通信科技有限公司
-
出处
《电子设计工程》
2024年第6期52-56,共5页
-
文摘
由于语音的复杂与多变,传统声学方法并不能很好地提取出语音的公共特征,容易受到训练数据中说话人发声特点差异的影响,造成模型的不稳定并影响其精度。针对这一问题,文章提出利用语音特征的聚类中心替代原语音特征进行BERT模型预训练的方法,通过与普通BERT模型对比在自动语音识别(Automatic Speech Recognition,ASR)下游任务的表现,证明了对语音特征进行的聚类操作在聚类中心数量合适的情况下,聚类后的BERT模型拥有更好地下游任务契合度,聚类中心数量为100的预训练模型错词率比普通预训练模型降低了2.32%。
-
关键词
预训练
BERT
特征聚类
表征学习
无监督训练
-
Keywords
pre⁃training
BERT
feature clustering
representation learning
unsupervised training
-
分类号
TN912.34
[电子电信—通信与信息系统]
-