-
题名基于多示例学习的语音内容分类算法
被引量:2
- 1
-
-
作者
许薇
姚佳奇
燕继坤
欧阳喜
-
机构
信息工程大学
盲信号处理国家级重点实验室
-
出处
《信息工程大学学报》
2020年第6期674-679,共6页
-
基金
科研基金资助项目。
-
文摘
多示例学习为语音内容分类提供了一种新思路。提出将语音内容分类任务转化为多示例学习问题,首先通过音素识别器将语音转化为音素序列,其次对音素序列进行tri-phone建模并分割成多个片段,然后对片段进行特征提取,最后使用基于支持向量机和卷积神经网络的多示例学习算法对语音内容进行分类。在真实数据集上的实验结果显示,相比于非多示例学习方法,多示例学习技术的引入使平均准确率和F1值得到明显提升。
-
关键词
多示例学习
语音内容分类
音素
支持向量机
卷积神经网络
-
Keywords
multiple-instance learning
speech content classification
phoneme
support vector machine
convolutional neural network
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-
-
题名基于预训练模型的多示例语音内容分类
- 2
-
-
作者
张建宜
姚佳奇
褚衍杰
燕继坤
梁杰
-
机构
信息工程大学
盲信号处理国家级重点实验室
-
出处
《信息工程大学学报》
2022年第2期141-147,共7页
-
基金
国家自然科学基金资助项目(61272041)。
-
文摘
语音内容分类主要用于对大批量信号进行自动处理,并基于用户的兴趣选择语音文件。据此提出了一种新的分类方法,在多示例学习框架下,使用无监督语音表示学习对大规模未标记数据进行预训练,得到用于提取语音深层表示的预训练模型,提取的语音表示作为下游分类器的输入。真实语音数据集上的实验结果表明,多示例学习在处理语音分类问题上具有优势,提出的方法能够提高分类的效果,在平均准确率指标上优于3种基线方法。
-
关键词
语音内容分类
多示例学习
预训练模型
无监督语音表示学习
-
Keywords
speech content classification
multiple instance learning
pre-trained model
unsupervised speech representation learning
-
分类号
TN912.3
[电子电信—通信与信息系统]
-