期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
基于稀疏凸非负矩阵分解的混合数据特征提取与评价研究
1
作者 周静 余超 +1 位作者 胡怡宇 杜倩倩 《江汉大学学报(自然科学版)》 2021年第3期56-63,共8页
针对目前缺乏对在线教学和传统课堂的混合数据融合分析,提出一种改进的凸非负矩阵分解特征提取算法,可有效提取学生学习行为数据的特征群集。根据群集特征的权值大小,依次选取多级特征指标,构建评价层、群集层、特征层3个层次上的PSR评... 针对目前缺乏对在线教学和传统课堂的混合数据融合分析,提出一种改进的凸非负矩阵分解特征提取算法,可有效提取学生学习行为数据的特征群集。根据群集特征的权值大小,依次选取多级特征指标,构建评价层、群集层、特征层3个层次上的PSR评价指标体系。依据评价指标体系采用综合加权法计算学生个体的质量评价值,对个体进行分级,分级结果与学生期末考试成绩分级分布基本一致,且符合正态分布,证明了特征提取方法及评价分级模型的有效性。 展开更多
关键词 特征网络 群集特征 稀疏化 凸非负矩阵分解 PSR评价体系 分级模型
下载PDF
基于非负矩阵分解的语音深层低维特征提取方法 被引量:4
2
作者 秦楚雄 张连海 《数据采集与处理》 CSCD 北大核心 2017年第5期921-930,共10页
作为一种基于深层神经网络提取的低维特征,瓶颈特征在连续语音识别中取得了很大的成功。然而训练瓶颈结构的深层神经网络时,瓶颈层的存在会降低网络输出层的帧准确率,进而反过来影响该特征的性能。针对这一问题,本文基于非负矩阵分解算... 作为一种基于深层神经网络提取的低维特征,瓶颈特征在连续语音识别中取得了很大的成功。然而训练瓶颈结构的深层神经网络时,瓶颈层的存在会降低网络输出层的帧准确率,进而反过来影响该特征的性能。针对这一问题,本文基于非负矩阵分解算法,提出一种利用不包含瓶颈层的深层神经网络提取低维特征的方法。该方法利用半非负矩阵分解和凸非负矩阵分解算法对隐含层权值矩阵分解得到基矩阵,将其作为新的特征层权值矩阵,然后在该层不设置偏移向量的情况下,通过数据前向传播提取新型特征。实验表明,该特征具有较为稳定的规律,且适用于不同的识别任务和网络结构。当使用训练数据充足的语料进行实验时,该特征表现出同瓶颈特征几乎相同的识别性能;而在低资源环境下,基于该特征识别系统的识别率明显优于深层神经网络混合识别系统和瓶颈特征识别系统。 展开更多
关键词 连续语音识别 深层神经网络 矩阵分解 凸非负矩阵分解 低维特征
下载PDF
基于Nystrom采样和凸NMF的偏好聚类 被引量:2
3
作者 杨美姣 刘惊雷 《计算机科学》 CSCD 北大核心 2018年第1期55-61,78,共8页
大规模的稀疏图数据在现实中大量出现,例如协同图、拉普拉斯矩阵等。非负矩阵分解(NMF)已经成为数据挖掘、信息检索和信号处理的一个非常重要的工具。随着数据量的不断增大,如何实现大规模数据的偏好聚类是一个重要的问题。采用两阶段... 大规模的稀疏图数据在现实中大量出现,例如协同图、拉普拉斯矩阵等。非负矩阵分解(NMF)已经成为数据挖掘、信息检索和信号处理的一个非常重要的工具。随着数据量的不断增大,如何实现大规模数据的偏好聚类是一个重要的问题。采用两阶段的方法来实现大规模的偏好聚类,即首先利用Nystr?m的近似采样方法,从大数据上获得数据的初始轮廓,获得部分用户-用户相似矩阵或电影-电影相似矩阵,从而可以将原始的高维空间降低到一个低维子空间;然后通过对低维相似矩阵进行凸的非负矩阵分解,从而得到聚类的中心和指示器,聚类的中心表示电影或用户的特征,指示器表示用户或电影特征的权重。该两阶段偏好聚类方法的优点是,初始数据轮廓的近似获取以及凸的非负矩阵分解,使得该方法具有较好的鲁棒性和抗噪性;另外,子空间的数据来源于真实的矩阵行列数据,使得偏好聚类结果具有良好的可解释性。采用Nystr?m方法解决了大规模的数据无法在内存中存储的问题,从而大大节省了内存,提高了运行效率。最后在含有100000条电影的数据集上进行偏好聚类,结果表明了该聚类算法的有效性。 展开更多
关键词 NYSTROM方法 矩阵分解 偏好聚类 聚类中心 聚类指示器
下载PDF
基于DNN的低资源语音识别特征提取技术 被引量:25
4
作者 秦楚雄 张连海 《自动化学报》 EI CSCD 北大核心 2017年第7期1208-1219,共12页
针对低资源训练数据条件下深层神经网络(Deep neural network,DNN)特征声学建模性能急剧下降的问题,提出两种适合于低资源语音识别的深层神经网络特征提取方法.首先基于隐含层共享训练的网络结构,借助资源较为丰富的语料实现对深层瓶颈... 针对低资源训练数据条件下深层神经网络(Deep neural network,DNN)特征声学建模性能急剧下降的问题,提出两种适合于低资源语音识别的深层神经网络特征提取方法.首先基于隐含层共享训练的网络结构,借助资源较为丰富的语料实现对深层瓶颈神经网络的辅助训练,针对BN层位于共享层的特点,引入Dropout,Maxout,Rectified linear units等技术改善多流训练样本分布不规律导致的过拟合问题,同时缩小网络参数规模、降低训练耗时;其次为了改善深层神经网络特征提取方法,提出一种基于凸非负矩阵分解(Convex-non-negative matrix factorization,CNMF)算法的低维高层特征提取技术,通过对网络的权值矩阵分解得到基矩阵作为特征层的权值矩阵,然后从该层提取一种新的低维特征.基于Vystadial 2013的1小时低资源捷克语训练语料的实验表明,在26.7小时的英语语料辅助训练下,当使用Dropout和Rectified linear units时,识别率相对基线系统提升7.0%;当使用Dropout和Maxout时,识别率相对基线系统提升了12.6%,且网络参数数量相对其他系统降低了62.7%,训练时间降低了25%.而基于矩阵分解的低维特征在单语言训练和辅助训练的两种情况下都取得了优于瓶颈特征(Bottleneck features,BNF)的识别率,且在辅助训练的情况下优于深层神经网络隐马尔科夫识别系统,提升幅度从0.8%~3.4%不等. 展开更多
关键词 低资源语音识别 深层神经网络 瓶颈特征 凸非负矩阵分解
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部