期刊文献+
共找到12篇文章
< 1 >
每页显示 20 50 100
基于分类距离分数的自适应多模态生物特征融合 被引量:7
1
作者 张露 王华彬 +1 位作者 陶亮 周健 《计算机研究与发展》 EI CSCD 北大核心 2018年第1期151-162,共12页
匹配分数是传统的融合分数指标,但是其不能很好地区分类内和类间数据,分类置信度虽然可以较好地将类内类间数据分开,但对于匹配分数仅次于分类阈值的数据,其分类效果不是很理想.因此,首先提出了一种基于分类距离分数的融合分数指标,其... 匹配分数是传统的融合分数指标,但是其不能很好地区分类内和类间数据,分类置信度虽然可以较好地将类内类间数据分开,但对于匹配分数仅次于分类阈值的数据,其分类效果不是很理想.因此,首先提出了一种基于分类距离分数的融合分数指标,其不仅携带一级分类信息,也含有匹配分数与分类阈值之间的距离信息,可增大融合后类内类间分数之间的距离,为融合算法提供了一个具有有效判别信息的特征融合集,提高了融合指标的利用率;进一步,利用信息熵表示信息价值多少的这一特性,定义特征关联系数和特征权重系数,并将加权融合和传统SUM规则统一在一个自适应算法框架中,提高了融合识别率.实验结果验证了所提出方法的有效性. 展开更多
关键词 多模态识别技术 特征融合 分类距离分数 信息熵 自适应融合
下载PDF
基于快速卷积神经网络的图像去模糊 被引量:10
2
作者 任静静 方贤勇 +2 位作者 陈尚文 汪粼波 周健 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2017年第8期1444-1456,共13页
针对基于深度学习的图像去模糊方法无法有效地保留高频纹理信息,易产生振铃效应,且时间复杂度较高的问题,提出基于卷积神经网络(CNN)的图像去模糊方法.该方法设计了一种高频信号保持且可快速去模糊的快速CNN模型(FCNN).在此基础上,首先... 针对基于深度学习的图像去模糊方法无法有效地保留高频纹理信息,易产生振铃效应,且时间复杂度较高的问题,提出基于卷积神经网络(CNN)的图像去模糊方法.该方法设计了一种高频信号保持且可快速去模糊的快速CNN模型(FCNN).在此基础上,首先对高频图像进行傅里叶域上的预处理,通过实施傅里叶域去模糊的预处理得到一个初始的清晰图像;然后将该初始图像小块作为输入,相应的真实清晰图像小块作为标签训练FCNN,得到从模糊图像到潜在清晰图像的映射函数,实现基于该训练网络的去模糊.定性和定量实验结果表明,文中方法利用CNN参数共享的特点,减少了网络训练过程中大量的学习参数;相对前人基于深度学习的去模糊方法,该方法对模糊图像在保持图像纹理细节恢复的同时使计算复杂度得到显著降低. 展开更多
关键词 图像去模糊 高频纹理信息 傅里叶域 卷积神经网络
下载PDF
采用L1/2稀疏约束的梅尔倒谱系数语音重建方法 被引量:5
3
作者 周健 刘荣敏 +2 位作者 窦云峰 路成 陶亮 《声学学报》 EI CSCD 北大核心 2018年第6期991-999,共9页
提出了一种利用L1/2稀疏约束从梅尔倒谱系数重建语音时域信号方法。从梅尔倒谱系数估计语音幅度谱是一个欠定问题,现有的方法均采用幅度谱最小均方误差估计或采用L1正则化进行幅度谱的稀疏约束。相比于L1正则化模型,L1/2的稀疏约束... 提出了一种利用L1/2稀疏约束从梅尔倒谱系数重建语音时域信号方法。从梅尔倒谱系数估计语音幅度谱是一个欠定问题,现有的方法均采用幅度谱最小均方误差估计或采用L1正则化进行幅度谱的稀疏约束。相比于L1正则化模型,L1/2的稀疏约束特性更强,为此,本文在从梅尔倒谱系数估计语音幅度谱时引入L1/2正则化约束,并利用求解的稀疏幅度谱估计相位谱,最后利用估计的频谱重建时域语音信号。实验结果表明,与幅度谱最小均方误差法相比,本文算法所估计出的语音信号具有更高的语音质量;在噪声环境下进行语音重建实验,与L1正则化幅度谱估计方法相比,本文算法重建的语音质量更好,表现出更好抗噪性。 展开更多
关键词 语音信号 稀疏约束 倒谱系数 重建方法 最小均方误差估计 谱估计方法 系数估计
下载PDF
采用低维特征映射的耳语音向正常音转换 被引量:2
4
作者 周健 窦云峰 +2 位作者 刘荣敏 王华彬 陶亮 《声学学报》 EI CSCD 北大核心 2018年第5期855-863,共9页
在将耳语音转换为正常音时,为了研究降维后语音特征对耳语音转换的影响,分别对耳语音和正常音谱包络进行自适应编码以提取耳语音和正常音的低维特征,然后使用BP网络建立耳语音和正常音低维谱包络特征之间的映射关系以及正常音基频和耳... 在将耳语音转换为正常音时,为了研究降维后语音特征对耳语音转换的影响,分别对耳语音和正常音谱包络进行自适应编码以提取耳语音和正常音的低维特征,然后使用BP网络建立耳语音和正常音低维谱包络特征之间的映射关系以及正常音基频和耳语音低维谱包络特征之间的关系。转换时,根据耳语音低维谱包络特征获得对应正常音的低维谱包络特征和基频,对低维谱包络特征进行解码后获得对应的正常音谱包络。实验结果表明,采用此方法转换后的语音与正常音之间的倒谱距离相比高斯混合模型方法下降了10%,转换后语音的自然度和可懂度都有所提高。 展开更多
关键词 特征映射 耳语音 低维 高斯混合模型 语音转换 谱包络 自适应编码 映射关系
下载PDF
采用稀疏和平滑双约束的增量正交映射非负矩阵分解目标跟踪 被引量:1
5
作者 王华彬 田猛 +2 位作者 周健 施汉琴 陶亮 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2017年第9期1658-1666,共9页
针对目标跟踪在遮挡和尺度变化等复杂背景下跟踪性能下降问题,联合稀疏约束、时间平滑约束以及增量投影非负矩阵分解,提出一种在线目标跟踪算法.首先利用非负矩阵分解学习一个基于部分表示的子空间,在此基础上添加稀疏约束提高处理遮挡... 针对目标跟踪在遮挡和尺度变化等复杂背景下跟踪性能下降问题,联合稀疏约束、时间平滑约束以及增量投影非负矩阵分解,提出一种在线目标跟踪算法.首先利用非负矩阵分解学习一个基于部分表示的子空间,在此基础上添加稀疏约束提高处理遮挡能力,添加时间平滑约束提高算法的稳定性;然后用增量方式完成子空间的在线更新,减少算法计算量、提高外观模型更新效率;最后在粒子滤波框架下,以重构误差为基础改进了观测似然函数,将具有最大后验概率的候选目标作为目标在当前帧的图像区域.实验结果表明,在各种含有遮挡和尺度变化的视频中,该算法可以更稳定地跟踪目标. 展开更多
关键词 非负矩阵分解 稀疏约束 平滑约束 局部特征 粒子滤波
下载PDF
L_(1/2)稀疏约束卷积非负矩阵分解的单通道语音增强方法 被引量:10
6
作者 路成 田猛 +2 位作者 周健 王华彬 陶亮 《声学学报》 EI CSCD 北大核心 2017年第3期377-384,共8页
为了刻画语音信号帧间相关性和使用更少的语音基表示语音特征,提出一种采用L_(1/2)稀疏约束的卷积非负矩阵分解方法进行单通道语音增强。首先,进行噪声学习得到噪声基;然后,以噪声基为先验信息结合L_(1/2)稀疏约束卷积非负矩阵分解方法... 为了刻画语音信号帧间相关性和使用更少的语音基表示语音特征,提出一种采用L_(1/2)稀疏约束的卷积非负矩阵分解方法进行单通道语音增强。首先,进行噪声学习得到噪声基;然后,以噪声基为先验信息结合L_(1/2)稀疏约束卷积非负矩阵分解方法学习含噪语音中的语音基成分;最后,利用学习到的语音基和系数重建出干净语音信号。在不同噪声环境下进行的实验结果表明,本文方法优于采用L_1稀疏约束的卷积非负矩阵方法及传统的统计语音增强方法。 展开更多
关键词 语音增强 非负矩阵分解 含噪语音 可懂度 稀疏性 正则化 语音质量 幅度谱 无监督 帧间
下载PDF
基于噪声谱约束的二值掩码估计语音增强算法 被引量:1
7
作者 叶琪 陶亮 +1 位作者 周健 王华彬 《信号处理》 CSCD 北大核心 2016年第1期70-76,共7页
提出一种基于噪声谱约束的二值掩码估计语音增强算法,用以提高低信噪比情况下的语音可懂度。首先分析了低信噪比时,先验信噪比过估对噪声谱估计函数的影响;再分别对先验信噪比和噪声谱估计函数进行修正;最后,根据修正后的噪声谱估计函... 提出一种基于噪声谱约束的二值掩码估计语音增强算法,用以提高低信噪比情况下的语音可懂度。首先分析了低信噪比时,先验信噪比过估对噪声谱估计函数的影响;再分别对先验信噪比和噪声谱估计函数进行修正;最后,根据修正后的噪声谱估计函数和先验信噪比判断出噪声谱被欠估的时频单元,估计出二值掩码值,并对相应的增强后语音时频单元进行幅度谱约束。仿真结果表明,在几种常见背景噪声的低信噪比情况下,相比于传统维纳滤波法,本文算法效果更好,能有效的提高语音可懂度。 展开更多
关键词 二值掩码 语音可懂度 先验信噪比 噪声谱估计
下载PDF
基于双L_0稀疏先验的图像运动去模糊 被引量:1
8
作者 陶宗勤 方贤勇 +1 位作者 谈业静 陈尚文 《计算机应用与软件》 CSCD 2016年第6期207-211,共5页
目前图像的运动去模糊方法在处理较复杂的运动模糊时难以得到理想的效果,其原因之一是这些方法普遍只考虑图像梯度的稀疏性,忽略了模糊核的稀疏性。针对这一不足提出一种新的双L_0正则约束的运动模糊去除方法,该方法同时对自然图像梯度... 目前图像的运动去模糊方法在处理较复杂的运动模糊时难以得到理想的效果,其原因之一是这些方法普遍只考虑图像梯度的稀疏性,忽略了模糊核的稀疏性。针对这一不足提出一种新的双L_0正则约束的运动模糊去除方法,该方法同时对自然图像梯度和模糊核使用L_0正则约束,结合半正定二次分裂最小化的方法进行求解优化,实现自然模糊图像梯度和模糊核均稀疏下的模糊核估计,并进一步使用L_(0.5)超拉普拉斯正则约束项恢复最终图像。实验发现,该方法可以较好地去除单幅图像较复杂的运动模糊,更好地克服了估计的模糊核中存在的噪点和错误,得到较现有方法更加理想去模糊效果。 展开更多
关键词 L.正则约束 运动去模糊 半正定二次分裂
下载PDF
基于图模型的姿态分割估计方法 被引量:1
9
作者 王国桢 方贤勇 《计算机技术与发展》 2016年第12期53-57,共5页
计算机视觉领域中现在有一个非常热门的问题就是人体的姿态估计,它可用于行人检测、人体活动分析、人机交互以及视频监控等方面。目前对于图像的人体姿态的估计方法在处理较复杂的背景的时候难以得到理想的效果,其原因在于这些方法不好... 计算机视觉领域中现在有一个非常热门的问题就是人体的姿态估计,它可用于行人检测、人体活动分析、人机交互以及视频监控等方面。目前对于图像的人体姿态的估计方法在处理较复杂的背景的时候难以得到理想的效果,其原因在于这些方法不好区分人体和复杂背景,从而无法得到其想要的特征值供其使用。针对这一不足,提出一种姿态分割估计方法。该方法将人体分割后去除复杂背景的影响,并且在图结构模型中,结合使用形状上下文特征的方法进行训练对比,求解得出最优的人体姿态。实验结果表明,该方法可以较好地在复杂背景下获得人体的姿态估计,更好地克服背景带来的干扰,得到较现有方法更加理想的人体估计结果,从而把人体的姿态从复杂的背景图像中给成功地估计出来。 展开更多
关键词 人体姿态 图结构模型 形状上下文 分割
下载PDF
基于联合失真控制的子空间语音增强算法
10
作者 叶琪 陶亮 +1 位作者 周健 王华彬 《声学技术》 CSCD 北大核心 2016年第3期254-259,共6页
为提高低信噪比环境下的语音可懂度,提出了一种基于联合失真控制的子空间语音增强算法。由于误差信号中的语音失真和残余噪声分量不能被同时最小化,同时,由语音估计器引起的语音放大失真超过6.02 d B时会严重损害语音可懂度。为此分别... 为提高低信噪比环境下的语音可懂度,提出了一种基于联合失真控制的子空间语音增强算法。由于误差信号中的语音失真和残余噪声分量不能被同时最小化,同时,由语音估计器引起的语音放大失真超过6.02 d B时会严重损害语音可懂度。为此分别对语音失真和残余噪声进行最小化处理,最小化时把语音放大失真控制在6.02 d B以下作为约束条件,通过求解两个约束最优化问题得到两个不同的估计器,再对这两个估计器进行加权求和,得到一种基于联合失真控制的语音估计器。实验结果表明,相比于传统的子空间增强方法,在低信噪比环境下所提出的算法能更有效提高增强后语音的可懂度。 展开更多
关键词 语音可懂度 失真控制 子空间增强
下载PDF
联合模板先验概率和稀疏表示的目标跟踪 被引量:5
11
作者 田猛 路成 +2 位作者 周健 施汉琴 陶亮 《中国图象图形学报》 CSCD 北大核心 2016年第11期1455-1463,共9页
目的虽然基于稀疏表示的目标跟踪方法表现出了良好的跟踪效果,但仍然无法彻底解决噪声、旋转、遮挡、运动模糊、光照和姿态变化等复杂背景下的目标跟踪问题。针对遮挡、旋转、姿态变化和运动模糊问题,提出一种在粒子滤波框架内,基于稀... 目的虽然基于稀疏表示的目标跟踪方法表现出了良好的跟踪效果,但仍然无法彻底解决噪声、旋转、遮挡、运动模糊、光照和姿态变化等复杂背景下的目标跟踪问题。针对遮挡、旋转、姿态变化和运动模糊问题,提出一种在粒子滤波框架内,基于稀疏表示和先验概率相结合的目标跟踪方法。方法通过先验概率衡量目标模板的重要性,并将其引入到正则化模型中,作为模板更新的主要依据,从而获得一种新的候选目标稀疏表示模型。结果在多个测试视频序列上,与多种流行算法相比,该算法可以达到更好的跟踪性能。在5个经典测试视频下的平均中心误差为6.77像素,平均跟踪成功率为97%,均优于其他算法。结论实验结果表明,在各种含有遮挡、旋转、姿态变化和运动模糊的视频中,该算法可以稳定可靠地跟踪目标,适用于视频监控复杂场景下的目标跟踪。 展开更多
关键词 目标跟踪 稀疏表示 先验概率 粒子滤波 模板更新 正则化模型
原文传递
正交投影非负矩阵的交替方向乘子分解方法 被引量:3
12
作者 王华彬 路成 +2 位作者 周健 陶亮 施汉琴 《中国图象图形学报》 CSCD 北大核心 2017年第4期463-471,共9页
目的目前非负矩阵分解一般使用乘性规则进行更新,乘性更新规则虽实现简单,但更新时收敛较慢,而且容易陷入局部最优解。当数据规模较大时,乘性规则的时效性很低,难以应用于一些实时性较强的问题中。针对乘性更新规则的这些缺点,提出一种... 目的目前非负矩阵分解一般使用乘性规则进行更新,乘性更新规则虽实现简单,但更新时收敛较慢,而且容易陷入局部最优解。当数据规模较大时,乘性规则的时效性很低,难以应用于一些实时性较强的问题中。针对乘性更新规则的这些缺点,提出一种使用交替方向乘子求解正交投影非负矩阵分解的方法。方法首先,基于正交投影非负矩阵的正交性和稀疏性特征,将原始的目标函数优化问题分解为各子问题的交替优化求解过程。通过引入辅助变量建立原目标函数的增广拉格朗日方程,完成对原问题的子问题等价表示;然后,对转换后方程的主变量和对偶变量进行交替优化求解,从而找到原问题最优解。结果不同规模矩阵分解仿真实验结果表明,与乘性更新规则相比,本文所提方法在收敛速度和精度上具有明显优势,特别是在矩阵规模很大时,收敛速度明显优于乘性规则。同时,将本文方法应用于目标跟踪问题中,提出一种基于交替方向乘子方法的模版更新策略,并与乘性规则以及其他3种经典目标跟踪算法进行比较。本文方法在目标跟踪效果上与基于乘性更新规则方法相当,且优于其他3种方法,重叠率约0.73,且帧处理速度约是乘性规则的3.8倍。结论本文方法在数据规模较大时,处理速度明显优于乘性规则。在目标跟踪应用中,因其分解过程中的稀疏性和正交性,与常用跟踪算法相比能较好地应对视频场景中的遮挡、尺度变化及光照变化等干扰,其跟踪性能更加稳定。 展开更多
关键词 正交投影非负矩阵分解 交替方向乘子法 乘性更新规则 粒子滤波 目标跟踪
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部