为快速准确地计算时间序列数据相似度,引入快速动态时间规划距离(fast dynamic time warping,FDTW),提出了基于FDTW的模糊C均值算法和模糊C中心点聚类算法。FDTW通过对数据序列进行拉伸和压缩匹配时间序列数据,只要形状相同,即使发生时...为快速准确地计算时间序列数据相似度,引入快速动态时间规划距离(fast dynamic time warping,FDTW),提出了基于FDTW的模糊C均值算法和模糊C中心点聚类算法。FDTW通过对数据序列进行拉伸和压缩匹配时间序列数据,只要形状相同,即使发生时间位移也可以准确识别,同时解决了传统DTW计算效率较低的问题。试验结果表明,提出的算法仍能保证聚类的精度。展开更多
针对现有基于视频整体时间结构建模的行为识别方法中,存在的时间噪声信息和歧义信息干扰现象,从而引起行为类别识别错误的问题,提出一种新型的Grenander推理优化下时间图模型(temporal graph model with Grenander inference,TGM-GI).首...针对现有基于视频整体时间结构建模的行为识别方法中,存在的时间噪声信息和歧义信息干扰现象,从而引起行为类别识别错误的问题,提出一种新型的Grenander推理优化下时间图模型(temporal graph model with Grenander inference,TGM-GI).首先,构建3D CNN-LSTM模块,其中3D CNN用于行为的动态特征提取,LSTM模块用于该特征的时间依赖关系优化.其次,在深度模块基础上,利用Grenander理论构建了行为识别的时间图模型,并设计了两个模块分别处理慢行为时间冗余和异常行为干扰问题,实现了时间噪声抑制下的时间结构提议.随后,设计融合特征约束和语义约束的Grenander测度,并提出一种时序增量形式的Viterbi算法,修正了行为时间模式中的歧义信息.最后,采用基于动态时间规划的模式匹配方法,完成了基于时间模式的行为识别任务.在UCF101和Olympic Sports两个公认数据集上,与现有多种基于深度学习的行为识别方法进行比较,该方法获得了最好的行为识别正确率.该方法优于基准的3D CNN-LSTM方法,在UCF101数据集上识别精度提高6.41%,在Olympic Sports数据集上识别精度提高5.67%.展开更多
提出了一个在噪声环境下高效的语音识别系统。针对端点检测,提出了基于平滑函数的检测方法,从而提高了利用短时能量算法的检测精度。运行频谱滤波器方法在能量频谱和对数频谱用了两次带通滤波器减少噪声,在对数频谱内用倒谱均值相减的...提出了一个在噪声环境下高效的语音识别系统。针对端点检测,提出了基于平滑函数的检测方法,从而提高了利用短时能量算法的检测精度。运行频谱滤波器方法在能量频谱和对数频谱用了两次带通滤波器减少噪声,在对数频谱内用倒谱均值相减的方法去除卷积噪声,从而减少了计算量。对于普通DTW(Dynamic Time Warpin)算法得到某个测试语音与该语音所有的参考语音相似值,应用一个非线性中值滤波器取中间某个值的方法来进行识别,从而提高了DTW算法的识别精度。利用少量参考语音,实现了高于HMM的识别精度同时又减少了训练的花费时间。展开更多
文摘为快速准确地计算时间序列数据相似度,引入快速动态时间规划距离(fast dynamic time warping,FDTW),提出了基于FDTW的模糊C均值算法和模糊C中心点聚类算法。FDTW通过对数据序列进行拉伸和压缩匹配时间序列数据,只要形状相同,即使发生时间位移也可以准确识别,同时解决了传统DTW计算效率较低的问题。试验结果表明,提出的算法仍能保证聚类的精度。
文摘提出了一个在噪声环境下高效的语音识别系统。针对端点检测,提出了基于平滑函数的检测方法,从而提高了利用短时能量算法的检测精度。运行频谱滤波器方法在能量频谱和对数频谱用了两次带通滤波器减少噪声,在对数频谱内用倒谱均值相减的方法去除卷积噪声,从而减少了计算量。对于普通DTW(Dynamic Time Warpin)算法得到某个测试语音与该语音所有的参考语音相似值,应用一个非线性中值滤波器取中间某个值的方法来进行识别,从而提高了DTW算法的识别精度。利用少量参考语音,实现了高于HMM的识别精度同时又减少了训练的花费时间。