-
题名基于时空稀疏编码的动态人脸识别
被引量:1
- 1
-
-
作者
陈亚楠
王士林
赖骏尧
-
机构
上海交通大学信息安全工程学院
-
出处
《通信技术》
2017年第3期444-449,共6页
-
文摘
随着视频监控在生活中的普及及身份认证在安防领域的发展需求,基于动态视频序列的人脸识别需求越来越大。分析现有的主流人脸识别算法的特点,结合推广到三维立体空间的稀疏编码,提出了一种改进的人脸序列特征提取方法。该算法通过滑窗的方法将视频序列切分成固长的若干子序列,将每个子序列看成一个三维立方像素块,并将该立方块可重叠地切分成若干标准大小的小块,用K-SVD算法制作字典,求得稀疏系数作为特征。鉴于稀疏编码特征维度太高,用Pooling池化按照多种层次来整合特征,获得最终使用的特征矩阵。该特征鉴别力较高,使用传统的SVM分类器即可取得state-of-the-art的结果。实验表明,在包含40个人的数据集上,以总样本的10%作为训练集时,可获得95.6%的平均正确率。
-
关键词
动态人脸识别
时空稀疏编码
多层次池化
支持向量机
-
Keywords
dynamic face recognition
spatiotemporal sparse coding
hierarchical pooling
support vector machine
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-
-
题名一种基于SOM与脉冲神经网络的音频识别方法
- 2
-
-
作者
隆二红
王刚
莫凌飞
-
机构
东南大学仪器科学与工程学院
-
出处
《传感技术学报》
CAS
2024年第11期1885-1892,共8页
-
基金
2021江苏省高校“青蓝工程”优秀青年骨干教师计划项目。
-
文摘
近年来,在人工神经网络技术的推动下,音频分类技术不断提高。然而,传统人工神经网络存在计算功耗大、时域信号处理困难等问题。脉冲神经网络由于其事件驱动的特性,有着低功耗、可解释、时域处理能力强等特点,非常适用于音频信号处理任务。提出一种基于SOM时空特征稀疏编码和SNN有监督分类的音频识别方法,利用MFCC进行时-频域转换后,再利用SOM实现对时间序列音频信号的稀疏编码,不同于其他基于误差反向传播的有监督学习,利用带积分的STDP学习规则训练权重,并且通过使用兴奋抑制双监督训练方法,可以使得SNN有效提取和分析音频信号中的空间特征与时间特征,最终所提方法在TIDIGITS数字音频数据集上取得了96.47%的分类准确度。
-
关键词
脉冲神经网络
音频识别
SOM时空特征稀疏编码
兴奋抑制双监督训练
低功耗
-
Keywords
spiking neural network
audio recognition
SOM spatio-temporal feature sparce coding
excitation-inhibition dual supervised training
low power consumption
-
分类号
TP389.1
[自动化与计算机技术—计算机系统结构]
-