期刊文献+
共找到29篇文章
< 1 2 >
每页显示 20 50 100
基于序列深度学习的数控机床热误差建模与预测方法 被引量:5
1
作者 杜柳青 余永维 《机床与液压》 北大核心 2020年第23期88-92,共5页
为提高数控机床热误差预测的准确性和适应性,提出一种基于序列深度学习网络的数控机床热误差建模和预测方法。提出一种基于LSTM的序列深度学习预测网络,构建包含历史序列数据的动态数据矩阵为模型输入;通过截断式训练方法降低深度预测... 为提高数控机床热误差预测的准确性和适应性,提出一种基于序列深度学习网络的数控机床热误差建模和预测方法。提出一种基于LSTM的序列深度学习预测网络,构建包含历史序列数据的动态数据矩阵为模型输入;通过截断式训练方法降低深度预测网络中每项参数更新的复杂度,利用序列深度学习网络自动提取温度时间序列的时空特征,准确表征温度序列信号与热误差之间复杂的映射关系,采用Softmax输出层对热误差进行准确预测。实验结果表明:该方法解决了传统浅层方法因未考虑历史序列数据对当前输出的影响而存在的预测精度不高、鲁棒性差等问题,将热误差预测的均方根误差降低到2.5μm以内,优于传统的SVM和BP等浅层神经网络预测方法,为数控机床热误差补偿提供了参考。 展开更多
关键词 数控机床 热误差 预测 序列深度学习 神经网络
下载PDF
基于LSTM神经网络深度序列机械钻速实时预测 被引量:2
2
作者 冯义 朱亮 +4 位作者 杨立军 李慎越 席俊卿 陈芳 纪慧 《西安石油大学学报(自然科学版)》 北大核心 2024年第1期122-128,共7页
机械钻速是钻井优化、缩短钻井周期的关键因素,传统的机械钻速预测大多是在钻井后进行钻井分析,预测效率和精度低、地层适用性不广。为了以更高效的方法预测得到高精度机械钻速,提出基于长短期记忆(LSTM)神经网络的深度序列机械钻速预... 机械钻速是钻井优化、缩短钻井周期的关键因素,传统的机械钻速预测大多是在钻井后进行钻井分析,预测效率和精度低、地层适用性不广。为了以更高效的方法预测得到高精度机械钻速,提出基于长短期记忆(LSTM)神经网络的深度序列机械钻速预测方法。采集实时钻井数据集,使用皮尔逊相关系数衡量各特征之间的相关性,筛选出井深、伽玛射线、地层密度、孔隙压力、井径、钻时、排量、钻井液密度等8个参数。构建LSTM神经网络模型,训练LSTM模型并预测ROP,对预测结果进行分析,并用决定系数(R^(2))、均方根误差(RMSE)、平均绝对百分比误差(MAPE)等指标对LSTM模型、BP模型和SVM模型性能进行对比分析。结果表明:LSTM模型其R^(2)、RMSE和MAPE的值分别为0.948、1.151和17.075,相较于BP模型和SVM模型,其R^(2)更大,RMSE和MAPE较小,说明LSTM模型预测性能更好。该方法有助于钻井工程师和决策者提前获得钻井信息,从而更好地规划钻井作业,缩短钻井周期,同时为钻井参数预测提供新的途径,能改善以往预测方法在处理复杂地层问题时效率不高、预测精度低等问题。 展开更多
关键词 机械钻速 LSTM神经网络 深度序列 实时预测 人工智能 深度学习
下载PDF
定量预测泥质岩裂缝密度的深度序列分析法 被引量:4
3
作者 赖生华 徐国盛 周文 《石油勘探与开发》 SCIE EI CAS CSCD 北大核心 2000年第3期88-90,共3页
利用深度序列分析法的基础原理建立多口井的泥质岩储集层裂缝密度模型,可使定量预测储集层裂缝密度具有更高的精度。高家涯油田实例表明,用该模型作出的解释裂缝密度与岩心裂缝密度曲线随深度的变化其趋势基本一致,且平均相对误差为1... 利用深度序列分析法的基础原理建立多口井的泥质岩储集层裂缝密度模型,可使定量预测储集层裂缝密度具有更高的精度。高家涯油田实例表明,用该模型作出的解释裂缝密度与岩心裂缝密度曲线随深度的变化其趋势基本一致,且平均相对误差为13.5%,较回归分析、BP网络模型进行裂缝预测的平均相对误差(分别为38.7%、17.9%)的精度要高。通过运用该方法反演油田工区多口井的储集层裂缝密度,看出该油田在纵向上有随时代变老、深度加深,裂缝密度呈降低趋势。即从上新统中部(N22)、上新统下部(N12)到中新统(N1),平均裂缝密度从0.78条/m、0.5条/m、降低到0.3条/m;在平面上,沿构造轴部裂缝最发育,平均裂缝密度N22、N12、N1层分别为0.58条/m、0.6条/m、0.3条/m。在实用中,通过实际资料的解释,指明了油田中、南区沿构造轴部为进一步部署钻井的有利地带。图4表2参2(李建国摘) 展开更多
关键词 定量预测 泥质岩 裂缝密度 深度序列分析 储集层
下载PDF
基于L_(2,1)范数稀疏特征选择和超法向量的深度图像序列行为识别 被引量:4
4
作者 宋相法 张延锋 郑逢斌 《计算机科学》 CSCD 北大核心 2017年第2期306-308,323,共4页
结合L_(2,1)范数稀疏特征选择和超法向量提出了一种新的深度图像序列行为识别方法。首先从深度图像序列中提取超法向量特征;然后利用L_(2,1)范数稀疏特征选择方法从超法向量特征中选择出最具判别性的稀疏特征子集作为特征表示;最后利用... 结合L_(2,1)范数稀疏特征选择和超法向量提出了一种新的深度图像序列行为识别方法。首先从深度图像序列中提取超法向量特征;然后利用L_(2,1)范数稀疏特征选择方法从超法向量特征中选择出最具判别性的稀疏特征子集作为特征表示;最后利用线性分类器Liblinear进行分类。在MSR Action3D数据库上的实验结果表明,所提方法使用2%的超法向量特征获得的识别率为94.55%,并且具有比其他方法更高的识别精度。 展开更多
关键词 行为识别 深度图像序列 超法向量 稀疏特征选择 L2 1范数
下载PDF
基于深度图序列和时空占用模式的人类行为识别研究 被引量:3
5
作者 王红梅 任晓芳 《科学技术与工程》 北大核心 2014年第24期102-107,共6页
针对人类行为识别问题,提出一种基于深度图序列和时空占用模式的行为识别方法。首先,使用深度图序列将空间和时间轴分为多个部分,从而定义一个4D网格;然后,将网格中的每个单元与占用值相关联,利用高维特征向量的所有单元占用值组成时空... 针对人类行为识别问题,提出一种基于深度图序列和时空占用模式的行为识别方法。首先,使用深度图序列将空间和时间轴分为多个部分,从而定义一个4D网格;然后,将网格中的每个单元与占用值相关联,利用高维特征向量的所有单元占用值组成时空占用模式。最后,利用基于正交级别学习的主成分分析降维获得低维特征向量,并完成最终的行为识别。在公共3D行为数据集MSR上的实验结果表明,提出的离线识别方法比现有方法所获得的识别准确度较高。 展开更多
关键词 深度序列 时空占用模式 轮廓 人类行为识别
下载PDF
一种时间一致性立体视频深度图序列估计算法 被引量:1
6
作者 段峰峰 王永滨 +1 位作者 杨丽芳 于鹏 《计算机应用研究》 CSCD 北大核心 2015年第10期3142-3146,共5页
针对双目立体视频深度图序列估计中时间不一致性而导致的闪烁问题,提出了一种基于Lucas-Kanade光流加权直方图相似性约束的算法。该算法在使用基于外极线约束的图割方法进行深度估计时,加入带有相干系数的罚函数;计算时间相邻帧颜色直... 针对双目立体视频深度图序列估计中时间不一致性而导致的闪烁问题,提出了一种基于Lucas-Kanade光流加权直方图相似性约束的算法。该算法在使用基于外极线约束的图割方法进行深度估计时,加入带有相干系数的罚函数;计算时间相邻帧颜色直方图加权和,权值由相邻帧像素相似性测度来决定,将计算值与当前帧颜色直方图作相似性比较,根据瞬时运动中当前帧像素与其相邻帧的对应邻域中的像素亮度保持一致性的关系,对比较结果进行最优化求解,确定相干系数,实现对应像素一致性匹配,从而获得时间一致性深度图序列。实验结果表明,该算法能够有效解决闪烁问题,获得较好的时间一致性深度图序列。 展开更多
关键词 时间一致性 深度序列 立体视频 Lucas-Kanade光流加权直方图
下载PDF
基于多特征的深度图像序列人体行为识别! 被引量:1
7
作者 宋相法 姚旭 《计算机技术与发展》 2018年第6期30-34,共5页
由于现有方法多采用单一特征研究深度图像序列人体行为识别,其识别性能较低。针对上述问题,提出了一种基于超法向量特征与深度运动图的梯度方向直方图特征的多特征行为识别方法。该方法首先从深度图像序列中提取两种特征:超法向量特征... 由于现有方法多采用单一特征研究深度图像序列人体行为识别,其识别性能较低。针对上述问题,提出了一种基于超法向量特征与深度运动图的梯度方向直方图特征的多特征行为识别方法。该方法首先从深度图像序列中提取两种特征:超法向量特征和深度运动图的梯度方向直方图特征,以增强特征互补性;然后利用核极限学习机分别获得两种特征的识别结果;最后对识别结果利用对数意见汇集规则进行融合得到最终识别结果。在MSR Action3D数据集上进行了测试,得到了96.3%的识别率,不但超过了基于超法向量特征方法的识别率和基于深度运动图的梯度方向直方图特征方法的识别率,而且也超过了其他方法的识别率。 展开更多
关键词 人体行为识别 深度图像序列 多特征 核极限学习机
下载PDF
基于深度序列的时空金字塔的动作识别
8
作者 邹向阳 侯云江 《计算机工程与应用》 CSCD 北大核心 2017年第19期211-215,共5页
提出一种高效的人体动作识别方法。通过帧间差分法将深度序列的三视图转化为深度运动轮廓序列(DMOS),然后利用时空金字塔对DMOS进行时间维和空间维细分,将细分后得到的空间网格的局部方向梯度直方图(HOG)进行特征融合,并使用线性SVM分... 提出一种高效的人体动作识别方法。通过帧间差分法将深度序列的三视图转化为深度运动轮廓序列(DMOS),然后利用时空金字塔对DMOS进行时间维和空间维细分,将细分后得到的空间网格的局部方向梯度直方图(HOG)进行特征融合,并使用线性SVM分类。最后采用MSR Action 3D数据集对提出的算法在不同时空金字塔参数下的识别率和处理速度进行了评估,结果表明该方法在同类算法中具有更高的识别率。 展开更多
关键词 动作识别 深度运动轮廓序列 时空金字塔 HOG特征 线性SVM分类器
下载PDF
学习者深度学习何以发生:从行为序列到行动进向 被引量:8
9
作者 李璇律 田莉 张向众 《远程教育杂志》 CSSCI 北大核心 2023年第3期84-93,共10页
随着新的全球学习格局的形成,社会变革带来了学习概念和学校组织的相应转变。21世纪学习范式转型与深度学习“发生问题”的研究吁求,从实践改革与理论发展两方面要求我们必须重审学习者深度学习。基于此,首先在对深度学习相关文献进行... 随着新的全球学习格局的形成,社会变革带来了学习概念和学校组织的相应转变。21世纪学习范式转型与深度学习“发生问题”的研究吁求,从实践改革与理论发展两方面要求我们必须重审学习者深度学习。基于此,首先在对深度学习相关文献进行分析的基础上,构建了学习者深度学习行为的课堂观察指标;其次,通过测试卷对“深度学习倾向的学习者”进行聚类识别,为选择性观察提供意义的聚焦对象;再次,基于课堂观察和滞后序列分析法,从实践层面对“课堂中深度学习如何发生”进行学习行为序列的提取与分析;最后,在分析上述研究资料的基础上,形成促进深度学习发生的行动进向:关联知识与行动问题情境的深度学习触发源点、支持身份建构的对话-协作共同体的深度学习中心逻辑以及促进自我扩展的反馈素养的深度学习中介环节,以此在研究转化的意义上回应“学习者深度学习何以发生”的现实问题。 展开更多
关键词 深度学习 发生机制 深度学习发生行为序列 滞后序列分析模型
下载PDF
基于深度序列匹配网络的短文本实体链接算法
10
作者 王亚男 任佳星 +4 位作者 庞宇航 刘琼 潘娟 刘伟 高凯强 《无线电工程》 北大核心 2023年第2期333-339,共7页
获取大量电力领域文本数据后,由于网元链路业务命名规则不统一、业务人员表述差异等问题,会造成数据存在歧义、指代不明确等现象。为解决上述问题,提出一种基于深度序列匹配网络(Deep Sequential Matching Network, DSMN)的短文本实体... 获取大量电力领域文本数据后,由于网元链路业务命名规则不统一、业务人员表述差异等问题,会造成数据存在歧义、指代不明确等现象。为解决上述问题,提出一种基于深度序列匹配网络(Deep Sequential Matching Network, DSMN)的短文本实体链接算法,综合考虑实体指代项和候选实体间的内容和结构相似性,针对多源异构知识库实现高质量的消歧,支撑有效开展面向电力通信管理台帐以及网管数据的清洗校核工作。DSMN从多粒度对词进行全方位向量化表示,将实体指代项和句子中的每个词进行序列匹配,分别将候选实体与上层匹配结果进行序列匹配,通过卷积池化层提炼重要的匹配信息,通过动态平均算法计算实体指代项和候选实体之间的相似度。实验结果表明,DSMN在多个数据集上都展示了优异的实体链接能力。 展开更多
关键词 实体链接 神经网络 深度序列匹配 实体指代项 命名实体
下载PDF
基于深度学习的稠油蒸汽驱汽窜时间预测方法
11
作者 崔传智 陆水青山 +2 位作者 吴忠维 盖平原 刘廷峰 《深圳大学学报(理工版)》 CAS CSCD 北大核心 2023年第5期622-630,共9页
实时可靠的汽窜时间预测方法可以为及时采取防治措施提供支持.结合深度学习算法以及油井自身动态数据的约束,提出一种预测稠油井汽窜时间的新方法.针对单一指标波动频繁,噪声大,以及无法准确表征汽窜时间等问题,根据油田实际注采数据,... 实时可靠的汽窜时间预测方法可以为及时采取防治措施提供支持.结合深度学习算法以及油井自身动态数据的约束,提出一种预测稠油井汽窜时间的新方法.针对单一指标波动频繁,噪声大,以及无法准确表征汽窜时间等问题,根据油田实际注采数据,以参数组合的方式构建表征蒸汽窜流通道形成时间的指标参数,并结合变异系数-G1混合交叉赋权法融合成汽窜综合判识曲线.基于标准互信息的相似性度量方法选择合适的时间序列数据作为输入特征,以相应的汽窜综合判识曲线作为输出时间序列构建学习样本.采用序列到序列深度学习框架建立汽窜时间的预测模型进行实际预测,并与传统的机器学习方法进行对比,验证模型的有效性和优越性.该方法通过数据驱动的方式模拟了注采时间序列特征与汽窜判识曲线之间的映射关系,可有效提高汽窜时间预测的效率和精度,对汽窜智能预警具有一定指导意义. 展开更多
关键词 油藏工程 稠油油藏 汽窜判识 汽窜时间预测 自然语言处理 序列序列深度学习框架
下载PDF
基于深度视频的人体行为特征表示与识别 被引量:5
12
作者 孙艳丰 张坤 胡永利 《北京工业大学学报》 CAS CSCD 北大核心 2016年第7期1001-1008,共8页
深度视频中的人体行为的识别研究主要集中在对深度视频进行特征表示上,为了获得具有判别性的特征表示,首先提出了深度视频中一种基于表面法向信息的局部二值模式(local binary pattern,LBP)算子作为初级特征,然后基于稀疏表示模型训练... 深度视频中的人体行为的识别研究主要集中在对深度视频进行特征表示上,为了获得具有判别性的特征表示,首先提出了深度视频中一种基于表面法向信息的局部二值模式(local binary pattern,LBP)算子作为初级特征,然后基于稀疏表示模型训练初级特征字典,获取初级特征的稀疏表示,最后对用自适应的时空金字塔划分的若干个子序列使用时空池化方法进行初级特征与稀疏系数的规格化,得到深度视频的高级特征,最终的特征表示实现了深度视频中的准确的人体行为识别.在公开的动作识别库MSR Action3D和手势识别库MSR Gesture3D上的实验证明了本文提出的特征表示的有效性和优越性. 展开更多
关键词 深度视频 行为识别 深度序列分割 局部二值模式算子 稀疏表示
下载PDF
2013年吉林前郭M_S5.8震群序列研究 被引量:7
13
作者 薛艳 曾宪伟 +1 位作者 刘桂萍 蔡宏雷 《中国地震》 北大核心 2015年第3期481-491,共11页
对前郭Ms5.8地震后6个月(2013年10月31日~2014年4月30日)内的地震事件进行了重新定位,并利用吉林区域地震台网提供的地震目录研究了序列活动特征。精定位结果显示,余震区呈NW走向分布,长轴约11km,短轴约6km。震源深度为5—15km... 对前郭Ms5.8地震后6个月(2013年10月31日~2014年4月30日)内的地震事件进行了重新定位,并利用吉林区域地震台网提供的地震目录研究了序列活动特征。精定位结果显示,余震区呈NW走向分布,长轴约11km,短轴约6km。震源深度为5—15km。结合区域构造特征认为,该序列可能与NW走向的通榆一长春隐伏断裂活动有关,序列具有b值较低、5级地震频次高、发震时间集中的特点。序列主要起伏活动可以分为3个时段:主震后10天,余震强度衰减不明显g此后的2次起伏活动,地震活动分别表现出平静-增强(震级爬升)一发生强震和增强(震级爬升)一平静一再增强(震级爬升)一发生强震的特点;在序列早期阶段,震级一频度无法拟合成1条直线,G—R关系在低震级段和高震级段呈现2个线性段;在Ms5.8地震前h值有变小的趋势,且接近1;而Ms5.8地震后h值明显增大;Ms5.5地震后15天序列衰减比较慢,P值为0.76;Ms5.8地震后15天序列衰减较快,P值为1.17。 展开更多
关键词 前郭震群 地震定位 地震序列 震源深度序列参数
全文增补中
基于深度特征融合的三维动态手势识别
14
作者 席志红 徐细梦 《应用科技》 CAS 2021年第1期18-24,共7页
在深度地图序列的手势识别中,针对不同的人在不同的时间或同一个人在不同的时间手势也不相同的问题,本文提出了特征加权融合和交叉主题测试法来进行基于深度地图序列的手势识别。首先,对于深度视频序列采用多级时间采样来生成含有相关... 在深度地图序列的手势识别中,针对不同的人在不同的时间或同一个人在不同的时间手势也不相同的问题,本文提出了特征加权融合和交叉主题测试法来进行基于深度地图序列的手势识别。首先,对于深度视频序列采用多级时间采样来生成含有相关手势信息的长、中和短3种不同长度的序列;其次,通过计算连续帧的绝对差提取时空信息生成深度运动图;然后,利用梯度方向直方图(histogram of oriented gradien,HOG)和局部二值模式(local binary patterns,LBP)从生成的深度运动图中提取形状和纹理特征,进行局部特征聚集描述符(vector of local aggregation descriptor,VLAD)编码;最后,采用主成分分析(principal component analysis,PCA)降维后将这两种特征进行加权融合和交叉主题测试后送到极限学习机器中进行分类识别。在公开具有挑战性的MSR Gesture 3D动态手势深度数据集上进行实验评估性能,所提的特征加权融合算法和交叉主题测试算法的识别率相较LBP和HOG算法融合的基础上分别提高0.82%和5.17%。实验结果表明,改进的方法具有更好的识别率。 展开更多
关键词 图像处理 手势识别 深度地图序列 多级时间采样 梯度方向直方图 局部二值模式 特征加权融合 交叉主题测试
下载PDF
一种基于深度图去噪与时空特征提取的动作识别方法 被引量:1
15
作者 黄晓晖 董超俊 《现代工业经济和信息化》 2017年第5期64-68,共5页
基于深度图的动作识别是近几年备受关注的研究方向,而深度图上的背景区域对前景目标带来很严重的干扰,大大降低了动作识别的性能。因此提出了一种新颖的基于深度图去噪和时空特征提取的动作识别方法,首先使用CNN方法进行图像的背景去除... 基于深度图的动作识别是近几年备受关注的研究方向,而深度图上的背景区域对前景目标带来很严重的干扰,大大降低了动作识别的性能。因此提出了一种新颖的基于深度图去噪和时空特征提取的动作识别方法,首先使用CNN方法进行图像的背景去除,再经过高斯滤波方法获得优质的前景目标,之后生成深度信息的三视图,分别对三视图进行时间金字塔与空间方格的分割,最后通过HOG提取特征和SVM分类进行动作识别。通过对大量的数据进行实验的结果表明,此方法相比较于当今优秀的算法获得了更好的效果。 展开更多
关键词 动作识别 人体分割 深度运动序列 卷积神经网络
下载PDF
一种高效的基于序列匹配的XML求解算法——SCALER+
16
作者 刘乐 冯建华 《计算机应用》 CSCD 北大核心 2008年第3期753-756,760,共5页
解决了基于序列的XML查询算法(SCALER)存在的两个问题,一是明确地对通配符*和后代轴//的支持,二是支持兄弟节点无序的模式树的查询。扩展后的算法命名为SCALER+,实验结果证明它不仅具有与SCALER一样优异的性能,而且对分支查询的求解更... 解决了基于序列的XML查询算法(SCALER)存在的两个问题,一是明确地对通配符*和后代轴//的支持,二是支持兄弟节点无序的模式树的查询。扩展后的算法命名为SCALER+,实验结果证明它不仅具有与SCALER一样优异的性能,而且对分支查询的求解更加完备。 展开更多
关键词 序列匹配 分支查询求解 唯一深度优先遍历序列
下载PDF
DMM-SIFT算子耦合SVM的深度图动作识别算法
17
作者 陈会平 蒋毅炜 《计算机工程与设计》 北大核心 2017年第12期3441-3445,共5页
针对目前深度图动作识别的低效性问题,提出基于多方向的尺度不变特征转换(scale invariant feature transform,SIFT)算子的深度图识别方法。将深度序列图依次映射到3个相互正交的平面上,累加相邻帧之间差的绝对值,得到深度运动图(depth ... 针对目前深度图动作识别的低效性问题,提出基于多方向的尺度不变特征转换(scale invariant feature transform,SIFT)算子的深度图识别方法。将深度序列图依次映射到3个相互正交的平面上,累加相邻帧之间差的绝对值,得到深度运动图(depth motion map,DMM);在DMM上提取SIFT特征,得到3个平面上的DMM后,分别计算3个平面的SIFT特征,对其进行归一化处理;引入支持向量机(support vector machine,SVM),将归一化的特征描述嵌入到SVM中,进行深度动作模型的学习与测试。实验结果表明,相对于当前常用的动作识别算法,所提动作识别技术具有更高的检测精度与更强的鲁棒性,能够更有效地提取出深度图里的动作信息。 展开更多
关键词 深度图像 动作识别 SIFT算子 支持向量机 深度序列 深度动作
下载PDF
DFSMN-T:结合强语言模型Transformer的中文语音识别 被引量:12
18
作者 胡章芳 蹇芳 +2 位作者 唐珊珊 明子平 姜博文 《计算机工程与应用》 CSCD 北大核心 2022年第9期187-194,共8页
自动语音识别系统由声学模型和语言模型两部分构成,但传统语言模型N-gram存在忽略词条语义相似性、参数过大等问题,限制了语音识别字符错误率的进一步降低。针对上述问题,提出一种新型的语音识别系统,以中文音节(拼音)作为中间字符,以... 自动语音识别系统由声学模型和语言模型两部分构成,但传统语言模型N-gram存在忽略词条语义相似性、参数过大等问题,限制了语音识别字符错误率的进一步降低。针对上述问题,提出一种新型的语音识别系统,以中文音节(拼音)作为中间字符,以深度前馈序列记忆神经网络DFSMN作为声学模型,执行语音转中文音节任务,进而将拼音转汉字理解成翻译任务,引入Transformer作为语言模型;同时提出一种减少Transformer计算复杂度的简易方法,在计算注意力权值时引入Hadamard矩阵进行滤波,对低于阈值的参数进行丢弃,使得模型解码速度更快。在Aishell-1、Thchs30等数据集上的实验表明,相较于DFSMN结合3-gram模型,基于DFSMN和改进Transformer的语音识别系统在最优模型上的字符错误率相对下降了3.2%,达到了11.8%的字符错误率;相较于BLSTM模型语音识别系统,其字符错误率相对下降了7.1%。 展开更多
关键词 语音识别 深度前馈序列记忆神经网络(DFSMN) TRANSFORMER 中文音节 HADAMARD矩阵
下载PDF
一种基于MEM-LBP的动作特征提取及识别方法 被引量:5
19
作者 陈恩庆 樊军博 《计算机应用研究》 CSCD 北大核心 2018年第4期1277-1280,共4页
针对动作识别中如何有效地利用人体运动的三维信息的问题,提出一种新的基于深度视频序列的特征提取和识别方法。该方法首先运用运动能量模型(MEM)来表征人体动态特征,即先将整个深度视频序列投影到三个正交的笛卡尔平面上,再把每个投影... 针对动作识别中如何有效地利用人体运动的三维信息的问题,提出一种新的基于深度视频序列的特征提取和识别方法。该方法首先运用运动能量模型(MEM)来表征人体动态特征,即先将整个深度视频序列投影到三个正交的笛卡尔平面上,再把每个投影面的视频序系列划分为能量均等的子时间序列,分别计算子序列的深度运动图能量,从而得到运动能量模型(MEM)。然后利用局部二值模式(LBP)描述符对运动能量模型编码,进一步提取人体运动的有效信息。最后用l2范数协同表示分类器进行动作分类识别。在MSR Action3D、MSR Gesture3D数据库上测试所提方法,实验结果表明该方法有较高的识别效果。 展开更多
关键词 人体动作识别 深度视频序列 运动能量模型 局部二值模式 深度运动图
下载PDF
俯视深度头肩序列行人再识别 被引量:1
20
作者 王新年 刘春华 +1 位作者 齐国清 张世强 《中国图象图形学报》 CSCD 北大核心 2020年第7期1393-1407,共15页
目的行人再识别是指在一个或者多个相机拍摄的图像或视频中实现行人匹配的技术,广泛用于图像检索、智能安保等领域。按照相机种类和拍摄视角的不同,行人再识别算法可主要分为基于侧视角彩色相机的行人再识别算法和基于俯视角深度相机的... 目的行人再识别是指在一个或者多个相机拍摄的图像或视频中实现行人匹配的技术,广泛用于图像检索、智能安保等领域。按照相机种类和拍摄视角的不同,行人再识别算法可主要分为基于侧视角彩色相机的行人再识别算法和基于俯视角深度相机的行人再识别算法。在侧视角彩色相机场景中,行人身体的大部分表观信息可见;而在俯视角深度相机场景中,仅行人头部和肩部的结构信息可见。现有的多数算法主要针对侧视角彩色相机场景,只有少数算法可以直接应用于俯视角深度相机场景中,尤其是低分辨率场景,如公交车的车载飞行时间(time of flight,TOF)相机拍摄的视频。因此针对俯视角深度相机场景,本文提出了一种基于俯视深度头肩序列的行人再识别算法,以期提高低分辨率场景下的行人再识别精度。方法对俯视深度头肩序列进行头部区域检测和卡尔曼滤波器跟踪,获取行人的头部图像序列,构建头部深度能量图组(head depth energy map group,He DEMaG),并据此提取深度特征、面积特征、投影特征、傅里叶描述子和方向梯度直方图(histogram of oriented gradient,HOG)特征。计算行人之间头部深度能量图组的各特征之间的相似度,再利用经过模型学习所获得的权重系数对各特征相似度进行加权融合,从而得到相似度总分,将最大相似度对应的行人标签作为识别结果,实现行人再识别。结果本文算法在公开的室内单人场景TVPR(top view person re-identification)数据集、自建的室内多人场景TDPI-L(top-view depth based person identification for laboratory scenarios)数据集和公交车实际场景TDPI-B(top-view depth based person identification for bus scenarios)数据集上进行了测试,使用首位匹配率(rank-1)、前5位匹配率(rank-5)、宏F1值(macro-F1)、累计匹配曲线(cumulative match characteristic,CMC)和平均耗时等5个指标来衡量算法性能。其中,rank-1、rank-5和macro-F1分别达到61%、68%和67%以上,相比于典型算法至少提高了11%。结论本文构建了表达行人结构与行为特征的头部深度能量图组,实现了适合低分辨率行人的多特征表达;提出了基于权重学习的相似度融合,提高了识别精度,在室内单人、室内多人和公交车实际场景数据集中均取得了较好的效果。 展开更多
关键词 深度相机 俯视深度头肩序列 头部深度能量图组 相似度权重学习 行人再识别
原文传递
上一页 1 2 下一页 到第
使用帮助 返回顶部