-
题名基于先验MASK注意力机制的视频问答方案
被引量:2
- 1
-
-
作者
许振雷
董洪伟
-
机构
江南大学物联网工程学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2021年第2期52-59,共8页
-
基金
江苏省产学研合作项目(BY2015019-30)。
-
文摘
视频问答是深度学习领域的研究热点之一,广泛应用于安防和广告等系统中。在注意力机制框架下,建立先验MASK注意力机制模型,使用Faster R-CNN模型提取视频关键帧以及视频中的对象标签,将其与问题文本特征进行3种注意力加权,利用MASK屏蔽与问题无关的答案,从而增强模型的可解释性。实验结果表明,该模型在视频问答任务中的准确率达到61%,与VQA+、SA+等视频问答模型相比,其具有更快的预测速度以及更好的预测效果。
-
关键词
视频问答
计算机视觉
自然语言处理
注意力机制
MASK模型
-
Keywords
Video Question Answering(Video QA)
computer vision
natural language processing
attention mechanism
MASK model
-
分类号
TP81
[自动化与计算机技术—检测技术与自动化装置]
-
-
题名基于卷积神经网络的树叶识别的算法的研究
被引量:5
- 2
-
-
作者
许振雷
杨瑞
王鑫春
应文豪
-
机构
常熟理工学院计算机科学与工程学院
-
出处
《电脑知识与技术》
2016年第4期194-196,共3页
-
基金
大学生实践创新训练计划资助
-
文摘
该文研究了将卷积神经网络应用在树叶识别方面,并通过卷积过程对图片进行可视化。实验表明,卷积神经网络应用在树叶识别达到了92%的识别率。另外,将此神经网络与支持向量机进行比较研究,从试验中可以得出,卷积神经网络在无论是精度方面还是速度方面都要优于支持向量机,可见,卷积神经网络在树叶识别方面具有很好的应用前景。
-
关键词
树叶识别
支持向量机
卷积神经网络
-
Keywords
recognition leaves
SVM
convolutional neural network
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名基于点对特征的散乱堆放物体的位姿估计算法
被引量:5
- 3
-
-
作者
徐冠宇
董洪伟
钱军浩
许振雷
-
机构
江南大学物联网工程学院
-
出处
《激光与光电子学进展》
CSCD
北大核心
2020年第18期334-342,共9页
-
文摘
现有的三维物体识别和位姿估计方法无法很好地用于散乱堆放物体的场景,尤其是有严重遮挡和混叠的场景。使用基于点对特征的点云匹配和位姿估计算法,针对工业环境中乱序物体的特点,进行了一系列改进,如场景点云法线方向一致性调整、抓取位姿筛选策略调整、旋转对称引起的角度偏差调整,以取得更理想的位姿估计结果。在仿真环境和真实场景下进行了一系列实验,实验结果表明,所采用的算法在乱序物体场景中的位姿估计效果比较理想。
-
关键词
机器视觉
点对特征
点云匹配
位姿估计
散乱堆放
旋转对称物体
-
Keywords
machine vision
point pair features
point cloud matching
pose estimation
random bins
rotationallysymmetric object
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-