期刊文献+
共找到18篇文章
< 1 >
每页显示 20 50 100
Automatic Terrain Debris Recognition Network Based on 3D Remote Sensing Data
1
作者 Xu Han Huijun Yang +4 位作者 Qiufeng Shen Jiangtao Yang Huihui Liang Cancan Bao Shuang Cang 《Computers, Materials & Continua》 SCIE EI 2020年第10期579-596,共18页
Although predecessors have made great contributions to the semantic segmentation of 3D indoor scenes,there still exist some challenges in the debris recognition of terrain data.Compared with hundreds of thousands of i... Although predecessors have made great contributions to the semantic segmentation of 3D indoor scenes,there still exist some challenges in the debris recognition of terrain data.Compared with hundreds of thousands of indoor point clouds,the amount of terrain point cloud is up to millions.Apart from that,terrain point cloud data obtained from remote sensing is measured in meters,but the indoor scene is measured in centimeters.In this case,the terrain debris obtained from remote sensing mapping only have dozens of points,which means that sufficient training information cannot be obtained only through the convolution of points.In this paper,we build multi-attribute descriptors containing geometric information and color information to better describe the information in low-precision terrain debris.Therefore,our process is aimed at the multi-attribute descriptors of each point rather than the point.On this basis,an unsupervised classification algorithm is proposed to divide the point cloud into several terrain areas,and regard each area as a graph vertex named super point to form the graph structure,thus effectively reducing the number of the terrain point cloud from millions to hundreds.Then we proposed a graph convolution network by employing PointNet for graph embedding and recurrent gated graph convolutional network for classification.Our experiments show that the terrain point cloud can reduce the amount of data from millions to hundreds through the super point graph based on multi-attribute descriptor and our accuracy reached 91.74%and the IoU reached 94.08%,both of which were significantly better than the current methods such as SEGCloud(Acc:88.63%,IoU:89.29%)and PointCNN(Acc:86.35,IoU:87.26). 展开更多
关键词 semantic segmentation low-precision point cloud large-scale terrain debris recognition
下载PDF
高速公路车道级视频检测区自动设定方法
2
作者 莫宇蓉 吴烈阳 +4 位作者 彭锦辉 刘圣卿 唐先亮 黎川 符锌砂 《交通运输研究》 2024年第5期78-90,共13页
针对云台摄像枪在轮巡过程中无法自动设定视频检测区,从而影响交通事件识别准确率的问题,提出了一种基于视频的高速公路车道级检测区自动设定方法。首先,通过分析U-Net和MobileNet系列模型的特征,结合深度可分离卷积和倒置残差等结构,... 针对云台摄像枪在轮巡过程中无法自动设定视频检测区,从而影响交通事件识别准确率的问题,提出了一种基于视频的高速公路车道级检测区自动设定方法。首先,通过分析U-Net和MobileNet系列模型的特征,结合深度可分离卷积和倒置残差等结构,设计了一个高效且轻量化的R-Net系列模型,专门用于车道线和可行驶区域的语义分割。在此基础上,根据高速公路特定场景识别任务的特点,提出了一种基于连通域分析的车道线和检测区标记算法,实现了车道级检测区的自动设定。同时,为了提高标记算法的准确率,首次引入了阈值处理和叠加帧数这两种预处理方法,然后利用二次方程对车道线标记结果进行拟合,实现了车道线完整且平滑的分割。实验结果表明,R-Net系列模型的性能指标MIoU与传统模型如SegNet和U-Net接近,但显著减少了模型参数量和内积运算量,其中R-NetV2模型的分割性能指标MIoU达到90.6%,与U-Net相比仅下降了0.4%,但其模型参数量减少了38.7%,内积运算量减少了62.5%。对经过预处理后的语义分割结果进行标记,车道线标记准确率与传统方法相比从80.47%提高到95.58%。 展开更多
关键词 交通事件识别 视频检测 车道级检测区 轻量化 语义分割 连通域 车道线
下载PDF
工作面液压支架丢架状态视觉自动检测方法
3
作者 滕贷宇 南柄飞 《工矿自动化》 CSCD 北大核心 2024年第11期99-108,共10页
受采场地质条件变化、泵站压力波动及自动跟机系统误差等因素影响,液压支架在自动跟机移架过程中存在丢架情况,人工丢架监测严重影响工作面自动跟机效率。而基于传感器和感知信息的液压支架实时丢架状态监测方法的稳定性和可靠性较差。... 受采场地质条件变化、泵站压力波动及自动跟机系统误差等因素影响,液压支架在自动跟机移架过程中存在丢架情况,人工丢架监测严重影响工作面自动跟机效率。而基于传感器和感知信息的液压支架实时丢架状态监测方法的稳定性和可靠性较差。针对上述问题,提出一种液压支架丢架状态视觉自动检测方法。首先采用YOLOv8对实时获取的工作面监控视频图像进行工作面目标区域划分,通过充分学习工作面图像内部特征准确获取液压支架底座及推杆的轮廓信息与位置信息,分析不同液压支架底座及推杆的位置信息,确定监控视频图像中的支架号;然后提取相邻液压支架最小底座区域局部图像,利用融合多尺度特征信息的ResNet50卷积网络对底座局部图像进行特征提取,获取图像多尺度融合特征信息,再将特征信息映射到类别空间,获取不同液压支架状态的概率分布,根据概率判断液压支架正常移架或丢架状态,结合支架号信息确定处于丢架状态的液压支架。实验结果表明:基于监控视频的工作面目标区域平均分割精度为0.98,准确实现目标区域结构化提取;支架号自动识别准确率为98.78%,为液压支架丢架状态检测提供准确的支架号信息;工作面液压支架丢架状态视觉自动检测的平均准确率达99.17%,单帧图像处理时间为36 ms,满足采煤工作面AI视频监控系统检测丢架状态的实时性与可靠性需求。 展开更多
关键词 液压支架 丢架视觉检测 视频图像语义分割 支架号识别 多尺度特征信息提取
下载PDF
基于语音识别的蔬菜病害视频语义标注与分割方法 被引量:4
4
作者 李鑫星 刘春迪 +3 位作者 温皓杰 苏叶 傅泽田 张领先 《农业机械学报》 EI CAS CSCD 北大核心 2015年第9期308-313,共6页
为了向农民提供蔬菜病害知识,基于语音识别技术设计了一种蔬菜病害视频标注与分割方法,可将科研机构录制的蔬菜病害视频分割成适合手机播放的小视频段落。在前期设计的视频镜头切分方法基础上,进一步设计出基于语音识别技术的视频语义... 为了向农民提供蔬菜病害知识,基于语音识别技术设计了一种蔬菜病害视频标注与分割方法,可将科研机构录制的蔬菜病害视频分割成适合手机播放的小视频段落。在前期设计的视频镜头切分方法基础上,进一步设计出基于语音识别技术的视频语义标注及视频镜头聚类方法,即首先采用成熟的语音识别技术,将视频镜头的语音讲解识别为文本形式;进而基于本体对识别文本进行相应的语义处理,从中提取出能起到指示作用的关键语义实体,并将其恰当的组织形式作为视频镜头的语义标注;最终根据用户提供的关键词并结合视频镜头的语义标注,对视频镜头进行聚类和重组,从而实现对于蔬菜病害视频的最终分割。所设计的视频镜头语义标注方法对2个测试视频的查全率分别达到96.08%、94.93%,查准率分别达到94.31%、95.98%,F-1测度也分别达到0.93和0.92;视频镜头聚类方法使得2个视频的分割查全率分别达到94.9%、98.7%,查准率分别达到92.1%、90.2%,查全率平均大于95%,查准率大于90%。证明所设计的蔬菜病害视频标注与分割方法具有理论和实用价值。 展开更多
关键词 蔬菜病害 视频分割 语音识别 语义标注
下载PDF
视频序列中的行为识别研究进展 被引量:20
5
作者 徐勤军 吴镇扬 《电子测量与仪器学报》 CSCD 2014年第4期343-351,共9页
视频序列中的行为识别是计算机视觉领域非常活跃的研究方向,在视频监控、人机交互、医疗看护、视频检索等领域有着广阔的应用前景。综合分析了行为识别的研究进展,首先分析了目前主流的行为识别数据库的不同特点;然后总结了行为的特征... 视频序列中的行为识别是计算机视觉领域非常活跃的研究方向,在视频监控、人机交互、医疗看护、视频检索等领域有着广阔的应用前景。综合分析了行为识别的研究进展,首先分析了目前主流的行为识别数据库的不同特点;然后总结了行为的特征表示方法以及识别方法的最新进展,由于实际应用要求算法具有快速、自动和实时性,且人工标定大量视频存在困难,无监督的学习方法受到越来越多的关注;在此基础上,讨论了行为识别面临的挑战,以及今后的研究发展方向。 展开更多
关键词 行为识别 计算机视觉 模式识别 视频语义信息 机器学习
下载PDF
多模态特征融合与多任务学习的特种视频分类 被引量:5
6
作者 吴晓雨 顾超男 王生进 《光学精密工程》 EI CAS CSCD 北大核心 2020年第5期1177-1186,共10页
特种视频(本文特指暴力视频)的智能分类技术有助于实现网络信息内容安全的智能监控。针对现有特种视频多模态特征融合时未考虑语义一致性等问题,本文提出了一种基于音视频多模态特征融合与多任务学习的特种视频识别方法。首先,提取特种... 特种视频(本文特指暴力视频)的智能分类技术有助于实现网络信息内容安全的智能监控。针对现有特种视频多模态特征融合时未考虑语义一致性等问题,本文提出了一种基于音视频多模态特征融合与多任务学习的特种视频识别方法。首先,提取特种视频的表观信息和运动信息随时空变化的视觉语义特征及音频信息语义特征;然后,构建具有语义保持的共享特征子空间,以实现音视频多种模态特征的融合;最后,提出基于音视频特征的语义一致性度量和特种视频分类的多任务学习特种视频分类理论框架,设计了对应的损失函数,实现了端到端的特种视频智能识别。实验结果表明,本文提出的算法在Violent Flow和MediaEval VSD 2015两个数据集上平均精度分别为97.97%和39.76%,优于已有研究。结果证明了该算法的有效性,有助于提升特种视频监控的智能化水平。 展开更多
关键词 特种视频识别 特征提取 多模态特征融合 语义一致性度量 多任务学习
下载PDF
基于Petri网推理的监控视频事件识别
7
作者 代科学 李强 邹正武 《电子技术应用》 北大核心 2010年第3期140-143,148,共5页
Petri网模型对复合时序事件具有较好的描述和检测能力,提出基于Petri网描述和推理的监控视频事件信息的自动识别方法。将运动目标及其特征间的空间关系用Petri网的库表示,时间关系及其他推理规则用变迁表示,结合低级计算机视觉算法获得... Petri网模型对复合时序事件具有较好的描述和检测能力,提出基于Petri网描述和推理的监控视频事件信息的自动识别方法。将运动目标及其特征间的空间关系用Petri网的库表示,时间关系及其他推理规则用变迁表示,结合低级计算机视觉算法获得的运动目标特征以及基本事件信息,通过对Petri网推理执行,实现监控视频复杂语义事件的交互式查询,通过实验验证了该方法的有效性。 展开更多
关键词 监控视频 语义信息 事件 识别
下载PDF
基于八元组视频语义模型的人体行为理解方法
8
作者 李敏 刘恒 《计算机工程与设计》 CSCD 北大核心 2013年第12期4267-4272,共6页
目前的人体行为理解技术存在对噪声敏感,运算量大,没有关注场景敏感度,未进行事件整体描述的缺陷,并且存在理解结果与人类认知之间的语义鸿沟。一种八元组视频语义模型被提出,该模型既考虑了场景层次语义的理解,又融入了三维人体语义模... 目前的人体行为理解技术存在对噪声敏感,运算量大,没有关注场景敏感度,未进行事件整体描述的缺陷,并且存在理解结果与人类认知之间的语义鸿沟。一种八元组视频语义模型被提出,该模型既考虑了场景层次语义的理解,又融入了三维人体语义模型,引入了分析和综合的方法来实现视频事件的整体描述。实验结果显示:该方法在识别率和整体性能上都优于基于上下文无关(CFG)的行为识别方法,并在一定程度上解决了语义鸿沟问题。 展开更多
关键词 八元组视频语义模型 三维人体语义模型 场景层次语义 行为理解 视频事件整体描述
下载PDF
基于语义嵌入学习的特类视频识别
9
作者 吴晓雨 蒲禹江 +1 位作者 王生进 刘子豪 《电子学报》 EI CAS CSCD 北大核心 2023年第11期3225-3237,共13页
暴力视频传播已经成为网络环境治理面临的隐患之一,暴力视频这类特类视频的智能识别技术对维护互联网内容安全具有重要意义.由于采集来源的多样性,暴力视频分布通常呈现较大的类内方差和较小的类间方差,常见的暴力视频识别模型难以适应... 暴力视频传播已经成为网络环境治理面临的隐患之一,暴力视频这类特类视频的智能识别技术对维护互联网内容安全具有重要意义.由于采集来源的多样性,暴力视频分布通常呈现较大的类内方差和较小的类间方差,常见的暴力视频识别模型难以适应复杂多变的暴力场景.同时,暴力一词本身具有高度抽象的语义,如何从有限数据中学习通用的暴力语义表示成为一大难点.针对这些问题,本文基于语义嵌入学习的思想,构建了一种新颖的多模态暴力视频识别模型,主要由三部分构成.(1)多模态特征提取.考虑到视频具有多模态属性,采用了三种不同的深度神经网络分别提取表观、运动、音频三种模态的特征表示.(2)多模态特征融合.为获得鲁棒的通用视频表示,设计了一种轻量级的多模态特征融合模块(Multimodal Efficient Fusion Module,MEFM),该模块包括共享空间映射与多模态特征交互两部分,在对多模态特征进行充分交互的同时,又能够有效抑制不同模态信息之间的干扰.(3)语义嵌入学习.为适应不同数据分布的暴力数据集,提出了一种基于语义嵌入的多任务学习方法,通过引入中心损失构建暴力语义中心,并采用余弦嵌入损失将暴力样本向中心聚合、非暴力样本进行离散,形成具有语义判别性的特征表示,从而增强了模型的泛化能力,减少了数据噪声的干扰.在VSD2015,Violent Flows和RWF-2000三个公开数据集上的实验表明,本文提出的暴力视频识别模型较已有方法分别提升了4.79%,0.81%和1.5%,取得了具有竞争力的结果. 展开更多
关键词 暴力视频识别 多模态特征融合 语义嵌入 多任务学习
下载PDF
基于高层语义词袋的人体行为识别方法
10
作者 黄少年 施游 《电脑与电信》 2015年第3期37-39,共3页
人体行为分析为视频监控系统、视频检索系统提供重要的研究基础。本文提出了一种基于高层语义词袋模型的人体行为识别方法。该方法根据底层词袋中词汇的相关关系,构造出一个基于词汇交互信息量的底层词汇图;然后使用层次聚类的方法对该... 人体行为分析为视频监控系统、视频检索系统提供重要的研究基础。本文提出了一种基于高层语义词袋模型的人体行为识别方法。该方法根据底层词袋中词汇的相关关系,构造出一个基于词汇交互信息量的底层词汇图;然后使用层次聚类的方法对该图进行分割,得到底层词汇组模型,最后将该模型表示为高层语义词袋模型。实验结果表明,该方法可以高效地识别视频中的人体行为。 展开更多
关键词 行为识别 语义词袋 视频监控
下载PDF
露天矿山智能视频识别系统平台应用研究 被引量:3
11
作者 曲业明 付恩三 +3 位作者 孙宝志 赵浩 王刚 夏庆宇 《露天采矿技术》 CAS 2021年第6期24-27,31,共5页
为规范露天矿山驾驶人员操作规范性及时发现各生产环节的异常状态,通过构建露天矿山智能识别系统来实现对露天矿山异常行为的智能视频识别。充分利用露天矿山的视频监控系统,露天矿山4G、5G网络,构建露天矿山的违章视频识别算法和开发... 为规范露天矿山驾驶人员操作规范性及时发现各生产环节的异常状态,通过构建露天矿山智能识别系统来实现对露天矿山异常行为的智能视频识别。充分利用露天矿山的视频监控系统,露天矿山4G、5G网络,构建露天矿山的违章视频识别算法和开发露天矿山智能视频系统平台。该系统平台的研发建设,将大大提升了安全管理水平,降低矿山人员的作业风险,降低安全管理人员的工作量,实现对违章行为的实时监管,智能干预。 展开更多
关键词 人工智能 视频识别 系统平台 语义分割 模型推理
下载PDF
基于智能视觉物联网的油库人员行为识别与监测系统 被引量:12
12
作者 岳彬 余大兵 +2 位作者 常心悦 席淑雅 李庆武 《电子测量技术》 2020年第3期128-131,共4页
针对油库区域人员行为监测响应慢、时效低的问题,提出一种基于智能视觉物联网的油库人员行为识别与监测系统。首先建立智能视觉物联网监测系统架构,满足信号采集、传输、处理与反馈需求;然后提出一种视频语义分析模型,将人体行为识别与... 针对油库区域人员行为监测响应慢、时效低的问题,提出一种基于智能视觉物联网的油库人员行为识别与监测系统。首先建立智能视觉物联网监测系统架构,满足信号采集、传输、处理与反馈需求;然后提出一种视频语义分析模型,将人体行为识别与人脸识别进行协同分析,实现对油库作业人员行为的分析与监测。经实验验证,在自建的数据库中,系统的人脸识别准确率达96.5%,人体行为识别准确率达85%,说明该系统可有效减少因人员的行为失误造成的油库安全事故,在油库的安全管理中具有很高的应用价值。 展开更多
关键词 油库安全 智能视觉物联网 视频语义分析 人体行为识别 人脸识别
下载PDF
基于视觉的人体动作识别综述 被引量:7
13
作者 周艳青 王磊 《山东轻工业学院学报(自然科学版)》 CAS 2012年第1期85-90,共6页
识别视频中的人的动作是视频语义分析方向的一个关键研究课题,在很多领域有广阔的应用前景,如人机交互,智能监控,基于内容的视频数据检索等。本文从问题的定义,一般解决思路,到两大关键问题——动作表示和动作识别的解决方法进行了详细... 识别视频中的人的动作是视频语义分析方向的一个关键研究课题,在很多领域有广阔的应用前景,如人机交互,智能监控,基于内容的视频数据检索等。本文从问题的定义,一般解决思路,到两大关键问题——动作表示和动作识别的解决方法进行了详细论述,并指出了现有方法存在的问题以及发展方向,为该领域的初学者提供有价值的参考。 展开更多
关键词 视频语义分析 动作表示 动作识别
下载PDF
基于视频深度学习的小鼠恐惧情绪识别与分析方法研究
14
作者 刘亚 刘可 +4 位作者 黄庆安 柏涛 邱收 张娜 朱真 《生命科学仪器》 2021年第4期37-44,共8页
在小鼠情绪分析实验中,实验者通常采用机器学习的方法预测小鼠关键部位的位置变化来判定小鼠是否处于恐惧情绪行为。为了进一步提高小鼠恐惧情绪识别和分析的准确率,本文构建了一种高效的轻量化U-Net语义分割模型,提出了根据视频中帧画... 在小鼠情绪分析实验中,实验者通常采用机器学习的方法预测小鼠关键部位的位置变化来判定小鼠是否处于恐惧情绪行为。为了进一步提高小鼠恐惧情绪识别和分析的准确率,本文构建了一种高效的轻量化U-Net语义分割模型,提出了根据视频中帧画面之间小鼠轮廓区域的变化幅度来量化分析小鼠恐惧情绪行为的方法。经实验验证,本文方法与专家统计结果的皮尔森相关性系数达到86%以上,证明了本文方法对于小鼠恐惧情绪行为的分析具有较高的准确率,同时对其它小型模式动物行为分析也有一定的参考价值。 展开更多
关键词 视频处理 语义分割 轻量化 情绪分析
下载PDF
面向语义通信的3D骨骼点数据编码与压缩方法 被引量:1
15
作者 张浩 冯春燕 +2 位作者 杨佳汇 郭彩丽 周博文 《北京邮电大学学报》 EI CAS CSCD 北大核心 2022年第6期60-67,共8页
传统视频编码与压缩方法难以有效去除视频数据中的大量冗余信息,降低了传输效率。对此,提出了一种面向语义通信的三维(3D)骨骼点数据信源编码与压缩方法(DMDCT)。针对骨骼点数据中的冗余问题,提出了多尺度骨骼点表示方法,自适应地描述... 传统视频编码与压缩方法难以有效去除视频数据中的大量冗余信息,降低了传输效率。对此,提出了一种面向语义通信的三维(3D)骨骼点数据信源编码与压缩方法(DMDCT)。针对骨骼点数据中的冗余问题,提出了多尺度骨骼点表示方法,自适应地描述参与每个不同动作语义骨骼点运动状态的同时保留人体骨骼语义架构;引入离散余弦变换(DCT)从频域层面分离多尺度骨骼点表示的低频分量和高频分量,进一步减少了整体数据量。区别于传统通信传输原始视频数据的方式,结合语义通信只传输与高层任务相关的骨骼点数据,提高了数据传输效率。在公开数据集NTU RGB+D上以动作识别为例的实验结果表明,DMDCT在同等压缩率的top1准确率比同类算法提高了约5%,且在仅保留10%的DCT系数时仍可达到74.2%的准确率,而数据量仅为原始数据量的6%。 展开更多
关键词 3D人体骨骼点数据 视频数据压缩 语义通信 动作识别
原文传递
基于长短时预测一致性的大规模视频语义识别算法
16
作者 王铮 翁泽佳 +2 位作者 王锐 陈静静 姜育刚 《中国科学:信息科学》 CSCD 北大核心 2020年第6期877-891,共15页
片段视频语义识别旨在识别视频中短小片段的语义概念,是视频分析的一项重要任务.由于片段视频的数量巨大且缺乏可参考的网络标签,片段视频的标记十分困难,通常只能对部分片段视频进行标记.如何利用有限的语义标签提高片段视频语义识别... 片段视频语义识别旨在识别视频中短小片段的语义概念,是视频分析的一项重要任务.由于片段视频的数量巨大且缺乏可参考的网络标签,片段视频的标记十分困难,通常只能对部分片段视频进行标记.如何利用有限的语义标签提高片段视频语义识别的准确率是一项关键挑战.因此本文提出了一种基于长短时预测一致性的视频语义识别算法.该算法通过引入完整视频语义与片段视频语义一致性的约束,对片段视频语义识别结果进行筛选,以此提高片段视频语义识别的准确率.本文提出的算法在大规模视频数据集YouTube-8M的片段视频语义识别任务上达到了82.62%的平均均值准确率(mean average precision, MAP)识别精度,在第三届YouTube-8M比赛中排名第二. 展开更多
关键词 大规模视频语义识别 片段视频语义识别 语义一致性 特征聚合 预测可靠性
原文传递
关键语义区域链提取的视频人体行为识别 被引量:2
17
作者 马淼 李贻斌 +2 位作者 武宪青 高金凤 潘海鹏 《中国图象图形学报》 CSCD 北大核心 2020年第12期2517-2529,共13页
目的视频中的人体行为识别技术对智能安防、人机协作和助老助残等领域的智能化起着积极的促进作用,具有广泛的应用前景。但是,现有的识别方法在人体行为时空特征的有效利用方面仍存在问题,识别准确率仍有待提高。为此,本文提出一种在空... 目的视频中的人体行为识别技术对智能安防、人机协作和助老助残等领域的智能化起着积极的促进作用,具有广泛的应用前景。但是,现有的识别方法在人体行为时空特征的有效利用方面仍存在问题,识别准确率仍有待提高。为此,本文提出一种在空间域使用深度学习网络提取人体行为关键语义信息并在时间域串联分析从而准确识别视频中人体行为的方法。方法根据视频图像内容,剔除人体行为重复及冗余信息,提取最能表达人体行为变化的关键帧。设计并构造深度学习网络,对图像语义信息进行分析,提取表达重要语义信息的图像关键语义区域,有效描述人体行为的空间信息。使用孪生神经网络计算视频帧间关键语义区域的相关性,将语义信息相似的区域串联为关键语义区域链,将关键语义区域链的深度学习特征计算并融合为表达视频中人体行为的特征,训练分类器实现人体行为识别。结果使用具有挑战性的人体行为识别数据集UCF(University of Central Florida)50对本文方法进行验证,得到的人体行为识别准确率为94.3%,与现有方法相比有显著提高。有效性验证实验表明,本文提出的视频中关键语义区域计算和帧间关键语义区域相关性计算方法能够有效提高人体行为识别的准确率。结论实验结果表明,本文提出的人体行为识别方法能够有效利用视频中人体行为的时空信息,显著提高人体行为识别准确率。 展开更多
关键词 人机交互 深度学习网络 人体行为关键语义信息 人体行为识别 视频关键帧
原文传递
体育视频中基于语义推理的事件检测方法
18
作者 吴川 马宇飞 +2 位作者 贺玉文 钟玉琢 张宏江 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 2003年第4期507-509,共3页
为了对视频内容进行语义级别的事件分析和索引 ,进一步满足用户访问大规模体育视频库的需求 ,提出一种 3层次的视频语义推理方案。在最底层 ,提取视频特征 ,并提出一种视频语义片段自动分割算法 ;在第二层 ,把各语义片段映射到语义概念 ... 为了对视频内容进行语义级别的事件分析和索引 ,进一步满足用户访问大规模体育视频库的需求 ,提出一种 3层次的视频语义推理方案。在最底层 ,提取视频特征 ,并提出一种视频语义片段自动分割算法 ;在第二层 ,把各语义片段映射到语义概念 ;在最高层 ,建立视频语义事件的有限状态自动机模型 ,进行事件推理和识别。实验结果表明 ,该方案可以有效地进行视频事件识别 。 展开更多
关键词 体育视频 事件检测 语义推理 事件识别 事件推理 有限状态自动机模型 视频分析
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部