期刊文献+
共找到14篇文章
< 1 >
每页显示 20 50 100
地级市智慧停车系统建设方案研究——以衡阳市为例
1
作者 欧阳锐达 《无线互联科技》 2024年第14期18-21,32,共5页
针对地级市的交通特点及存在的停车难问题,以衡阳市智慧停车系统为例,文章介绍了地级市智慧停车系统的基本概念,分析了地级市智慧停车系统的系统构成和系统功能。一套成熟的地级市智慧停车系统不仅能够有效提高城市停车泊位的利用率及... 针对地级市的交通特点及存在的停车难问题,以衡阳市智慧停车系统为例,文章介绍了地级市智慧停车系统的基本概念,分析了地级市智慧停车系统的系统构成和系统功能。一套成熟的地级市智慧停车系统不仅能够有效提高城市停车泊位的利用率及周转率、市民的停车体验、停车管理单位的管理效率及水平,还能够有效减少停车对城市动态交通的影响,提升城市的整体形象。 展开更多
关键词 地级市 智慧停车 系统架构 地磁 高位视频 三级诱导
下载PDF
基于深度学习的视频观测潮位技术研究——以厦门高崎码头为例
2
作者 曾志 陈智杰 孙全 《海洋开发与管理》 2024年第1期94-101,共8页
近岸潮位观测是海洋工程应用、海岸防灾减灾、海岸带管理以及海洋有关科研工作中最基础的工作之一。文章基于视频图像深度学习的方法,使用YOLOv5目标检测算法从安装在近岸的固定摄像机拍摄的视频帧中提取潮汐水位特征进行潮位分析。研... 近岸潮位观测是海洋工程应用、海岸防灾减灾、海岸带管理以及海洋有关科研工作中最基础的工作之一。文章基于视频图像深度学习的方法,使用YOLOv5目标检测算法从安装在近岸的固定摄像机拍摄的视频帧中提取潮汐水位特征进行潮位分析。研究采用厦门高崎码头的分辨率为1920×1080的高清摄像头2023年2月的影像数据作为训练集和验证集,2023年3月的影像数据作为测试集,利用岸边验潮井逐时潮位数据进行标注,采用YOLOv5目标检测算法来训练。计算结果显示,通过视频观测潮位在训练集和测试集上的误差分别为3.9cm和5.3cm。视频中1个像素点代表3.8cm,因此潮位观测的平均误差为像素级。研究表明在近岸通过高清摄像头基于图像深度学习进行潮位观测的方法是可行的,观测精度取决于图像目标物的分辨率。 展开更多
关键词 深度学习 潮位观测 厦门高崎码头 高清视频
下载PDF
融合语义增强与多注意力机制的视频描述方法
3
作者 任剑洪 曾勍炜 +2 位作者 李向军 龚政 刘方 《南昌大学学报(理科版)》 CAS 北大核心 2023年第6期548-555,共8页
随着视频数据爆发式增长,视频描述任务越来越被研究者们关注。如何让计算机像人类一样理解视频的内容并能够准确无误地用语言表达出来,是视频描述任务领域尚未得到完美解决的难题之一。针对现有代表性视频描述模型中存在的未充分利用语... 随着视频数据爆发式增长,视频描述任务越来越被研究者们关注。如何让计算机像人类一样理解视频的内容并能够准确无误地用语言表达出来,是视频描述任务领域尚未得到完美解决的难题之一。针对现有代表性视频描述模型中存在的未充分利用语义信息、生成描述不准确等问题,本文基于编码器-解码器框架的视频描述模型,提出了一种融合语义增强与多注意力机制的视频描述方法。该方法首先通过视觉文本特征聚合方法,为模型编码提供高层语义指导。然后,使用Faster-RCNN网络提取视频对象特征,通过图卷积网络获取视频对象的潜在语义信息,得到增强特征。最后,引入多重注意力机制,使模型更好地利用输入信息,增强模型的学习能力。MSVD和MSR-VTT数据集上的实验结果表明,相比于基准模型,本文提出的方法能合理优化视频描述模型的输入信息,有效提取视频潜在语义,从而解决视频文本跨模态问题和生成语句的语法结构问题,并能有效提升视频描述模型的准确度和对复杂场景的描述能力,更具先进性。 展开更多
关键词 视频描述 高层语义 图神经网络 注意力机制 特征增强
下载PDF
基于时空域复杂度特征的LCU级码率分配算法 被引量:1
4
作者 亢润龙 《电视技术》 2023年第9期33-39,共7页
提出一种新的最大编码单元(Largest Coding Unit,LCU)级码率分配算法,在保证码率准确性的前提下提升视频质量。首先,选择更符合人眼视觉特性的结构相似性(Structural Similarity,SSIM)图像评价算法来衡量每个LCU的空域复杂度,通过已编... 提出一种新的最大编码单元(Largest Coding Unit,LCU)级码率分配算法,在保证码率准确性的前提下提升视频质量。首先,选择更符合人眼视觉特性的结构相似性(Structural Similarity,SSIM)图像评价算法来衡量每个LCU的空域复杂度,通过已编码帧的失真度来衡量每个LCU的时域复杂度,基于多元线性回归函数对时空域复杂度特征与实际编码比特数之间的关系进行数学建模。最后,依据时空域复杂度特征因子指导编码帧中每个LCU分配合理的目标码率。实验结果表明,在保证码率精确性的情况下,所提的LCU级码率分配算法具有较高的编码效率,率失真性能平均提高了1.25%。 展开更多
关键词 高效率视频编码(HEVC) 码率控制 最大编码单元(LCU)级 复杂度
下载PDF
基于高层语义的视频检索研究 被引量:9
5
作者 张治国 刘怀亮 +2 位作者 马志辉 张毅 赵娜 《计算机工程与应用》 CSCD 北大核心 2007年第18期168-170,180,共4页
视频语义检索的研究是目前研究的热点之一。现有的视频检索系统技术多是基于底层特征的、非语义层次的检索。与人类思维中所能理解的高层语义概念相去甚远,这严重影响视频检索的实际效果。如何跨越底层特征和高层语义的鸿沟,用高层语义... 视频语义检索的研究是目前研究的热点之一。现有的视频检索系统技术多是基于底层特征的、非语义层次的检索。与人类思维中所能理解的高层语义概念相去甚远,这严重影响视频检索的实际效果。如何跨越底层特征和高层语义的鸿沟,用高层语义概念进行视频检索是当前研究的重点。通过对视频内容的语义理解、语义分析、语义提取的简要概述,试图构造一种视频语义检索模型。 展开更多
关键词 高层语义 基于高层语义的视频检索 支持向量机 视频语义检索模型
下载PDF
音频高层语义分析 被引量:4
6
作者 魏维 游静 +1 位作者 刘凤玉 许满武 《中国图象图形学报》 CSCD 北大核心 2007年第1期141-147,共7页
为跨越语义鸿沟,提出了一种提取音频中高层语义概念的方法。该方法先用隐马尔可夫模型(HMM)建立对应于分析窗口的低层语义概念,即基本声音语义事件(basic semantic-audio event,BE);然后以音框为单位将声音信号通过短时傅里叶变换及ICA... 为跨越语义鸿沟,提出了一种提取音频中高层语义概念的方法。该方法先用隐马尔可夫模型(HMM)建立对应于分析窗口的低层语义概念,即基本声音语义事件(basic semantic-audio event,BE);然后以音框为单位将声音信号通过短时傅里叶变换及ICA处理来得到对应于HMM模型的可观察符号;接着用贝叶斯决策排除语义窗口对应声音段中的非预定义BE后,按贝叶斯公式所得最大后验概率为准则得到此语义窗口的一个基本声音语义事件组(group of BE,)GBE;最后采用高层语义逻辑定义来描述GBE与高层声音语义概念间的联系,结合由实例训练得到的高层语义逻辑定义最终得到相应语义窗口的高层语义声音概念(high level audio semantic concept,HC)。实验表明此方法能提取与人思维中相似的高层语义概念,在一定程度上可跨越语义鸿沟。 展开更多
关键词 声音语义内容分析 高层语义概念 语义视频分析 隐马尔可夫模型
下载PDF
基于Syntax级分组和多线程处理的HEVC熵编码并行算法 被引量:1
7
作者 邸金红 张克新 +1 位作者 祁跻 张鑫明 《电讯技术》 北大核心 2014年第10期1435-1440,共6页
新一代视频编码标准HEVC获得了较高的编码效率,但是同时需要较大的计算量。HEVC并行算法能够提高编码速度,如何开发适用于多核处理器的并行编码算法对于满足高清视频实时传输和大规模共享具有十分重要的意义。提出了一种基于Syntax级... 新一代视频编码标准HEVC获得了较高的编码效率,但是同时需要较大的计算量。HEVC并行算法能够提高编码速度,如何开发适用于多核处理器的并行编码算法对于满足高清视频实时传输和大规模共享具有十分重要的意义。提出了一种基于Syntax级分组和多线程处理的HEVC熵编码并行算法。该算法首先将HEVC中一个编码树单元的编码信息按照语法元素进行分组;其次,根据编码块数据间的相关性构建Syntax级并行编码器;然后结合多线程技术实现HEVC帧级编码的并行计算。实验结果表明,在编码图像的主客观质量上没有太大损失的情况下,该并行算法框架与传统的串行算法框架相比具有65%~70%的加速效果。 展开更多
关键词 高效视频编码 并行算法 Syntax级 多线程
下载PDF
基于语义的视频检索关键技术综述 被引量:3
8
作者 孔英会 刘淑荣 +1 位作者 张少明 范启跃 《电子科技》 2012年第8期150-153,共4页
随着大量视频的出现,视频内容检索是当今多媒体应用的一个重要研究方向。现有的视频检索技术多是基于低层特征,这些低层特征与高层语义概念相差较多,严重影响了视频内容检索系统的实用性。由于低层特征和高层语义概念间的语义鸿沟,如何... 随着大量视频的出现,视频内容检索是当今多媒体应用的一个重要研究方向。现有的视频检索技术多是基于低层特征,这些低层特征与高层语义概念相差较多,严重影响了视频内容检索系统的实用性。由于低层特征和高层语义概念间的语义鸿沟,如何从视频内容中提取人类思维中的语义概念,正成为目前视频内容检索中最具有挑战性的研究内容。文中介绍了语义视频检索出现的背景和国内外最新研究动态,分析了现有方法的优缺点,对现有的关键技术进行综述。 展开更多
关键词 语义鸿沟 语义视频检索 底层特征 高层语义概念
下载PDF
一种视频局部高层语义特征提取算法 被引量:5
9
作者 许源 薛向阳 《计算机科学》 CSCD 北大核心 2006年第11期134-138,共5页
准确提取视频高层语义特征,有助于更好地进行基于内容的视频检索。视频局部高层语义特征描述的是图像帧中的物体。考虑到物体本身以及物体所处的特定场景所具有的特点,我们提出一种将图像帧的局部信息和全局信息结合起来提取视频局部高... 准确提取视频高层语义特征,有助于更好地进行基于内容的视频检索。视频局部高层语义特征描述的是图像帧中的物体。考虑到物体本身以及物体所处的特定场景所具有的特点,我们提出一种将图像帧的局部信息和全局信息结合起来提取视频局部高层语义特征的算法。在TRECVID2005数据集上的实验结果表明,与单独基于局部或者单独基于全局的方法相比,此方法具有较好的性能。 展开更多
关键词 局部高层语义特征 高层语义特征提取 基于内容的视频检索
下载PDF
视频图像中文本的检测、定位与提取
10
作者 孙李娜 樊来耀 《电子科技》 2009年第1期75-79,共5页
视频数据中的文本是视频语义理解和检索的重要信息来源。文中对视频中文本的检测、定位、提取、增强和识别进行了研究。提出了应用小波模极大值算法检测视频帧文本所在的位置,用由粗到精的多层定位方法以及金字塔模型,对于多尺度的静止... 视频数据中的文本是视频语义理解和检索的重要信息来源。文中对视频中文本的检测、定位、提取、增强和识别进行了研究。提出了应用小波模极大值算法检测视频帧文本所在的位置,用由粗到精的多层定位方法以及金字塔模型,对于多尺度的静止和滚动中英文文字进行提取,最后对文本区域进行二值化。实验表明文中方法取得了良好的效果。 展开更多
关键词 视频检索 高层语义 文本提取 小波模极大值 文本定位
下载PDF
基于HLS的实时图像去雾实现 被引量:7
11
作者 齐乐 张小刚 姚航 《计算机工程》 CAS CSCD 北大核心 2016年第5期224-229,共6页
户外图像或视频受到大气中烟雾的影响,存在模糊不清及颜色偏移等问题,在很大程度上影响户外视频系统正常稳定工作。现有的去雾算法计算复杂度较高,仅依靠软件对视频级进行去雾有一定难度。针对这一现状,分析暗原色先验去雾算法的计算瓶... 户外图像或视频受到大气中烟雾的影响,存在模糊不清及颜色偏移等问题,在很大程度上影响户外视频系统正常稳定工作。现有的去雾算法计算复杂度较高,仅依靠软件对视频级进行去雾有一定难度。针对这一现状,分析暗原色先验去雾算法的计算瓶颈,利用高级层次综合(HLS)工具实现去雾算法的硬件化,使用流水线技术将去雾算法运行在现场可编程门阵列上。实验结果表明,在保证去雾质量的前提下,对于1080P的实时场景,可以达到每秒45帧以上的处理速度,基本满足高清视频去雾的需求。 展开更多
关键词 暗通道 去雾 视频 现场可编程门阵列 实时 高级层次综合工具
下载PDF
基于语义的视频检索综述 被引量:1
12
作者 洪涛 《数字技术与应用》 2017年第5期113-116,共4页
国内IPTV业务发展迅速,运营商掌握了巨量的视频数据,对视频数据的高效分析、利用,可以提高用户体验,为广大用户以及社会各界提供更优质服务。基于语义的视频检索技术,可以使视频数据结构化,实现高层语义与低层视觉特征映射,应用前景广阔... 国内IPTV业务发展迅速,运营商掌握了巨量的视频数据,对视频数据的高效分析、利用,可以提高用户体验,为广大用户以及社会各界提供更优质服务。基于语义的视频检索技术,可以使视频数据结构化,实现高层语义与低层视觉特征映射,应用前景广阔,或将成为运营商高效管理视频数据的必要手段。 展开更多
关键词 智能管道 高层语义 视频检索 特征提取 深度学习 大数据
下载PDF
应用多恰可感知失真等级的视频感知编码 被引量:1
13
作者 王健 万帅 +1 位作者 公衍超 赵晗 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2021年第9期11-16,共6页
为了对视频编码中的视觉感知冗余进行充分挖掘,提升视频的主观质量,根据人眼感知特性对视频内容进行分类,建立了一种更符合人眼感知的多恰可感知失真等级视频感知失真测度模型,并将其应用于高效视频编码(HEVC).通过改善传统编码器的比... 为了对视频编码中的视觉感知冗余进行充分挖掘,提升视频的主观质量,根据人眼感知特性对视频内容进行分类,建立了一种更符合人眼感知的多恰可感知失真等级视频感知失真测度模型,并将其应用于高效视频编码(HEVC).通过改善传统编码器的比特分配方式,对帧内编码帧与帧间编码帧分别进行处理,根据重分配的比特更新量化参数(QP),实现了视频感知编码.实验结果显示:与HEVC标准测试模型(HM)中的方法相比,提出的算法能够在近似同等的码率下获得更好的视频主观质量. 展开更多
关键词 视频编码 多恰可感知失真等级 感知编码 比特分配 高效视频编码(HEVC)
原文传递
视频流分片编码的无人机视频传输方法 被引量:3
14
作者 李亮亮 吕志刚 +2 位作者 郭锦 李晓艳 杨永侠 《激光与光电子学进展》 CSCD 北大核心 2020年第24期219-229,共11页
为了解决消费级无人机(UAV)视频图像在传输过程中出现的高时延、低可靠性等问题,提出一种适用于消费级无人机的视频传输算法。发送图像时,对视频流进行分帧分片,采用分量变换,对Y,Cr,Cb三分量进行三级离散小波正变换、位平面分解、组织... 为了解决消费级无人机(UAV)视频图像在传输过程中出现的高时延、低可靠性等问题,提出一种适用于消费级无人机的视频传输算法。发送图像时,对视频流进行分帧分片,采用分量变换,对Y,Cr,Cb三分量进行三级离散小波正变换、位平面分解、组织编码、并行传输处理。接收过程与发送过程相逆,将接收的完整图像存入二级缓存区以进行后续处理。小波变换保证了图像传输的可靠性,图像编码减轻了图像传输的负荷,图像并发及二级缓存接收进一步提高了图像的实时性。在传输距离为20m的WIFI环境下,对分辨率为640×480、1280×720图像分别进行测试。640×480图像下,接收帧率均值为47.7frame/s,时延均值为35.7ms,结构相似性(SSIM)均值为0.984,方均根误差(RMSE)均值为1.61;1280×720图像下,指标依次为28.8frame/s、45.9ms、0.978、2.68。实验结果表明,当消费级无人机在超低空拍摄时,所提算法能够满足高清视频流实时可靠传输的要求,也可应用在其他图像传输领域。 展开更多
关键词 图像处理 离散小波正变换 离散小波逆变换 图像二级缓存 小波逼近 高清视频传输
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部