期刊文献+
共找到16篇文章
< 1 >
每页显示 20 50 100
基于深度双向模型和特征融合的视频转文字研究 被引量:1
1
作者 宁培阳 史景伦 +1 位作者 张荣锋 邱威 《计算机应用研究》 CSCD 北大核心 2020年第1期317-320,共4页
自动生成视频的自然语言描述是一个非常具有挑战性的研究热点。基于深度BLSTM模型和CNN特征的方法,能够学习到视频序列的全局时空关联信息。针对视频转文字时面临的准确率低以及计算复杂度高的问题,提出了深度BMGU模型,从而在保持深度BL... 自动生成视频的自然语言描述是一个非常具有挑战性的研究热点。基于深度BLSTM模型和CNN特征的方法,能够学习到视频序列的全局时空关联信息。针对视频转文字时面临的准确率低以及计算复杂度高的问题,提出了深度BMGU模型,从而在保持深度BLSTM模型结构优势的同时提高计算效率;还将原始视频帧的CNN特征与经过Haar特征预处理后的视频的CNN特征进行后期融合,从而增加了训练特征的多样性,进而提升了视频转自然语言的实验效果。在M-VAD和MPII-MD数据集中,相对原S2VT模型,所提方法分别将METEOR分数从6.7和7.1提高到8.0和8.3。结果表明所提方法有效地改善了原S2VT模型的准确率和语言描述效果。 展开更多
关键词 视频转文字 深度双向模型 哈尔特征 特征融合 卷积神经网络
下载PDF
基于自适应帧采样算法和BLSTM的视频转文字研究 被引量:1
2
作者 张荣锋 宁培阳 +2 位作者 肖焕侯 史景伦 邱威 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2018年第1期103-111,共9页
针对视频转文字(video to text)存在的建模复杂和准确率低的问题,提出了基于自适应帧采样算法和双向长短时记忆模型的视频转文字方法.自适应帧采样算法能够动态地调整采样率,以提供尽量多的特征来训练模型;结合双向长短时记忆模型,能有... 针对视频转文字(video to text)存在的建模复杂和准确率低的问题,提出了基于自适应帧采样算法和双向长短时记忆模型的视频转文字方法.自适应帧采样算法能够动态地调整采样率,以提供尽量多的特征来训练模型;结合双向长短时记忆模型,能有效学习视频中前面帧和未来帧的相关信息;同时,用于训练的特征是来自深度卷积神经网络的特征,使得这种双深度的网络结构能够学习视频帧在时空上的关联表示及全局依赖信息;帧信息的融合又增加了特征的种类,从而提升了实验效果.结果显示,在M-VAD和MPIIMD两个数据集中,文中的方法在METEOR中的评分均值分别为7.8%和8.6%,相对原S2VT模型分别提高了16.4%和21.1%,也提升了视频转文字的语言效果. 展开更多
关键词 视频转文字 自适应帧采样 双向长短时记忆模型 深度卷积神经网络 帧信息的融合
下载PDF
使用PSNR周期特性检测视频帧率上转伪造 被引量:2
3
作者 夏明 杨高波 黄勤珍 《计算机应用研究》 CSCD 北大核心 2016年第8期2409-2412,共4页
帧率上转(FRUC)是最常用的一种视频编辑技术,它在原始视频帧间周期性地插入新的帧,以便增加视频的帧率,这种技术经常用于两段不同帧率的视频拼接伪造中。为了减少视觉痕迹,高级的FRUC方法通常采用运动补偿的插值方式,这也带来了针对这... 帧率上转(FRUC)是最常用的一种视频编辑技术,它在原始视频帧间周期性地插入新的帧,以便增加视频的帧率,这种技术经常用于两段不同帧率的视频拼接伪造中。为了减少视觉痕迹,高级的FRUC方法通常采用运动补偿的插值方式,这也带来了针对这种插值伪造检测的挑战。提出一种新的简单但有效的方法,可正确检测出这种伪造,并能估计出视频的原始帧率。该方法利用了FRUC算法生成的插值帧与相邻原始帧构成的视频序列再次插值重建得到的帧对在PSNR上的周期性差异。测试序列的实验结果表明该方法检测准确率高,其中对有损压缩视频序列的测试结果进一步证实了该方法的实际使用价值。 展开更多
关键词 视频帧率上 运动补偿 峰值信噪比 视频被动取证
下载PDF
流动的性别:同人性转视频中的阈限空间生成与阈限体验
4
作者 李姗珊 《东南传播》 2021年第5期26-29,共4页
本文通过对同人性转视频的研究,考察了中国的粉丝文化所具有的特殊性别实践形式。并发现,通过逃逸出原文本的性别叙事与文本背后的社会文化环境这两种结构性状态,粉丝剪辑的同人性转视频得以生成了一个阈限空间。围绕这一阈限空间,粉丝... 本文通过对同人性转视频的研究,考察了中国的粉丝文化所具有的特殊性别实践形式。并发现,通过逃逸出原文本的性别叙事与文本背后的社会文化环境这两种结构性状态,粉丝剪辑的同人性转视频得以生成了一个阈限空间。围绕这一阈限空间,粉丝与视频观众获得了"地位上升与逆转"、"通过‘嗑CP’的精神狂欢与‘舔颜’的符号狂欢所进行的审美消费"这两种程度不一的阈限体验。本文认为,同人性转视频虽然不具备政治上完全的颠覆意义,却为我们拥有更多关于性别上的可能性提供了有益的假设。 展开更多
关键词 粉丝文化 同人性视频 阈限空间 阈限体验
下载PDF
媒资价值开发中电视节目的音频二创探究
5
作者 刘菁 《新闻研究导刊》 2023年第7期150-153,共4页
传统广播电视在互联网时代面对巨大挑战的同时也迎来机遇,众多广电人都在探索对接互联网、发展融媒体的方式。无论是传统广电还是互联网新兴媒体,“内容为王”都是颠扑不破的真理。如何将内容变为“产品”,以市场方式全平台运营,是广播... 传统广播电视在互联网时代面对巨大挑战的同时也迎来机遇,众多广电人都在探索对接互联网、发展融媒体的方式。无论是传统广电还是互联网新兴媒体,“内容为王”都是颠扑不破的真理。如何将内容变为“产品”,以市场方式全平台运营,是广播电视面临的一大困境。其中主要矛盾包括“以创作者为主”与“以受众兴趣”为主的制作目标、优质的内容与市场份额急剧下降的传播渠道、海量的宝贵媒资与高难度的版权确权等。面对这些矛盾,选取受欢迎的电视栏目,对其音频进行适合互联网传播的二次创作,成为新的解决路径。对类似项目进行二创,有项目制作难度低、选取范围广、低成本高产量等优点,对这些产品进行全媒体分发,不仅可以在多平台扩大受众群体,更可以为存量媒资开发探索路径,并集中力量将传统媒体拥有的品牌做大做强。文章通过对多家广播电视台音频产品的调查对比,针对不同制作条件和版权情况,总结粗编、精编等数种音频二创方式,并由此探究传统广电目前的深层次问题:版权模糊、成本有限、制作模式传统等。同时,根据北京广播电视台的实际经验提出应对策略:以需求带动生产,以点带面突破;抛弃传统思维,以市场为标杆;充分利用现有内外部资源,包括人力、技术、社会影响力等,以商品带动精品。 展开更多
关键词 媒资价值 媒资开发 媒体融合 视频转音频 音频二创
下载PDF
一种适用于多种场景的深度图提取算法 被引量:1
6
作者 杨依忠 马茏 +1 位作者 徐逸琛 张强 《合肥工业大学学报(自然科学版)》 CAS 北大核心 2017年第9期1220-1225,共6页
文章提出了一种自动的深度图提取算法。将图片分为消失线型、上下结构型和左右结构型3类,采取不同的算法分别进行深度估计,为了使得图像中同一物体的深度信息保持一致,运用K-means进行图像分割,提出了一种新颖的估算每个像素点深度值的... 文章提出了一种自动的深度图提取算法。将图片分为消失线型、上下结构型和左右结构型3类,采取不同的算法分别进行深度估计,为了使得图像中同一物体的深度信息保持一致,运用K-means进行图像分割,提出了一种新颖的估算每个像素点深度值的算法,使得深度信息的层次不再局限于K-means中K的取值;采用了双边滤波的方法对得到的深度图进行去噪,在去噪的同时保证了图像的边缘轮廓。实验结果表明,该算法适用性广泛,在3D效果和耗时方面也表现出优良的性能,适合于实时的2D视频转3D视频。 展开更多
关键词 2D视频转3D视频 深度图 分类 相对高度K-means
下载PDF
一种二维图像序列的深度图像生成方法 被引量:2
7
作者 罗莎莎 郭太良 《计算机与现代化》 2012年第5期39-41,共3页
针对二维图像序列提出一种基于运动对象的深度图像生成方法。采用改进的均方差累加算法提取背景模型,并利用背景差分法提取运动对象图形,将人工绘制的背景模型的深度图像,结合每帧运动对象图形深度赋值,自动合成用于二维视频到三维视频... 针对二维图像序列提出一种基于运动对象的深度图像生成方法。采用改进的均方差累加算法提取背景模型,并利用背景差分法提取运动对象图形,将人工绘制的背景模型的深度图像,结合每帧运动对象图形深度赋值,自动合成用于二维视频到三维视频转换的图像序列的深度图像。实验结果证明,相对于传统的仅仅依靠计算机视觉获取深度图像的方法,它获得的深度图像,不仅画面的深度信息真实、可靠,而且转换后的三维场景更立体化。 展开更多
关键词 深度图像 二维视频转三维视频 背景差分
下载PDF
基于图像分割的金字塔Lucas-Kanade光流法提取深度信息 被引量:13
8
作者 李亚楠 赵耀 +2 位作者 林春雨 白慧慧 刘美琴 《铁道学报》 EI CAS CSCD 北大核心 2015年第1期63-68,共6页
在2D到3D视频的转换过程中,深度信息的提取是最关键的问题。本文利用图像分割的金字塔LucasKanade光流法提取2D视频中的深度信息,主要做了如下工作:1是通过计算当前帧的最大运动矢量来决定所需构建的金字塔层数,通过自适应的方式决定金... 在2D到3D视频的转换过程中,深度信息的提取是最关键的问题。本文利用图像分割的金字塔LucasKanade光流法提取2D视频中的深度信息,主要做了如下工作:1是通过计算当前帧的最大运动矢量来决定所需构建的金字塔层数,通过自适应的方式决定金字塔层数可以弥补因金字塔层数过多造成的信息丢失或者因金字塔层数过少而无法满足Lucas-Kanade光流算法的不足;2是在每层金字塔中,利用Mean Shift图像分割后的信息,去除本次迭代计算得到的运动矢量中的坏点,使得深度提取更加准确;3是自适应地调整每层金字塔的迭代次数,使得在实验结果的质量几乎不变的情况下,达到降低时间复杂度的目的;最后通过统计图像分割每类中的深度值对所得到的深度图进行优化,使得最终得到的深度图中物体边缘信息更加清晰。实验结果表明,利用本文算法所得到的场景深度的边缘信息更加清晰,深度图中的坏点明显减少,在降低时间复杂度的同时,得到了较高质量的深度图。 展开更多
关键词 2D3D视频技术 金字塔 Lucas-Kanade光流法 Mean Shift图像分割 运动估计 深度信息
下载PDF
互联网实现电视直播中实时插播异地片断的实践 被引量:1
9
作者 杨光明 《电视字幕.特技与动画》 2009年第3期62-65,共4页
本文介绍了利用互联网技术,将异地实况现场片断以电子邮件方式传回位于北京中国棋院的贵州电视台制作中心,再利用VGA转换器将模拟信号送入该制作中心的数字系统EFP,将在上海围棋比赛的现场实况插入北京制作中心的对局讲解直播节目中,使... 本文介绍了利用互联网技术,将异地实况现场片断以电子邮件方式传回位于北京中国棋院的贵州电视台制作中心,再利用VGA转换器将模拟信号送入该制作中心的数字系统EFP,将在上海围棋比赛的现场实况插入北京制作中心的对局讲解直播节目中,使用这种方法可以快捷、实时、经济地插入异地实况片断。 展开更多
关键词 数字EFP系统 数字视频转 VGA换器 8960DEC+8900FSS 光端机 编码器 网络适配器 光兼容传输设备(OPTIX155/622h METER 1 000)
下载PDF
海量音乐随身装——iPod 80G
10
作者 wek 《大众数码》 2007年第3期92-92,共1页
毫无疑问,苹果公司推出的音乐播放器iPod已经融入了我们的生活。现在的iPod产品家族丰富多彩,漂亮迷人的iPod nano、小巧灵活的iPod shuffle,当然还有今天的主角——全能的iPod。现在的iPod已经抛弃了之前Photo、Video等纷繁的称号,统... 毫无疑问,苹果公司推出的音乐播放器iPod已经融入了我们的生活。现在的iPod产品家族丰富多彩,漂亮迷人的iPod nano、小巧灵活的iPod shuffle,当然还有今天的主角——全能的iPod。现在的iPod已经抛弃了之前Photo、Video等纷繁的称号,统一回归iPod这个简单而深具影响力的名称。 展开更多
关键词 音乐播放器 SHUFFLE 小巧灵活 产品家族 IPOD 80G 比特率 视频功能 编码格式 视频转
下载PDF
A Wipe Transition Detection Approach Using Macroblock Type Information for MPEG Videos 被引量:1
11
作者 王建 周源华 周磊 《Journal of Shanghai Jiaotong university(Science)》 EI 2006年第3期351-355,共5页
A new wipe transition detection approach was proposed. By analyzing the spatial-temporal characteristics of an ideal wipe production model, the concept of wipe transition strip (TS) was introduced. The macroblock type... A new wipe transition detection approach was proposed. By analyzing the spatial-temporal characteristics of an ideal wipe production model, the concept of wipe transition strip (TS) was introduced. The macroblock type information of P-frames is used to extract TS regions. An improved TS region accumulation technique is performed for detecting and verifying wipe transitions. The experimental results indicate that the proposed approach is capable of detecting various wipe transitions quickly and accurately. 展开更多
关键词 MPEG videos wipe transition detection macroblock type information transition strip
下载PDF
A Distributed 2D-to-3D Video Conversion System 被引量:1
12
作者 张哲斌 张吉安 +2 位作者 张学西 王亦洲 高文 《China Communications》 SCIE CSCD 2013年第5期30-38,共9页
2D-to-3D video conversion is a feasible way to generate 3D programs for the current 3DTV industry. However, for large-scale 3D video production, current systems are no longer adequate in terms of the time and labor re... 2D-to-3D video conversion is a feasible way to generate 3D programs for the current 3DTV industry. However, for large-scale 3D video production, current systems are no longer adequate in terms of the time and labor required for conversion. In this paper, we introduce a distributed 2D-to-3D video conversion system that includes a 2D-to-3D video conversion module, architecture of the parallel computation on the cloud, and 3D video coding in the system. The system enables cooperation among multiple users in the simultaneous completion of their conversion tasks so that the conversion efficiency is greatly promoted. In the experiments, we evaluate the system based on criteria related to both time consumption and video coding performance. 展开更多
关键词 3D video 2D-to-3D conversion distributed system
下载PDF
A framework to create video-transition effects
13
作者 卜佳俊 赵传禹 陈纯 《Journal of Zhejiang University-Science A(Applied Physics & Engineering)》 SCIE EI CAS CSCD 2005年第B08期58-65,共8页
The paper presents a framework for developing a variety of video transition effects. The framework is designed to deal with the problem of inefficiency for programmers to generate more and more diversified video trans... The paper presents a framework for developing a variety of video transition effects. The framework is designed to deal with the problem of inefficiency for programmers to generate more and more diversified video transition, which is caused by excessive coupling between the sub-modules of the system. So the framework is designed to be modular, flexible and extensible. Based on the analysis of common features of different effects, the implementation of video transition effect is divided into 4 sub-odules, each of which can be designed and developed independently. Furthermore, these sub-modules can be easily sub- stituted, modified and reused. We present a formal description of our framework, and give typical study cases to show the extensive utility of the framework. 展开更多
关键词 Video transition FRAMEWORK Mapping method Source region Target region
下载PDF
Pseudo-Magnetotelluric 2D Inversion Technology of Magnetic-Source Transient Electromagnetics
14
作者 Han Zi-qiang Jiang Shu-ping Fengbing 《Applied Geophysics》 SCIE CSCD 2020年第5期784-795,903,共13页
Based on the fact that it is diffi cult to implement optimum inversion using 2D and 3D forward modeling with magnetic-source transient electromagnetics(TEM),this paper explores a novel approach to the implementation o... Based on the fact that it is diffi cult to implement optimum inversion using 2D and 3D forward modeling with magnetic-source transient electromagnetics(TEM),this paper explores a novel approach to the implementation of 2D magnetic-source TEM inversion.In particular,we converted magnetic-source TEM data into magnetotelluric(MT)data and then used a 2D MT inversion method to implement a 2D magnetic-source TEM inversion interpretation.First,we studied the similarity between magnetic-source TEM waves and MT waves and between magnetic-source TEM all-time apparent resistivity and MT Cagniard apparent resistivity.Then,we selected an optimal time-frequency transformation coeffi cient to implement rapid time-frequency transformation of all-time TEM apparent resistivity to MT Cagniard apparent resistivity.Afterward,we conducted 1D pseudo-MT inversions of magnetic-source 1D TEM theoretical models.The 1D inversion results demonstrated that the diff erence between the inversion parameters and model parameters was small,while the MT 1D inversion method could be used to conduct magnetic 1D TEM inversion within a certain margin of error.We further conducted 2D pseudo-MT inversions of 3D magnetic-source TEM theoretical models,and the 2D inversion results indicated that selecting a joint 2D pseudo-MT transverse-electric(TE)and transverse-magnetic(TM)inversion method based on measuring the line above a 3D anomalous body can help to accurately implement a 2D inversion interpretation of the 3D TEM response. 展开更多
关键词 TEM MT All-time apparent resistivity Time–frequency transformation 2D pseudo-MT inversion
下载PDF
Efficient video downscaling transcoder from MPEG-2 to H.264
15
作者 Xiang-wen WANG Jun SUN +1 位作者 Rong XIE Song-yu YU 《Journal of Zhejiang University-Science A(Applied Physics & Engineering)》 SCIE EI CAS CSCD 2008年第4期457-463,共7页
The new H.264 video coding standard achieves significantly higher compression performance than MPEG-2. As the MPEG-2 is popular in digital TV, DVD, etc., bandwidth or memory space can be saved by transcoding those str... The new H.264 video coding standard achieves significantly higher compression performance than MPEG-2. As the MPEG-2 is popular in digital TV, DVD, etc., bandwidth or memory space can be saved by transcoding those streams into H.264 in these applications. Unfortunately, the huge complexity keeps transcoding from being widely used in practical applications. This paper proposes an efficient transcoding architecture with a smart downscaling decoder and a fast mode decision algorithm. Using the proposed architecture, huge buffering memory space is saved and the transcoding complexity is reduced. Performance of the proposed fast mode decision algorithm is validated by experiments. 展开更多
关键词 Video transcoding Mode decision Edge direction analysis
下载PDF
一种有线电视加扰系统
16
作者 罗钦骑 容太平 《电缆电视》 1995年第1期1-4,共4页
本文介绍了一种用于有线电视网的付费电视加扰系统,阐明了用户管理的方法,分析了加扰和解扰的基本原理,给出了有关硬件框图和部分软件流程。
关键词 同步头压缩 视频极性反 有线电视 加扰系统
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部