期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
6
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
辅助足球视频切分的音频自动分类与分段
被引量:
2
1
作者
陈剑赟
李云浩
+2 位作者
吴玲达
老松扬
白亮
《国防科技大学学报》
EI
CAS
CSCD
北大核心
2004年第6期49-53,共5页
视频伴随音轨的自动分类与分段是辅助视频切分的一种有效手段。从足球视频的特征入手,归纳总结出足球视频中三类主要的音频类型,既而提出了基于HMM并且结合一定平滑策略的音频自动分类和分段的框架,在实现音频分类分段的同时完成了足球...
视频伴随音轨的自动分类与分段是辅助视频切分的一种有效手段。从足球视频的特征入手,归纳总结出足球视频中三类主要的音频类型,既而提出了基于HMM并且结合一定平滑策略的音频自动分类和分段的框架,在实现音频分类分段的同时完成了足球视频的切分。初步的实验结果验证了该方法的有效性和鲁棒性。
展开更多
关键词
音频分类与分段
HMM
足球
视频
视频切分
下载PDF
职称材料
基于CNN-BiGRU的足球视频片段分类方法
2
作者
苏航
张胜男
《计算机科学与应用》
2023年第3期369-377,共9页
基于深度学习的视频分类是体育视频研究的一个重要方向。针对目前视频事件类型识别率低的问题,本文提出了一种基于CNN-BiGRU网络的足球视频事件分类方法。该方法首先利用PySceneDetect工具的场景切换检测功能对完整足球视频进行镜头分割...
基于深度学习的视频分类是体育视频研究的一个重要方向。针对目前视频事件类型识别率低的问题,本文提出了一种基于CNN-BiGRU网络的足球视频事件分类方法。该方法首先利用PySceneDetect工具的场景切换检测功能对完整足球视频进行镜头分割,在此基础上构建包含五类足球事件的数据集;随后通过实验对比,选择将目前主流的卷积神经网络VGG16与BiGRU结合构建分类模型。实验结果表明,CNN与RNN的结合,解决了视频中时间维度利用不足的问题,更有效的整合足球视频中时间维度和空间维度的动态信息,实现比传统技术更高的精度和更快的速度。目前该模型对足球视频数据集上的某单一事件识别率最高达到97.4%。
展开更多
关键词
足球
视频
视频切分
视频
分类
深度学习
下载PDF
职称材料
足球视频镜头分类方法
被引量:
6
3
作者
林彬
刘群
+1 位作者
王群
聂燕柳
《计算机工程与设计》
CSCD
北大核心
2012年第4期1467-1471,共5页
根据视频语义分析和视频摘要等应用对于视频数据结构化的需求,提出了一种针对足球视频的镜头分类方法。通过logo模板匹配检测并定位出视频中的慢镜头,对其余的正常比赛部分做镜头边界检测完成视频切分。基于分块的思想,对正常比赛镜头...
根据视频语义分析和视频摘要等应用对于视频数据结构化的需求,提出了一种针对足球视频的镜头分类方法。通过logo模板匹配检测并定位出视频中的慢镜头,对其余的正常比赛部分做镜头边界检测完成视频切分。基于分块的思想,对正常比赛镜头帧计算其各块的场地像素比率值作为特征,利用SVM分类器将正常比赛镜头分为远镜头、中镜头、球员特写或场外镜头3类。至此,整个视频流可以表示为结构化的四类镜头类型标示序列。实验结果表明,该方法在视频切分和镜头类型识别的准确性方面具有良好的效果。
展开更多
关键词
足球
视频
镜头分类
视频切分
慢镜头
支持向量机
下载PDF
职称材料
基于动态贝叶斯网络的大词汇量连续语音识别和音素切分研究
被引量:
1
4
作者
吕国云
蒋冬梅
+2 位作者
张艳宁
赵荣椿
Hichem Sahli
《西北工业大学学报》
EI
CAS
CSCD
北大核心
2008年第2期173-178,共6页
提出一个新颖的单流多状态动态贝叶斯网络(Single stream Multi-states DynamicBayesian Network,SM-DBN)模型,以实现大词汇量连续语音识别和音素切分。该模型在Bilmes等人提出的单流动态贝叶斯网络(Single stream Dynamic Bayesian Net...
提出一个新颖的单流多状态动态贝叶斯网络(Single stream Multi-states DynamicBayesian Network,SM-DBN)模型,以实现大词汇量连续语音识别和音素切分。该模型在Bilmes等人提出的单流动态贝叶斯网络(Single stream Dynamic Bayesian Network,Phone-shared,SS-DBN-P)模型(识别基元为词)基础上,增加了一个隐含的状态节点层,每个词由它的对应音素组成,而音素采用固定个数的状态描述,状态和观测向量直接连接。它的识别基元为音素,描述了音素的动态发音变化过程。大词汇量语音识别的实验结果表明:在纯净语音环境下,SM-DBN模型的识别率比HMM和SS-DBN-P模型的识别率分别提高了13.01%和35.2%,而音频流的音素切分正确率则分别提高了10%和44%。
展开更多
关键词
动态贝叶斯网络
音
视频
语音识别音素
切分
下载PDF
职称材料
访谈类短视频标题自动生成方案的研究
5
作者
左丽娟
《计算机产品与流通》
2017年第11期158-158,共1页
以我本人比较喜欢的访谈类节目为例,探讨了自动切分生成小视频并自动生成标题的方案。提出了一种在无字幕情况下,结合对话信息的语音识别和视频人脸标注技术实现对访谈类视频进行切分和标注的方案。根据实验结果,本算法可以有效得完成...
以我本人比较喜欢的访谈类节目为例,探讨了自动切分生成小视频并自动生成标题的方案。提出了一种在无字幕情况下,结合对话信息的语音识别和视频人脸标注技术实现对访谈类视频进行切分和标注的方案。根据实验结果,本算法可以有效得完成对实验视频的切分和标注,具有推广的潜力。基于S4VM算法,实现了对上述方案的推广方案。可以使用少量的标注样本,较为准确的完成对同样信息不足难于处理的视频的切分和标注,兼顾了准确率和查全率。提出了一种基于LDA为视频自动生成标题的方案,兼顾长视频准确率的情况下,对短视频自动生成标题的效果有了较大的提升。
展开更多
关键词
主题发现
LDA
视频切分
视频
标注
标题自动生成
下载PDF
职称材料
现代舞台多屏幕文件播放及控管监系统存在的问题和解决方法
被引量:
2
6
作者
赵贵华
《演艺科技》
2021年第1期63-68,共6页
梳理现代舞台多屏幕文件播控系统存在的问题,提出舞台多屏幕系统自动安全监测和保障的解决方法,对视频切分系统和大屏幕播放系统的工作流程、系统功能、系统结构、监控手段等方面进行阐述,形成现代舞台多屏幕文件控管监系统设的计理念。
关键词
舞台多屏幕
视频切分
智能切换
视频
播放
舞台仿真
控管监系统
解决方案
下载PDF
职称材料
题名
辅助足球视频切分的音频自动分类与分段
被引量:
2
1
作者
陈剑赟
李云浩
吴玲达
老松扬
白亮
机构
国防科技大学人文与管理学院
出处
《国防科技大学学报》
EI
CAS
CSCD
北大核心
2004年第6期49-53,共5页
基金
国家自然科学基金资助项目(60473117)
文摘
视频伴随音轨的自动分类与分段是辅助视频切分的一种有效手段。从足球视频的特征入手,归纳总结出足球视频中三类主要的音频类型,既而提出了基于HMM并且结合一定平滑策略的音频自动分类和分段的框架,在实现音频分类分段的同时完成了足球视频的切分。初步的实验结果验证了该方法的有效性和鲁棒性。
关键词
音频分类与分段
HMM
足球
视频
视频切分
Keywords
audio classification and segmentation
HMM
soccer video
video structuring
分类号
TN941 [电子电信—信号与信息处理]
下载PDF
职称材料
题名
基于CNN-BiGRU的足球视频片段分类方法
2
作者
苏航
张胜男
机构
沈阳工业大学软件学院
出处
《计算机科学与应用》
2023年第3期369-377,共9页
文摘
基于深度学习的视频分类是体育视频研究的一个重要方向。针对目前视频事件类型识别率低的问题,本文提出了一种基于CNN-BiGRU网络的足球视频事件分类方法。该方法首先利用PySceneDetect工具的场景切换检测功能对完整足球视频进行镜头分割,在此基础上构建包含五类足球事件的数据集;随后通过实验对比,选择将目前主流的卷积神经网络VGG16与BiGRU结合构建分类模型。实验结果表明,CNN与RNN的结合,解决了视频中时间维度利用不足的问题,更有效的整合足球视频中时间维度和空间维度的动态信息,实现比传统技术更高的精度和更快的速度。目前该模型对足球视频数据集上的某单一事件识别率最高达到97.4%。
关键词
足球
视频
视频切分
视频
分类
深度学习
分类号
TP3 [自动化与计算机技术—计算机科学与技术]
下载PDF
职称材料
题名
足球视频镜头分类方法
被引量:
6
3
作者
林彬
刘群
王群
聂燕柳
机构
重庆邮电大学计算机科学与技术学院
出处
《计算机工程与设计》
CSCD
北大核心
2012年第4期1467-1471,共5页
基金
重庆市自然科学基金项目(CST2007BB2386)
重庆市科委应用基础研究基金项目(KJ070504)
重庆邮电大学博士启动基金项目(A2009-10)
文摘
根据视频语义分析和视频摘要等应用对于视频数据结构化的需求,提出了一种针对足球视频的镜头分类方法。通过logo模板匹配检测并定位出视频中的慢镜头,对其余的正常比赛部分做镜头边界检测完成视频切分。基于分块的思想,对正常比赛镜头帧计算其各块的场地像素比率值作为特征,利用SVM分类器将正常比赛镜头分为远镜头、中镜头、球员特写或场外镜头3类。至此,整个视频流可以表示为结构化的四类镜头类型标示序列。实验结果表明,该方法在视频切分和镜头类型识别的准确性方面具有良好的效果。
关键词
足球
视频
镜头分类
视频切分
慢镜头
支持向量机
Keywords
soccer video
shot classification
video segmentation
slow motion replay
support vector machine (SVM)
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于动态贝叶斯网络的大词汇量连续语音识别和音素切分研究
被引量:
1
4
作者
吕国云
蒋冬梅
张艳宁
赵荣椿
Hichem Sahli
机构
西北工业大学计算机学院
布鲁塞尔自由大学电子与信息处理系
出处
《西北工业大学学报》
EI
CAS
CSCD
北大核心
2008年第2期173-178,共6页
基金
中国科技部与比利时国际合作项目(No.[2004]487)资助
文摘
提出一个新颖的单流多状态动态贝叶斯网络(Single stream Multi-states DynamicBayesian Network,SM-DBN)模型,以实现大词汇量连续语音识别和音素切分。该模型在Bilmes等人提出的单流动态贝叶斯网络(Single stream Dynamic Bayesian Network,Phone-shared,SS-DBN-P)模型(识别基元为词)基础上,增加了一个隐含的状态节点层,每个词由它的对应音素组成,而音素采用固定个数的状态描述,状态和观测向量直接连接。它的识别基元为音素,描述了音素的动态发音变化过程。大词汇量语音识别的实验结果表明:在纯净语音环境下,SM-DBN模型的识别率比HMM和SS-DBN-P模型的识别率分别提高了13.01%和35.2%,而音频流的音素切分正确率则分别提高了10%和44%。
关键词
动态贝叶斯网络
音
视频
语音识别音素
切分
Keywords
single-stream multi-state dynamic Bayesian network (SM-DBN), continuous speechrecognition, phone segmentation
分类号
TP391.42 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
访谈类短视频标题自动生成方案的研究
5
作者
左丽娟
机构
中国矿业大学(北京)
出处
《计算机产品与流通》
2017年第11期158-158,共1页
文摘
以我本人比较喜欢的访谈类节目为例,探讨了自动切分生成小视频并自动生成标题的方案。提出了一种在无字幕情况下,结合对话信息的语音识别和视频人脸标注技术实现对访谈类视频进行切分和标注的方案。根据实验结果,本算法可以有效得完成对实验视频的切分和标注,具有推广的潜力。基于S4VM算法,实现了对上述方案的推广方案。可以使用少量的标注样本,较为准确的完成对同样信息不足难于处理的视频的切分和标注,兼顾了准确率和查全率。提出了一种基于LDA为视频自动生成标题的方案,兼顾长视频准确率的情况下,对短视频自动生成标题的效果有了较大的提升。
关键词
主题发现
LDA
视频切分
视频
标注
标题自动生成
分类号
TP391.41 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
现代舞台多屏幕文件播放及控管监系统存在的问题和解决方法
被引量:
2
6
作者
赵贵华
机构
中央广播电视总台
出处
《演艺科技》
2021年第1期63-68,共6页
文摘
梳理现代舞台多屏幕文件播控系统存在的问题,提出舞台多屏幕系统自动安全监测和保障的解决方法,对视频切分系统和大屏幕播放系统的工作流程、系统功能、系统结构、监控手段等方面进行阐述,形成现代舞台多屏幕文件控管监系统设的计理念。
关键词
舞台多屏幕
视频切分
智能切换
视频
播放
舞台仿真
控管监系统
解决方案
Keywords
stage multi-screen
video segmentation
intelligent switching
video playback
stage simulation
control,management and monitoring
the solution
分类号
TM923.34 [电气工程—电力电子与电力传动]
J813 [艺术—戏剧戏曲]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
辅助足球视频切分的音频自动分类与分段
陈剑赟
李云浩
吴玲达
老松扬
白亮
《国防科技大学学报》
EI
CAS
CSCD
北大核心
2004
2
下载PDF
职称材料
2
基于CNN-BiGRU的足球视频片段分类方法
苏航
张胜男
《计算机科学与应用》
2023
0
下载PDF
职称材料
3
足球视频镜头分类方法
林彬
刘群
王群
聂燕柳
《计算机工程与设计》
CSCD
北大核心
2012
6
下载PDF
职称材料
4
基于动态贝叶斯网络的大词汇量连续语音识别和音素切分研究
吕国云
蒋冬梅
张艳宁
赵荣椿
Hichem Sahli
《西北工业大学学报》
EI
CAS
CSCD
北大核心
2008
1
下载PDF
职称材料
5
访谈类短视频标题自动生成方案的研究
左丽娟
《计算机产品与流通》
2017
0
下载PDF
职称材料
6
现代舞台多屏幕文件播放及控管监系统存在的问题和解决方法
赵贵华
《演艺科技》
2021
2
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部