期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
3
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
长视频的超级帧切割视觉内容解释方法
1
作者
魏英姿
刘王杰
《北京工业大学学报》
CAS
CSCD
北大核心
2024年第7期805-813,共9页
针对现有基于编码解码的视频描述方法存在的对视频较长、在视频场景切换频繁情况下视觉特征提取能力不足或关键性片段捕获能力不足等视频描述不佳的问题,提出一种基于超级帧切割长视频的视频字幕方法。首先,提出超级帧提取算法,计算关...
针对现有基于编码解码的视频描述方法存在的对视频较长、在视频场景切换频繁情况下视觉特征提取能力不足或关键性片段捕获能力不足等视频描述不佳的问题,提出一种基于超级帧切割长视频的视频字幕方法。首先,提出超级帧提取算法,计算关键视频时间占比率以满足视频浏览时长限制,缩短视频检索时间。然后,构建两层筛选模型以自适应提取超级帧,过滤冗余关键帧,执行多场景语义描述。将保留的关键帧嵌入周围帧,利用深层网络模型以及小卷积核池化采样域获取更多的视频特征,克服了经典视频标题方法不能直接用于处理长视频的困难。最后,通过用长短时记忆模型代替循环神经网络解码生成视频标题,给出视频内容的分段解释信息。在YouTube数据集视频、合成视频和监控长视频上进行测试,采用多种机器翻译评价指标评估了该方法的性能,均获得了不同程度的提升。实验结果表明,该方法在应对视频场景切换频繁、视频较长等挑战时,能够获得较好的片段描述。
展开更多
关键词
超级帧
切割
时间占比率
多场景语义
视觉特征
长短时记忆模型
视频标题
下载PDF
职称材料
极低速率语音编码中LSP参数的高效量化算法
被引量:
4
2
作者
李军林
崔慧娟
唐昆
《清华大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2004年第10期1422-1425,共4页
为在极低速率下实现高质量的语音编码,提出了一种新的有效的线谱对(LSP)参数量化算法——P-RS-MSMQ算法。此算法以多帧联合矩阵量化作为基本框架,引入了基于超级帧模式的均值去除和帧间预测策略、矩阵分裂和子矩阵多级量化策略;同时提...
为在极低速率下实现高质量的语音编码,提出了一种新的有效的线谱对(LSP)参数量化算法——P-RS-MSMQ算法。此算法以多帧联合矩阵量化作为基本框架,引入了基于超级帧模式的均值去除和帧间预测策略、矩阵分裂和子矩阵多级量化策略;同时提出了基于语音帧短时谱能量的帧内加权和基于超级帧中各子帧重要性的帧间加权策略等。实验表明:此算法能够在700b/s的速率下获得接近透明量化的性能;即使在300~400b/s的极低速率下也具有较高质量的量化效果。因此该算法的实现对极低速率语音编码算法的研究具有重要的意义。
展开更多
关键词
语音编码
线谱对
超级帧
矩阵量化
原文传递
一种基于MELP的600b/s极低速率语音编码
被引量:
3
3
作者
马庆利
季新生
+1 位作者
张连海
刘成群
《通信技术》
2009年第7期268-270,共3页
为满足无线通信的要求,文中在传统的MELP的基础上,提出了一种速率为600b/s的语音编码算法。该算法利用帧间冗余,把连续的4帧构成一个超级帧进行联合量化。对线谱对采用两帧联合量化、双向线性内插技术,对能量参数采用分离均值矢量量化...
为满足无线通信的要求,文中在传统的MELP的基础上,提出了一种速率为600b/s的语音编码算法。该算法利用帧间冗余,把连续的4帧构成一个超级帧进行联合量化。对线谱对采用两帧联合量化、双向线性内插技术,对能量参数采用分离均值矢量量化等技术。仿真实验证明该语音编码算法有较好质量。
展开更多
关键词
语音编码
多
帧
联合量化
超级帧
原文传递
题名
长视频的超级帧切割视觉内容解释方法
1
作者
魏英姿
刘王杰
机构
沈阳理工大学信息科学与工程学院
出处
《北京工业大学学报》
CAS
CSCD
北大核心
2024年第7期805-813,共9页
基金
辽宁省教育厅高等学校基本科研资助项目(LJKZ0267)。
文摘
针对现有基于编码解码的视频描述方法存在的对视频较长、在视频场景切换频繁情况下视觉特征提取能力不足或关键性片段捕获能力不足等视频描述不佳的问题,提出一种基于超级帧切割长视频的视频字幕方法。首先,提出超级帧提取算法,计算关键视频时间占比率以满足视频浏览时长限制,缩短视频检索时间。然后,构建两层筛选模型以自适应提取超级帧,过滤冗余关键帧,执行多场景语义描述。将保留的关键帧嵌入周围帧,利用深层网络模型以及小卷积核池化采样域获取更多的视频特征,克服了经典视频标题方法不能直接用于处理长视频的困难。最后,通过用长短时记忆模型代替循环神经网络解码生成视频标题,给出视频内容的分段解释信息。在YouTube数据集视频、合成视频和监控长视频上进行测试,采用多种机器翻译评价指标评估了该方法的性能,均获得了不同程度的提升。实验结果表明,该方法在应对视频场景切换频繁、视频较长等挑战时,能够获得较好的片段描述。
关键词
超级帧
切割
时间占比率
多场景语义
视觉特征
长短时记忆模型
视频标题
Keywords
superframe cutting
time ratio
multi-scene semantics
visual features
long and short-term memory model
video captioning
分类号
TP399 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
极低速率语音编码中LSP参数的高效量化算法
被引量:
4
2
作者
李军林
崔慧娟
唐昆
机构
清华大学电子工程系微波与数字通信技术国家重点实验室
出处
《清华大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2004年第10期1422-1425,共4页
基金
国家自然科学基金资助项目(69972020)
文摘
为在极低速率下实现高质量的语音编码,提出了一种新的有效的线谱对(LSP)参数量化算法——P-RS-MSMQ算法。此算法以多帧联合矩阵量化作为基本框架,引入了基于超级帧模式的均值去除和帧间预测策略、矩阵分裂和子矩阵多级量化策略;同时提出了基于语音帧短时谱能量的帧内加权和基于超级帧中各子帧重要性的帧间加权策略等。实验表明:此算法能够在700b/s的速率下获得接近透明量化的性能;即使在300~400b/s的极低速率下也具有较高质量的量化效果。因此该算法的实现对极低速率语音编码算法的研究具有重要的意义。
关键词
语音编码
线谱对
超级帧
矩阵量化
Keywords
speech coding
line spectrum pairs
super-frame
matrix quantization
分类号
TN912.3 [电子电信—通信与信息系统]
原文传递
题名
一种基于MELP的600b/s极低速率语音编码
被引量:
3
3
作者
马庆利
季新生
张连海
刘成群
机构
解放军信息工程大学信息工程学院
中国人民解放军
出处
《通信技术》
2009年第7期268-270,共3页
文摘
为满足无线通信的要求,文中在传统的MELP的基础上,提出了一种速率为600b/s的语音编码算法。该算法利用帧间冗余,把连续的4帧构成一个超级帧进行联合量化。对线谱对采用两帧联合量化、双向线性内插技术,对能量参数采用分离均值矢量量化等技术。仿真实验证明该语音编码算法有较好质量。
关键词
语音编码
多
帧
联合量化
超级帧
Keywords
speech coding
multi-frame joint quantization
superframe
分类号
TN912.3 [电子电信—通信与信息系统]
原文传递
题名
作者
出处
发文年
被引量
操作
1
长视频的超级帧切割视觉内容解释方法
魏英姿
刘王杰
《北京工业大学学报》
CAS
CSCD
北大核心
2024
0
下载PDF
职称材料
2
极低速率语音编码中LSP参数的高效量化算法
李军林
崔慧娟
唐昆
《清华大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2004
4
原文传递
3
一种基于MELP的600b/s极低速率语音编码
马庆利
季新生
张连海
刘成群
《通信技术》
2009
3
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部