期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于深度生成模型的视觉模式表示与编码
1
作者
郭怡琳
常建慧
+1 位作者
黄成
马思伟
《中兴通讯技术》
北大核心
2024年第S01期60-66,共7页
认为早期智能编码方法的性能受限于手工设计的方案,当前基于神经网络的编码方法可解释性不足,不利于后续面向人机视觉的分析与交互。受生成模型的启发,生成式编码方法通过构建生成模型来实现图像和视频的压缩和合成,获得可解释的紧凑视...
认为早期智能编码方法的性能受限于手工设计的方案,当前基于神经网络的编码方法可解释性不足,不利于后续面向人机视觉的分析与交互。受生成模型的启发,生成式编码方法通过构建生成模型来实现图像和视频的压缩和合成,获得可解释的紧凑视觉表示并生成符合图像先验分布的高视觉质量内容。其中概念图像编码与概念视频编码利用生成模型强大的样本生成能力与紧凑层次视觉表示模型,实现了编码性能更优的图像与视频编码;跨模态语义编码对图像与文本域进行跨模态转换与编码,保持可解释的同时实现上千倍的超高压缩比与令人满意的重构结果。
展开更多
关键词
智能视频编码
生成式编码
跨模态压缩
概念编码
下载PDF
职称材料
题名
基于深度生成模型的视觉模式表示与编码
1
作者
郭怡琳
常建慧
黄成
马思伟
机构
北京大学深圳研究生院
北京大学
中兴通讯股份有限公司
鹏城实验室
出处
《中兴通讯技术》
北大核心
2024年第S01期60-66,共7页
基金
国家自然科学基金项目(62025101)
鹏城实验室重大攻关项目(PCL2024A02)。
文摘
认为早期智能编码方法的性能受限于手工设计的方案,当前基于神经网络的编码方法可解释性不足,不利于后续面向人机视觉的分析与交互。受生成模型的启发,生成式编码方法通过构建生成模型来实现图像和视频的压缩和合成,获得可解释的紧凑视觉表示并生成符合图像先验分布的高视觉质量内容。其中概念图像编码与概念视频编码利用生成模型强大的样本生成能力与紧凑层次视觉表示模型,实现了编码性能更优的图像与视频编码;跨模态语义编码对图像与文本域进行跨模态转换与编码,保持可解释的同时实现上千倍的超高压缩比与令人满意的重构结果。
关键词
智能视频编码
生成式编码
跨模态压缩
概念编码
Keywords
intelligent video encoding
generative encoding
cross-modal compression
conceptual coding
分类号
TP3 [自动化与计算机技术—计算机科学与技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于深度生成模型的视觉模式表示与编码
郭怡琳
常建慧
黄成
马思伟
《中兴通讯技术》
北大核心
2024
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部