检索结果-维普期刊中文期刊服务平台

期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

共找到9篇文章

< 1 >

每页显示 20 50 100

已选择0条

导出题录引用分析

统计分析

显示方式：

文摘详细列表

相关度排序被引量排序时效性排序

跨语言知识蒸馏的视频中文字幕生成被引量：4: 1; 作者侯静怡齐雅昀 +1 位作者吴心筱贾云得《计算机学报》 EI CAS CSCD 北大核心 2021年第9期1907-1921,共15页; 视频字幕生成(video captioning)在视频推荐、辅助视觉、人机交互等领域具有广泛的应用前景.目前已有大量的视频英文字幕生成方法和数据,通过机器翻译视频英文字幕可以实现视频中文字幕的生成.然而,中西方文化差异和机器翻译算法性能都... 展开更多; 关键词中文字幕生成视频理解知识蒸馏视频中英字幕数据集特权信息; 下载PDF 职称材料

全自动中文新闻字幕生成系统的设计与实现: 2; 作者郑李磊谢磊 +3 位作者芦咪咪王晓暄杨玉莲张艳宁《电子学报》 EI CAS CSCD 北大核心 2011年第A03期69-74,共6页; 本文设计与实现了一个全自动中文新闻字幕生成系统,输入为新闻视频,输出为视频对应的字幕文本.以《新闻联播》为语料,实现了音频提取、音频分类与切分、说话人识别、大词汇量连续语音识别、视频文件的播放和文本字幕的自动生成等多项功... 展开更多; 关键词语音识别广播新闻抄本音频分类说话人识别字幕生成; 下载PDF 职称材料

基于LSTM的语音字幕转换技术: 3; 作者刘俊丽《电声技术》 2024年第6期47-49,共3页; 针对实时语音识别中存在的问题,提出基于长短期记忆(Long Short-Term Memory,LSTM)的语音字幕转换技术。首先介绍网络直播实时字幕生成的总体框架,其次详细阐述LSTM在语音字幕转换中的应用,最后选用Librispeech数据集进行实验。实验结... 展开更多; 关键词语音识别字幕生成长短期记忆(LSTM) 网络直播; 下载PDF 职称材料

融合约束学习的图像字幕生成方法被引量：5: 4; 作者杜海骏刘学亮《中国图象图形学报》 CSCD 北大核心 2020年第2期333-342,共10页; 目的图像字幕生成是一个涉及计算机视觉和自然语言处理的热门研究领域,其目的是生成可以准确表达图片内容的句子。在已经提出的方法中,生成的句子存在描述不准确、缺乏连贯性的问题。为此,提出一种基于编码器—解码器框架和生成式对抗... 展开更多; 关键词图像字幕生成约束学习强化学习生成式对抗网络融合训练; 原文传递

基于在线语音流的字幕自动生成系统算法研究与实现被引量：1: 5; 作者司玉景潘接林 +1 位作者颜永红高杰《网络新媒体技术》 2013年第4期52-54,共3页; 针对语音文稿已知的情况,提出了一种简单方法实现了适用于在线语音流的字幕自动生成系统。主要思路是根据文稿分句的情况确定在线语音的句子边界,进而,将相应的句子显示到屏幕上。假设在线语音的句子起点已知,本文建立了具有帧同步的统... 展开更多; 关键词字幕自动生成系统 HMM 帧同步的统计假设似然比模型; 下载PDF 职称材料

基于深度卷积与全局特征的图像密集字幕描述被引量：1: 6; 作者武文博顾广华 +2 位作者刘青茹赵志明李刚《信号处理》 CSCD 北大核心 2020年第9期1525-1532,共8页; 为了解决图像密集字幕描述中感兴趣区域(Regions of interest,ROI)定位不准确与区域粗粒度描述问题,本文提出了一种基于深度卷积与全局特征的图像密集字幕描述算法,该算法采用残差网络与并行LSTM(Long Short Term Memory)网络的联合模... 展开更多; 关键词密集字幕生成并行长短时记忆网络 Faster R-CNN 感兴趣区域特征融合; 下载PDF 职称材料

人工智能技术在媒体领域应用研究被引量：1: 7; 作者杨磊《现代电视技术》 2018年第5期96-101,136,共7页; 本文通过人工智能技术在国家和国际层面的战略布局和发展切入,对人工智能的技术原理进行了概要介绍,分析了语音识别、图像识别、神经网络、深度学习等概念的原理,同时集合融合发展电视媒体行业的特点,提出人工智能技术在媒体行业内使用... 展开更多; 关键词人工智能智能话筒字幕生成智能内容审查冗余内容筛查节目自动编辑; 下载PDF 职称材料

DivX制作傻瓜攻略: 8; 作者小鱼儿《软件》 2003年第2期29-34,共6页; 本人第一次制作,片名是Legally Blonde律政俏佳人,用时两天完成DivX。现根据我的制作过程以及最新的软件版本制作了此攻略。旨在总结自己制作过程,让大家共享一下制作的方法。; 关键词 DIVX 制作方法文件复制视音频分离 FVTC处理字幕生成; 下载PDF 职称材料

“三维视觉—语言”推理技术的前沿研究与最新趋势: 9; 作者雷印杰徐凯 +5 位作者郭裕兰杨鑫武玉伟胡玮杨佳琪汪汉云《中国图象图形学报》 CSCD 北大核心 2024年第6期1747-1764,共18页; 三维视觉推理的核心思想是对点云场景中的视觉主体间的关系进行理解。非专业用户难以向计算机传达自己的意图,从而限制了该技术的普及与推广。为此,研究人员以自然语言作为语义背景和查询条件反映用户意图,进而与点云的信息进行交互以... 展开更多; 关键词深度学习计算机视觉 “三维视觉—语言”推理跨模态学习视觉定位密集字幕生成视觉问答场景生成; 原文传递

已选择0条

导出题录引用分析

统计分析

上一页 1 下一页到第页

使用帮助返回顶部