期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
丢弃冗余块的语音识别Transformer解码加速方法
1
作者 赵德春 舒洋 +2 位作者 李玲 陈欢 张子豪 《计算机工程》 CAS CSCD 北大核心 2023年第10期105-111,119,共8页
Transformer及其变体因具有强大的上下文建模能力而成为语音识别领域的主流模型,它们能够取得良好的识别结果,但是其中的解码器使用带有冗余信息的全部编码器特征,导致模型的解码速度受到限制。为提高解码器效率,提出一种丢弃冗余空白块... Transformer及其变体因具有强大的上下文建模能力而成为语音识别领域的主流模型,它们能够取得良好的识别结果,但是其中的解码器使用带有冗余信息的全部编码器特征,导致模型的解码速度受到限制。为提高解码器效率,提出一种丢弃冗余空白块的Transformer解码加速方法 DRB。以CTC/AED结构作为语音识别基本框架,利用CTC产生的尖峰序列去除编码特征中连续冗余的空白帧,减小编码输出特征的长度,降低解码器的计算量,从而提高模型的解码速度。采用预训练加微调的方式对使用DRB方法的语音识别模型进行训练,以减小因盲目对齐而产生的额外训练开销。引入Intermediate CTC结构提高模型训练时对编码器的约束能力,减小DRB判断冗余帧的误差,降低DRB方法对模型识别精度造成的损失。在开源数据集AISHELL-1与LibriSpeech上进行实验,结果表明,使用DRB的两阶段重打分非自回归解码方法在2个数据集上均能对解码速度取得58%左右的加速效果,且识别精度几乎没有损失,实现了解码效率的显著提升。 展开更多
关键词 语音识别 Transformer解码 CTC模型 特征压缩 解码加速
下载PDF
非编软件Edius X信息辅助显示和视频调色技巧
2
作者 吴丛华 《影视制作》 2024年第4期72-77,共6页
Edius X是Grass Valley公司于2020年9月推出的EDIUS升级版非线性编辑软件,新版软件受到很多县级电视台和一些自媒体或视频制作爱好者的喜爱,它在编辑制作电视新闻、电视专题片及短视频方面十分方便快捷。本文结合实例,从“信息辅助显示... Edius X是Grass Valley公司于2020年9月推出的EDIUS升级版非线性编辑软件,新版软件受到很多县级电视台和一些自媒体或视频制作爱好者的喜爱,它在编辑制作电视新闻、电视专题片及短视频方面十分方便快捷。本文结合实例,从“信息辅助显示和硬件解码加速设置”“原色校正滤镜使用技巧”两个方面探讨Edius X的基本设置和调色技巧,以期对电视节目后期编辑制作人员和视频摄影爱好者都有所帮助。 展开更多
关键词 Edius X非编软件 辅助信息 硬件解码加速 原色校正 视频范围
下载PDF
新闻非线性编辑制作网络系统的应用 被引量:2
3
作者 陈蕙 《电视技术》 北大核心 2008年第10期67-69,共3页
从非线性编辑制作网络方案的总体设计、设备的具体选型、系统接口的连接等方面对青海电视台的新闻非线性编辑制作网络进行了分析和介绍。
关键词 CPU+GPU图像加速+软件编解码编辑技术 智能合成技术 DP-Edit Plus系统
下载PDF
Research and Design of MP3 Player Decoder based on FPGA
4
作者 Hang Xu 《International Journal of Technology Management》 2013年第1期121-123,共3页
The paper takes a method of a low speed processer based on FPGA hardware accelerator SOC units to realize the MP3 player, and include some peripheral devices. The experimental results show that the system has implemen... The paper takes a method of a low speed processer based on FPGA hardware accelerator SOC units to realize the MP3 player, and include some peripheral devices. The experimental results show that the system has implemented the basic functions of the MP3 player, having its own advantages on increasing the decoding speed and reducing the system consumption. The system is convenient to redesign for more function in the future. In conclusion, it has a wide application prospect. 展开更多
关键词 Mp3 player DECODER FPGA Huffman decoding principle
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部