期刊文献+
共找到21篇文章
< 1 2 >
每页显示 20 50 100
并行网络与数据扩充方法在乘用车异响识别中的应用
1
作者 陈达亮 张博文 +2 位作者 郝耀东 安子军 邓江华 《汽车技术》 CSCD 北大核心 2023年第5期1-7,共7页
针对乘用车车内异响识别研究过程中数据集少且人工诊断法效率低的问题,提出了一种具有高识别准确率的数据扩充方法,并采取卷积神经网络与Transformer编码器栈并行的工作机制获得分类模型。结果表明,当将提取的扩充数据的梅尔倒谱系数特... 针对乘用车车内异响识别研究过程中数据集少且人工诊断法效率低的问题,提出了一种具有高识别准确率的数据扩充方法,并采取卷积神经网络与Transformer编码器栈并行的工作机制获得分类模型。结果表明,当将提取的扩充数据的梅尔倒谱系数特征用作并行网络的输入时,所提出的数据扩充方法可有效提高分类性能,且拟议模型在测试集上可以实现高达98.31%的分类精度。 展开更多
关键词 异响识别 卷积神经网络 Transformer编码器栈 并行网络 音频剪切 数据增强
下载PDF
广播电视工程中数字音频技术的优点和应用
2
作者 王卿鹏 《电声技术》 2023年第7期52-54,共3页
随着技术的发展,数字音频技术的性能愈发完善,已经成为广播电视行业的重要组成部分。为提升广播电视工程的质量,文章集中探讨了广播电视工程中数字音频技术的优点和应用。广播电视工程中的数字音频技术具有抗干扰能力强、支持多轨混音... 随着技术的发展,数字音频技术的性能愈发完善,已经成为广播电视行业的重要组成部分。为提升广播电视工程的质量,文章集中探讨了广播电视工程中数字音频技术的优点和应用。广播电视工程中的数字音频技术具有抗干扰能力强、支持多轨混音、高保真度以及信息存储能力强等优点,覆盖了声音采集与编辑、音频混音与制作、声音传输与播放等方面。 展开更多
关键词 广播电视工程 数字音频技术 多轨混音 音频编码与解码 数字视频剪辑
下载PDF
基于增量学习支持向量机的音频例子识别与检索 被引量:7
3
作者 吴飞 庄越挺 潘云鹤 《计算机研究与发展》 EI CSCD 北大核心 2003年第7期950-955,共6页
音频例子识别与检索的主要任务是构造一个良好的分类学习机 ,而在构造过程中 ,从含有冗余样本的训练库中选择最佳训练例子、节省学习机的训练时间是构造分类机面临的一个挑战 ,尤其是对含有大样本训练库音频例子的识别 由于支持向量是... 音频例子识别与检索的主要任务是构造一个良好的分类学习机 ,而在构造过程中 ,从含有冗余样本的训练库中选择最佳训练例子、节省学习机的训练时间是构造分类机面临的一个挑战 ,尤其是对含有大样本训练库音频例子的识别 由于支持向量是支持向量机中的关键例子 ,提出了增量学习支持向量机训练算法 在这个算法中 ,训练样本被分成训练子库按批次进行训练 ,每次训练中 ,只保留支持向量 ,去除非支持向量 与普通和减量支持向量机对比的实验表明 ,算法在显著减少训练时间前提下 。 展开更多
关键词 增量学习 支持向量机 音频例子识别检索 分类学习机
下载PDF
音频信息检索的研究及实现 被引量:11
4
作者 宋博 须德 《计算机应用》 CSCD 北大核心 2003年第12期52-54,共3页
介绍了常见的基于内容的音频检索的关键技术和音频特征提取的一般方法,讨论了其中基于隐马尔科夫(HMM)模型识别音频例子的关键问题,并在此基础上给出了一个基于内容的音频信息检索系统的框架和实例。
关键词 音频信息检索 特征提取 音频分割 音频例子 隐马尔科夫模型
下载PDF
1D-CNN:Speech Emotion Recognition System Using a Stacked Network with Dilated CNN Features 被引量:5
5
作者 Mustaqeem Soonil Kwon 《Computers, Materials & Continua》 SCIE EI 2021年第6期4039-4059,共21页
Emotion recognition from speech data is an active and emerging area of research that plays an important role in numerous applications,such as robotics,virtual reality,behavior assessments,and emergency call centers.Re... Emotion recognition from speech data is an active and emerging area of research that plays an important role in numerous applications,such as robotics,virtual reality,behavior assessments,and emergency call centers.Recently,researchers have developed many techniques in this field in order to ensure an improvement in the accuracy by utilizing several deep learning approaches,but the recognition rate is still not convincing.Our main aim is to develop a new technique that increases the recognition rate with reasonable cost computations.In this paper,we suggested a new technique,which is a one-dimensional dilated convolutional neural network(1D-DCNN)for speech emotion recognition(SER)that utilizes the hierarchical features learning blocks(HFLBs)with a bi-directional gated recurrent unit(BiGRU).We designed a one-dimensional CNN network to enhance the speech signals,which uses a spectral analysis,and to extract the hidden patterns from the speech signals that are fed into a stacked one-dimensional dilated network that are called HFLBs.Each HFLB contains one dilated convolution layer(DCL),one batch normalization(BN),and one leaky_relu(Relu)layer in order to extract the emotional features using a hieratical correlation strategy.Furthermore,the learned emotional features are feed into a BiGRU in order to adjust the global weights and to recognize the temporal cues.The final state of the deep BiGRU is passed from a softmax classifier in order to produce the probabilities of the emotions.The proposed model was evaluated over three benchmarked datasets that included the IEMOCAP,EMO-DB,and RAVDESS,which achieved 72.75%,91.14%,and 78.01%accuracy,respectively. 展开更多
关键词 Affective computing one-dimensional dilated convolutional neural network emotion recognition gated recurrent unit raw audio clips
下载PDF
基于内容和旋律的音频片段识别与检索 被引量:1
6
作者 吴海霞 李艳玲 刘潞锋 《太原师范学院学报(自然科学版)》 2015年第2期33-39,共7页
介绍了音频信号的主要特征和处理技术,给出音频检索系统的处理框架和主流产品,并列出典型检索引擎及应用行业;详细阐述了音频识别和检索的主要方法、基于旋律和内容的音频片段检索的原理和特点;最后结合实验和测试中的实际问题对音频检... 介绍了音频信号的主要特征和处理技术,给出音频检索系统的处理框架和主流产品,并列出典型检索引擎及应用行业;详细阐述了音频识别和检索的主要方法、基于旋律和内容的音频片段检索的原理和特点;最后结合实验和测试中的实际问题对音频检索进行展望. 展开更多
关键词 信息检索 音频识别 音频片段 声纹
下载PDF
英语录音教材内容质量把控初探 被引量:2
7
作者 武桂香 《课程.教材.教法》 CSSCI 北大核心 2013年第6期62-67,共6页
英语录音教材作为英语教学必备的辅助教材,其内容质量直接关系到英语教学目标的达成。录音编辑应综合考虑录音制作环节中的诸多影响因素:语言内容选择、语言规范、学生的学习心理和水平、素材采集与处理、语言情境创设、录音监听、审听... 英语录音教材作为英语教学必备的辅助教材,其内容质量直接关系到英语教学目标的达成。录音编辑应综合考虑录音制作环节中的诸多影响因素:语言内容选择、语言规范、学生的学习心理和水平、素材采集与处理、语言情境创设、录音监听、审听等,以期把控英语录音教材的内容质量。 展开更多
关键词 英语录音教材 声音素材 质量
下载PDF
音频功率放大器的防火安全设计
8
作者 蒋春旭 《安全与电磁兼容》 2006年第5期101-102,106,共3页
依据音视频电子产品安全标准,介绍了音频放大器的防火要求,分析了各种音频功率放大器的防火设计。
关键词 音频放大器 非削波输出功率 粉红噪声 防火防护外壳 潜在引燃源
下载PDF
一种用于截幅音频修复中的自适应一致迭代硬阈值算法 被引量:3
9
作者 邹霞 吴彭龙 +1 位作者 孙蒙 张星昱 《电子与信息学报》 EI CSCD 北大核心 2019年第4期925-931,共7页
一致迭代硬阈值(CIHT)算法在处理音频截幅失真中具有较好的性能。但是,在截幅程度较大时音频截幅修复的性能会下降。因此,该文提出一种基于自适应门限的改进算法。该算法自动估计音频信号截幅程度,根据估计的截幅程度信息,自适应调整算... 一致迭代硬阈值(CIHT)算法在处理音频截幅失真中具有较好的性能。但是,在截幅程度较大时音频截幅修复的性能会下降。因此,该文提出一种基于自适应门限的改进算法。该算法自动估计音频信号截幅程度,根据估计的截幅程度信息,自适应调整算法中的截幅程度因子。与近年来提出的CIHT算法和一致字典学习算法(CDL)相比,该文所提算法能更好地重建音频信号,特别在音频信号截幅失真严重的情况。该算法的运算复杂度与CIHT相近,与CDL相比,拥有更快的运行速度,有利于实时实现。 展开更多
关键词 音频信号处理 截幅失真 自适应门限 一致迭代硬阈值
下载PDF
利用Flash CS4动作脚本控制声音
10
作者 许丽光 《莆田学院学报》 2013年第5期63-65,共3页
描述了在Flash CS4中利用Action脚本对声音元素进行交互控制的具体实现过程,给出了详细的原代码及其注释说明,为制作具有良好的声音控制效果的优秀Flash动画作品提供了一种可行的技术实现方法。
关键词 FlashCS4 Action脚本 交互控制 多媒体 声音素材
下载PDF
基于音频分析技术的数控切削加工程序优化设计
11
作者 欧阳刚 陈洪涛 《制造技术与机床》 北大核心 2014年第4期111-113,共3页
对数控切削加工过程中的音频信息进行采集,通过音频软件进行分析,找到加工过程中切削振动的变化特征,依据削峰平谷的原则进行程序优化,有效降低因振动造成的刀具损耗。
关键词 切削振动 音频分析 程序优化 削峰平谷原则
下载PDF
地方台提升综艺晚会声音录制质量的方法研究
12
作者 宫正勤 宋菲菲 《电声技术》 2015年第8期81-83,87,共4页
针对地方台音频素材资源相对匮乏、音响设备条件相对简陋的实际情况,从影响声音录制质量的三个要素出发,对地方台如何提升综艺晚会声音的录制质量展开研究;具体实际操作中对音频素材声音处理中运用了i Zotope Ozone母带处理插件、演出... 针对地方台音频素材资源相对匮乏、音响设备条件相对简陋的实际情况,从影响声音录制质量的三个要素出发,对地方台如何提升综艺晚会声音的录制质量展开研究;具体实际操作中对音频素材声音处理中运用了i Zotope Ozone母带处理插件、演出现场增添后场补声音箱、录制播出系统电平统一等手段来改善声音录制质量。结果表明,改进后的声音录制质量良好,对于解决地方台节目录制问题具有较好的适用性。 展开更多
关键词 地方台 综艺晚会 录制质量 音频素材 补声音箱 现场扩声 电平统一
下载PDF
K类音频功放的防破音控制系统 被引量:1
13
作者 王绍清 叶春晖 胡养聪 《电子技术应用》 北大核心 2016年第1期22-24,共3页
设计实现了一种可用于K类音频功放的防破音控制系统,通过自动检测输出削波失真调整系统增益,确保K类音频功放在较大的输入动态范围内,输出音频信号光滑无失真。确保K类音频功放在整个工作电压内保持低谐波失真,且保持恒定输出功率。采用... 设计实现了一种可用于K类音频功放的防破音控制系统,通过自动检测输出削波失真调整系统增益,确保K类音频功放在较大的输入动态范围内,输出音频信号光滑无失真。确保K类音频功放在整个工作电压内保持低谐波失真,且保持恒定输出功率。采用0.5μm CMOS工艺实现了集成这种防破音控制系统的2.0 W单声道K类音频功放。测试结果显示,在3.3 V^4.2 V电源电压范围、增益设置为24 d B、4Ω喇叭负载下,该K类音频功放能够在0~1.2 V_(rms)的动态输入范围内保持低谐波失真(THD+N)<0.5%,恒定无削波输出功率2.0 W。 展开更多
关键词 防破音控制 K类音频功放 输入动态范围 总谐波失真
下载PDF
防破音D类音频功放的设计与应用 被引量:2
14
作者 杜虹 阮颐 刘燕涛 《电子与封装》 2012年第7期41-44,共4页
随着多媒体便携设备的普及,音频功放已经成为音频部分的标准配置,D类功放以其高品质高效的特点得到了越来越广泛的应用。在便携产品中,音频功放由于输入音乐信号过大或者电源电压过低,会产生削顶失真。采用防破音技术,可以通过自动增益... 随着多媒体便携设备的普及,音频功放已经成为音频部分的标准配置,D类功放以其高品质高效的特点得到了越来越广泛的应用。在便携产品中,音频功放由于输入音乐信号过大或者电源电压过低,会产生削顶失真。采用防破音技术,可以通过自动增益调节技术来提供一个完美的解决方案。文章介绍了常见的防破音技术,提出了一种改进的AGC(自动增益控制)技术在D类功放中的设计与应用。改进的AGC技术通过对PWM输出的采样来判断失真程度,依据失真程度用防破音电路产生的PWM波形来自动调节运放增益,实现最大功率的无失真输出。 展开更多
关键词 防破音 D类功放 压缩/限幅技术 自动增益控制
下载PDF
MCAI课件制作中音频素材处理技术探讨
15
作者 刘金锤 《三门峡职业技术学院学报》 2002年第2期68-72,共5页
介绍了音频文件的来源及主要格式,并就音频文件的格式转换及常见音频文件的剪辑方法作了深入地探讨。
关键词 MCAI 课件制作 音频素材 处理技术
下载PDF
基于ToolBook平台开发多媒体系统的探讨
16
作者 聂发如 崔大勇 王国华 《上海电力学院学报》 CAS 1997年第2期36-41,共6页
基于ToolBook开发多媒体系统的一般步骤,本文在深入研究音频、视频与图像以及动画处理的基础上,对多媒体应用中一些关键性技术问题提出了解决方法,并给出了实现的实例.
关键词 多媒体 音频 视频 图像 动画 剪辑 脚本
下载PDF
广播电视音频削波失真产生机理及修复方法探索
17
作者 王奥然 《数码设计》 2020年第5期57-57,共1页
本文将对广播电视音频削波失真的产生机理加以介绍,同时指出节目常规的语音信号状态,并且分析削波失真引发的语音信号变化,进而指出修复语音信号的实际流程,以期为广大广播电视工作人员提供可靠参考。
关键词 广播电视音频 削波失真 谐波 频率 修复
下载PDF
音频剪辑技巧
18
作者 范炜 杨澍彬 谭忠凯 《中国有线电视》 2015年第7期871-872,共2页
随着近年来影视剧的蓬勃发展,各个相关领域也由以前的冷门慢慢变得越来越受到重视,有必要进行专门的研究,以便更好地为影视剧制作进行服务。根据多年的影视剧制作经验,通过分析一些精彩影视剧中的音频制作技巧,来阐述音频剪辑在影视剧... 随着近年来影视剧的蓬勃发展,各个相关领域也由以前的冷门慢慢变得越来越受到重视,有必要进行专门的研究,以便更好地为影视剧制作进行服务。根据多年的影视剧制作经验,通过分析一些精彩影视剧中的音频制作技巧,来阐述音频剪辑在影视剧制作中的重要性。 展开更多
关键词 音频剪辑 影视剧制作 转场
下载PDF
IEC 62368-1对含音频放大器设备的试验要求
19
作者 温明森 朱乃榕 《质量技术监督研究》 2021年第1期42-45,共4页
文中从音频信号源、输出功率类型、试验工作条件、电能量源分级与安全防护等方面着手,解释IEC 62368-1标准中音频放大器的相关规定以供参考。
关键词 IEC 62368-1 音频放大器 1000Hz正弦波音频信号 非削波输出功率 音频信号电能量源分级与安全防护
下载PDF
浅析动画电影的画面剪辑艺术 被引量:2
20
作者 穆弈君 《艺术与设计(理论版)》 2011年第12X期138-140,共3页
动画电影的画面剪辑艺术在当今影视作品中的独特性愈来愈突出!动画剪辑技巧对于时间的改变,动画作品的段落构成和主题思想表达等有直接作用。重点解析如何运用画面剪辑艺术吸引观众的眼球,并节选部分动画电影的剪辑为例,对动画电影的剪... 动画电影的画面剪辑艺术在当今影视作品中的独特性愈来愈突出!动画剪辑技巧对于时间的改变,动画作品的段落构成和主题思想表达等有直接作用。重点解析如何运用画面剪辑艺术吸引观众的眼球,并节选部分动画电影的剪辑为例,对动画电影的剪辑艺术进行了探讨。 展开更多
关键词 动画剪辑 视听语言 动画教育
原文传递
上一页 1 2 下一页 到第
使用帮助 返回顶部