期刊文献+
共找到30,519篇文章
< 1 2 250 >
每页显示 20 50 100
说话人音频攻击与对抗技术研究综述
1
作者 孙知信 赵杰 +3 位作者 王恩良 刘晨磊 范连成 刘畅 《南京邮电大学学报(自然科学版)》 北大核心 2024年第4期17-29,共13页
文中概括了说话人音频攻击与对抗技术的最新进展。由于说话人音频攻击已经成为语音应用安全的严重威胁,以WaveNet、Transformer和GAN三种模型在音频攻击技术中的应用作为节点,分别介绍以其为基础的音频攻击技术。音频对抗技术则以涵盖... 文中概括了说话人音频攻击与对抗技术的最新进展。由于说话人音频攻击已经成为语音应用安全的严重威胁,以WaveNet、Transformer和GAN三种模型在音频攻击技术中的应用作为节点,分别介绍以其为基础的音频攻击技术。音频对抗技术则以涵盖的攻击技术分为3类,分别是基础音频攻击、重放攻击和深度伪造攻击。系统地阐述了音频攻击与对抗技术的最新研究成果,并分析比较了各算法在不同条件下的优劣,同时还介绍了音频技术常用的数据集。最后结合该领域目前的研究现状,提出了说话人音频攻防对抗技术研究中亟待关注与研究的问题。 展开更多
关键词 说话人音频 音频伪造 音频鉴伪 音频数据集 深度学习
下载PDF
音频编辑在非线性编辑中的重要性及其技术要点
2
作者 周国利 《中文科技期刊数据库(全文版)工程技术》 2024年第4期0111-0114,共4页
本文旨在探讨音频编辑在非线性编辑系统中的重要性及其技术要点。音频编辑不仅仅是非线性编辑过程的一部分,而是影视作品中不可或缺的元素,它对于塑造场景氛围、强化叙事和增强观众的沉浸感扮演着关键角色。文中首先介绍了音频编辑的基... 本文旨在探讨音频编辑在非线性编辑系统中的重要性及其技术要点。音频编辑不仅仅是非线性编辑过程的一部分,而是影视作品中不可或缺的元素,它对于塑造场景氛围、强化叙事和增强观众的沉浸感扮演着关键角色。文中首先介绍了音频编辑的基础知识和原理,包括音频在非线性编辑中的作用、常用的音频格式和编码标准,以及音频同步技术。接着,文章深入分析了音频编辑的关键技术点,如音频剪辑、混合、音效处理、以及音乐配合策略。最后,探讨了音频编辑的高级应用,包括三维音频制作、动态范围控制和交互式环境下的音频编辑技术。本文的目的在于提供一个全面的技术框架,帮助读者理解音频编辑在非线性编辑中的复杂性和艺术性。 展开更多
关键词 非线性编辑 音频编辑 音频同步 音频剪辑 音效处理 三维音频
下载PDF
音频技术在禽畜养殖与果蔬种植中的应用研究进展
3
作者 李文伟 郑永军 +5 位作者 杨圣慧 江世界 赵航行 王慧 苏道毕力格 谭彧 《农业工程学报》 EI CAS CSCD 北大核心 2024年第7期34-49,共16页
随着信息技术的发展,音频技术凭借其快速、准确、成本低,且非接触、无侵入的优点,被广泛应用于现代农业禽畜养殖与果蔬种植等领域,已成为推动农业数字化、智能化的关键技术之一。该文阐述了音频增强技术如传统滤波法、短时谱估计法和小... 随着信息技术的发展,音频技术凭借其快速、准确、成本低,且非接触、无侵入的优点,被广泛应用于现代农业禽畜养殖与果蔬种植等领域,已成为推动农业数字化、智能化的关键技术之一。该文阐述了音频增强技术如传统滤波法、短时谱估计法和小波去噪法在禽畜果植中的研究与应用,综述了音频识别技术在农产品无损检测、动物疾病与健康监测、物种识别与病虫害检测等方面的研究成果,同时分析了音频控制技术在果蔬种植和禽畜养殖中的研究进展,在此基础上总结了现阶段禽畜果植音频增强技术、音频识别技术与音频控制技术面临的问题,并指出其未来可能的研究发展方向,以期为禽畜养殖与果蔬种植领域音频技术的研究与应用提供参考。 展开更多
关键词 禽畜养殖 果蔬种植 音频增强 音频识别 音频控制
下载PDF
分布式显控AES67音频网关的研发及应用
4
作者 邱建 贺俊 余晖良 《电视技术》 2024年第6期75-81,共7页
分布式显示控制系统(以下简称分布式)被广泛应用于指挥调度、视频会议、信息发布等领域,是高清视频信号传输和调度的核心,也担负着大量音频信号的传输和调度任务。分布式在与音频扩声系统之间相互传输音频信号时,通常需要通过非平衡模... 分布式显示控制系统(以下简称分布式)被广泛应用于指挥调度、视频会议、信息发布等领域,是高清视频信号传输和调度的核心,也担负着大量音频信号的传输和调度任务。分布式在与音频扩声系统之间相互传输音频信号时,通常需要通过非平衡模拟信号线缆实现,存在多次数模(Digital to Analog,D/A)和模数(Analog to Digital,A/D)转换,造成音频信号质量显著下降和精度损失。针对该问题,提出将AES67音频网关作为分布式和音频扩声系统之间的桥梁,在2个系统之间通过AES67实现网际互连协议(Internet Protocol,IP)全数字方式转换与传输,保证高质量的音频传输和性能。 展开更多
关键词 分布式 AES67音频 音频扩声系统 音频网关
下载PDF
合成监督增强的自动音频字幕框架
5
作者 肖飞扬 朱乔茜 +5 位作者 关键 刘徐博 刘濠赫 张可佳 贺广均 王文武 《声学学报》 EI CAS CSCD 北大核心 2024年第6期1315-1323,共9页
基于数据驱动的自动音频字幕方法受限于音频–文本数据对的数量和质量,导致其跨模态表示能力不足,制约了整体性能。为此,提出了一种合成监督增强的自动音频字幕框架(SynthAC),该框架利用广泛可用的高质量图像字幕文本语料及文本到音频... 基于数据驱动的自动音频字幕方法受限于音频–文本数据对的数量和质量,导致其跨模态表示能力不足,制约了整体性能。为此,提出了一种合成监督增强的自动音频字幕框架(SynthAC),该框架利用广泛可用的高质量图像字幕文本语料及文本到音频生成模型生成音频信号,有效扩充音频–文本数据对,并通过学习合成音频–文本数据对中的对应关系,增强音频文本跨模态表示能力。实验表明,所提SynthAC框架通过利用图像字幕中的高质量文本语料库,显著提升了音频字幕模型性能,该框架为应对音频–文本数据稀缺挑战提供了有效的解决方案。此外,该框架可适用于各种主流方法,在不改变音频字幕模型结构的情况下显著提升音频字幕性能。 展开更多
关键词 多模态学习 文本–音频表示 自动音频字幕 文本到音频生成
下载PDF
播客与有声书驱动下的国际数字音频行业发展趋势研究
6
作者 王异 张晓菲 《视听界》 2024年第1期38-43,共6页
近年来,播客和有声书两类数字音频产品在用户规模和市场收入方面,呈现出稳定增长态势,成为推动数字音频行业发展的重要力量,数字音频内容生产商纷纷加大播客和有声书业务投入,打造覆盖“全音频形式”的一站式音频服务平台。本文以Spotif... 近年来,播客和有声书两类数字音频产品在用户规模和市场收入方面,呈现出稳定增长态势,成为推动数字音频行业发展的重要力量,数字音频内容生产商纷纷加大播客和有声书业务投入,打造覆盖“全音频形式”的一站式音频服务平台。本文以Spotify、Audible等数字音频平台和图书出版商等数字音频生产主体为例,重点介绍其以播客与有声书为主的数字音频发展战略、原创内容开发模式,以音频广告和用户订阅为主的商业模式,整体呈现播客和有声书驱动下的国际数字音频行业发展趋势。 展开更多
关键词 播客 有声书 数字音频 音频平台 音频广告
下载PDF
数字音频技术在广播电视工程中的应用
7
作者 陈合源 《电声技术》 2024年第5期87-89,共3页
随着数字技术的飞速发展,数字音频技术已经广泛应用于广播电视工程,变得越来越重要,也成为行业发展的关键。数字音频技术具有高效、精准、灵活等优势,不仅为广播电视节目制作、传输和播放提供了强大的技术支持,而且丰富了广播电视节目... 随着数字技术的飞速发展,数字音频技术已经广泛应用于广播电视工程,变得越来越重要,也成为行业发展的关键。数字音频技术具有高效、精准、灵活等优势,不仅为广播电视节目制作、传输和播放提供了强大的技术支持,而且丰富了广播电视节目的内容和形式,为观众带来了更优质的视觉和听觉体验。但数字音频技术在实际应用中仍然存在一些问题,限制了广播建设的发展。基于此,分析数字音频技术在广播电视工程中的应用。 展开更多
关键词 数字音频技术 广播电视工程 音频采集 音频编码
下载PDF
基于音频去干扰自学习神经网络的地下线缆定位系统研究
8
作者 吴清涛 傅晓杰 +3 位作者 张晨 白蕾 龚侃 刘亦颖 《电气时代》 2024年第9期93-98,共6页
城市地下线缆是城市电力、通信、网络和其他基础设施系统的核心组成部分,其管理和维护逐渐成为保证城市正常运行的关键。为便捷准确地对地下线缆的故障点进行定位,提出基于音频去干扰预处理算法和一种引入残差模块的深度神经网络的地下... 城市地下线缆是城市电力、通信、网络和其他基础设施系统的核心组成部分,其管理和维护逐渐成为保证城市正常运行的关键。为便捷准确地对地下线缆的故障点进行定位,提出基于音频去干扰预处理算法和一种引入残差模块的深度神经网络的地下线缆定位方法。首先通过预加重、分帧和加窗等预处理步骤将采集到的原始音频数据转化为规则化的时域音频片段,然后快速傅里叶变换将其转化到频域,并提取音频信号的梅尔倒谱系数特征,最后将音频片段以频谱形式输入进基于VGG网络改进的深度学习神经网络,从而构建故障音频识别模型。设计不同神经网络模型对故障音频数据集的识别实验,结果显示改进的VGG网络结合MFCC混合特征向量进行故障音频识别,能进一步提高识别准确率。 展开更多
关键词 快速傅里叶变换 梅尔倒谱系数 音频信号 预加重 深度神经网络 音频数据 音频识别 MFCC
下载PDF
杭州亚运会马术项目音频公共信号制作与传输
9
作者 白雪松 《数字传媒研究》 2024年第8期64-68,共5页
本文介绍了杭州亚运会马术项目中的盛装舞步、障碍赛、三项赛的公共信号制作,解析音频系统信号传输的技术要点,为此类大型体育项目制作与传输提供参考。
关键词 公共音频信号传输 音频信号制作要求 公共音频信号制作
下载PDF
水力渗透型煤矿采空区三维音频大地电磁快速解译 被引量:1
10
作者 王楠 王子健 +2 位作者 秦其明 孙千惠 李树超 《矿业安全与环保》 CAS 北大核心 2024年第1期70-77,共8页
煤矿采空区或回采阶段工作面常面临水力渗透威胁,如何快速有效且低成本地预判水力渗透成为难题。提出并系统论述了一种面向水力渗透型采空区的音频大地电磁三维反演及快速解译方案。通过设计采空区理论地电模型,探讨采空区电阻率三维反... 煤矿采空区或回采阶段工作面常面临水力渗透威胁,如何快速有效且低成本地预判水力渗透成为难题。提出并系统论述了一种面向水力渗透型采空区的音频大地电磁三维反演及快速解译方案。通过设计采空区理论地电模型,探讨采空区电阻率三维反演可行性。实测数据反演解释结果揭示:采空区巷道顶板区域存在明显低阻分布,部分工作面存在顶板裂隙导水造成的富水低阻区域,局部垮落带与上覆含水层明显连通。为可疑透水位置定位、水位和涌水量监测,以及后续开采规划制订提供了参考。从理论和实证角度,为音频大地电磁法的采空区富水状态分析和动态监控应用提供了新思路,相关方法能够有效提高水力渗透型采空区的解译效果。 展开更多
关键词 煤矿 采空区 水力渗透 天然源 音频大地电磁法 三维反演
下载PDF
基于Dante音频处理器的局域网语音通话系统设计与实现 被引量:1
11
作者 姜奋林 胡艳平 《电声技术》 2024年第4期124-126,130,共4页
为提升内部通信的效率和可靠性,设计基于Dante音频处理器的局域网语音通话系统。该系统适用于内部通信场景,利用Dante音频处理技术实现低延迟传输,通过可视化操作界面管理局域网内的音频设备,能够提供稳定、清晰的语音通话服务。
关键词 Dante音频处理器 音频路由 点对点通话 群组通话
下载PDF
音频数据驱动的洗煤厂溜槽堵塞检测
12
作者 谭兴富 卢军 +2 位作者 常发军 宋阳 赵轩 《煤炭工程》 北大核心 2024年第10期224-230,共7页
溜槽堵塞作为工业生产中的一种常见问题,不仅影响生产效率还可能导致安全隐患,因此实时准确地检测溜槽堵塞状态具有重要意义。然而传统的检测方法在实际应用中存在诸多问题与挑战,如精度不高、依赖人工干预等。文章基于音频信息构建结合... 溜槽堵塞作为工业生产中的一种常见问题,不仅影响生产效率还可能导致安全隐患,因此实时准确地检测溜槽堵塞状态具有重要意义。然而传统的检测方法在实际应用中存在诸多问题与挑战,如精度不高、依赖人工干预等。文章基于音频信息构建结合了WaveNet和GRU的WaveGNet深度网络模型,通过提取分析声音信号寻找溜槽堵塞的特征,以实现准确的堵塞检测。WaveNet能够提取高质量的声音信号特征,而GRU网络则能够捕获声音序列中的时间关系。通过将两者融合以更好地理解声音信号,在时间和频率维度上进行更准确的分析,揭示与堵塞状态相关的模式从而提高检测的准确性和鲁棒性。通过声音信息直接捕获堵塞状态,减少了人工干预的需求且具备实时性。该方法有望为工业生产中的溜槽堵塞检测提供一种创新、高效且可靠的解决方案,在实际应用中具有重大潜力。 展开更多
关键词 溜槽检测 音频 深度学习 WaveNet GRU
下载PDF
从高级音频编码(AAC)专利池发展窥探标准的引领作用
13
作者 郭小勇 陈方芳 +5 位作者 周瑾 李灵波 卢效东 张燕歌 于雷 徐春红 《中国标准化》 2024年第19期95-98,共4页
本文在研究标准体系、技术路线图和专利池三者关系过程中,发现高级音频编码(AAC)标准、专利池及专利三者之间违背一般逻辑的现象,即AAC标准发布后,有关研究机构和厂商发现了巨大商机,继而建立专利池,研发产品形成专利。这一实例说明标... 本文在研究标准体系、技术路线图和专利池三者关系过程中,发现高级音频编码(AAC)标准、专利池及专利三者之间违背一般逻辑的现象,即AAC标准发布后,有关研究机构和厂商发现了巨大商机,继而建立专利池,研发产品形成专利。这一实例说明标准有时先于专利、专利池发展和形成,继而对专利池的建立和专利的形成起着引领作用,需要引起人们重视标准对技术、产品、专利、专利池的引领作用。 展开更多
关键词 高级音频编码 专利池 标准
下载PDF
基于音频分析技术的甲状腺疾病诊断方法
14
作者 刘彤 张博维 +2 位作者 冯超 顾毅 高青山 《中国医学物理学杂志》 CSCD 2024年第8期1031-1035,共5页
通过结合基于SMOTE数据扩充方法对复杂音频数据的处理能力以及GA-SVM的准确预测能力,提出一种基于SMOTE数据扩充算法的GA-SVM模型,并将其应用于甲状腺疾病的诊断中。实验结果表明,本文方法在甲状腺疾病分类诊断方面表现出良好的性能。... 通过结合基于SMOTE数据扩充方法对复杂音频数据的处理能力以及GA-SVM的准确预测能力,提出一种基于SMOTE数据扩充算法的GA-SVM模型,并将其应用于甲状腺疾病的诊断中。实验结果表明,本文方法在甲状腺疾病分类诊断方面表现出良好的性能。相较于其他方法,本文方法在诊断效果方面表现更佳,在甲状腺疾病的分类诊断中具有更高的适用性。 展开更多
关键词 甲状腺疾病 音频分析 GA-SVM模型 诊断方法
下载PDF
电影沉浸式音频码流规范及功能特性研究
15
作者 王丰 《现代电影技术》 2024年第3期39-45,52,共8页
电影沉浸式音频主要由音频素材和元数据信息构成,其码流会根据不同的用途封装到不同规格的素材交换格式(MXF)中。本文重点研究了美国电影电视工程师协会(SMPTE)标准定义的沉浸式音频码流规范中各层级元素含义,深入解读了沉浸式音频各项... 电影沉浸式音频主要由音频素材和元数据信息构成,其码流会根据不同的用途封装到不同规格的素材交换格式(MXF)中。本文重点研究了美国电影电视工程师协会(SMPTE)标准定义的沉浸式音频码流规范中各层级元素含义,深入解读了沉浸式音频各项元数据的功能特性,介绍了现阶段对采用MXF格式进行封装的数字电影数据包(DCP)中沉浸式音频码流的功能限制,旨在帮助沉浸式音频研发者和使用者更好地应用这些数据,通过对元数据特性的深入了解,逐步优化音频处理算法,确保渲染的准确性、可靠性,进而推动沉浸式音频技术行业的高质量发展与应用。 展开更多
关键词 沉浸式音频码流 元素 声床 音频对象
下载PDF
高清无线音频终端产品质量分析
16
作者 卫文港 董桂官 +1 位作者 刘鑫楠 邢广鑫 《电声技术》 2024年第2期144-149,共6页
文章依据《高清无线音频技术与设备规范及测试方法》(T/CAIACN 008—2022),对当前市面上主流的高清无线音频终端产品进行综合评测。结果表明,所有样品无线传输性能、抗干扰性能良好,部分样品降噪性能未达到基本要求,高清无线音频产品的... 文章依据《高清无线音频技术与设备规范及测试方法》(T/CAIACN 008—2022),对当前市面上主流的高清无线音频终端产品进行综合评测。结果表明,所有样品无线传输性能、抗干扰性能良好,部分样品降噪性能未达到基本要求,高清无线音频产品的降噪性能需要进一步提高。 展开更多
关键词 无线音频 高清音频 标准 评测
下载PDF
VR音频技术在体育赛事节目制作中的应用研究
17
作者 黄子轩 胡泽 《中国传媒大学学报(自然科学版)》 2024年第2期52-59,共8页
随着广播电视相关技术的不断成熟,对电视画面质量的探索经历了从标清技术到高清技术的转变,4K、8K等高清视频技术发展的同时,声音技术也在不断发展。全景声、三维声、空间音频的出现,让受众逐渐不满足于立体声甚至环绕声这类平面的声音... 随着广播电视相关技术的不断成熟,对电视画面质量的探索经历了从标清技术到高清技术的转变,4K、8K等高清视频技术发展的同时,声音技术也在不断发展。全景声、三维声、空间音频的出现,让受众逐渐不满足于立体声甚至环绕声这类平面的声音呈现方式,对定位的精确度、空间的还原度提出了更高的要求与期望。在媒介环境学视域下,人们的注意力从单一的视觉中心转向听觉,进一步追求感官上的和谐平衡。本文围绕体育赛事节目中VR音频(又被称为空间音频)的制作,对体育赛事节目中音频带来的多维沉浸进行了分析,并进一步探讨技术变革带来的审美变迁。最后设想了在体育转播声音制作中建立以人的感知为中心的声场,充分利用听觉元素调动多个感官,使观众整体沉浸于比赛之中。打破体育赛事节目中观众传统的听觉习惯是值得尝试的,声音创作在未来将朝着更加自由且人性化的方向发展。 展开更多
关键词 VR音频 空间音频 体育赛事 沉浸感
下载PDF
基于改进教师-学生模型的色情音频事件检测
18
作者 宫法明 司朋举 李昕 《计算机应用与软件》 北大核心 2024年第2期172-177,共6页
为保障青少年身心健康,国家日益重视色情信息的监管工作。针对传统色情音频检测无法精准定位事件起止时间的问题,提出一种基于半监督学习的改进教师-学生模型。将无标签、弱标签、强标签数据作为训练集输入,通过多层神经网络提取音频的... 为保障青少年身心健康,国家日益重视色情信息的监管工作。针对传统色情音频检测无法精准定位事件起止时间的问题,提出一种基于半监督学习的改进教师-学生模型。将无标签、弱标签、强标签数据作为训练集输入,通过多层神经网络提取音频的帧、段特征,随后迭代优化帧、段所产生的分类损失以及教师-学生模型和段分类模型之间的一致性损失。在真实数据集上,实验结果表明当时间容忍度为5 s时,色情类别召回率达到94.3%,F1得分可达到83.4%。 展开更多
关键词 色情音频检测 半监督学习 教师-学生模型
下载PDF
数字音频广播关键技术及应用研究 被引量:1
19
作者 孙鹏皓 《电声技术》 2024年第1期47-49,共3页
文章以数字音频广播关键技术及应用为研究重点,介绍数字音频广播的概念与优势,详细讨论数据压缩、信道编码与调制、单频网以及正交频分复用等技术的特性。同时,研究数字音频广播的主要系统架构,并分析这些系统的重要应用,以期为数字音... 文章以数字音频广播关键技术及应用为研究重点,介绍数字音频广播的概念与优势,详细讨论数据压缩、信道编码与调制、单频网以及正交频分复用等技术的特性。同时,研究数字音频广播的主要系统架构,并分析这些系统的重要应用,以期为数字音频广播的发展提供参考。 展开更多
关键词 数字音频 数字技术 音频压缩 信道编码与调制
下载PDF
广播电视工程中的数字音频技术及应用 被引量:3
20
作者 袁莉 《卫星电视与宽带多媒体》 2024年第2期26-28,共3页
在数字音频技术高速发展的今天,广播电视行业中数字音频技术所扮演的角色也更加重要。本文详细介绍了数字音频技术及其在广播电视工程领域的实际应用,以期为相关从业人员更好地应用数字音频技术提供一定的参考。
关键词 广播电视工程 数字音频技术 音频传输 传输效率
下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部