期刊文献+
共找到36篇文章
< 1 2 >
每页显示 20 50 100
MAP-based Audio Coding Compensation for Speaker Recognition
1
作者 Tao Jiang Jiqing Han 《Journal of Signal and Information Processing》 2011年第3期165-169,共5页
The performance of the speaker recognition system declines when training and testing audio codecs are mismatched. In this paper, based on analyzing the effect of mismatched audio codecs in the linear prediction cepstr... The performance of the speaker recognition system declines when training and testing audio codecs are mismatched. In this paper, based on analyzing the effect of mismatched audio codecs in the linear prediction cepstrum coefficients, a method of MAP-based audio coding compensation for speaker recognition is proposed. The proposed method firstly sets a standard codec as a reference and trains the speaker models in this codec format, then learns the deviation distributions between the standard codec format and the other ones, next gets the current bias via using a small number adaptive data and the MAP-based adaptive technique, and then adjusts the model parameters by the type of coming audio codec format and its related bias. During the test, the features of the coming speaker are used to match with the adjusted model. The experimental result shows that the accuracy reached 82.4% with just one second adaptive data, which is higher 5.5% than that in the baseline system. 展开更多
关键词 audio CODING COMPENSATION speaker RECOGNITION MAP-Based
下载PDF
说话人音频攻击与对抗技术研究综述
2
作者 孙知信 赵杰 +3 位作者 王恩良 刘晨磊 范连成 刘畅 《南京邮电大学学报(自然科学版)》 北大核心 2024年第4期17-29,共13页
文中概括了说话人音频攻击与对抗技术的最新进展。由于说话人音频攻击已经成为语音应用安全的严重威胁,以WaveNet、Transformer和GAN三种模型在音频攻击技术中的应用作为节点,分别介绍以其为基础的音频攻击技术。音频对抗技术则以涵盖... 文中概括了说话人音频攻击与对抗技术的最新进展。由于说话人音频攻击已经成为语音应用安全的严重威胁,以WaveNet、Transformer和GAN三种模型在音频攻击技术中的应用作为节点,分别介绍以其为基础的音频攻击技术。音频对抗技术则以涵盖的攻击技术分为3类,分别是基础音频攻击、重放攻击和深度伪造攻击。系统地阐述了音频攻击与对抗技术的最新研究成果,并分析比较了各算法在不同条件下的优劣,同时还介绍了音频技术常用的数据集。最后结合该领域目前的研究现状,提出了说话人音频攻防对抗技术研究中亟待关注与研究的问题。 展开更多
关键词 说话人音频 音频伪造 音频鉴伪 音频数据集 深度学习
下载PDF
电声技术在人工智能语音识别中的应用与挑战
3
作者 彭先华 《电声技术》 2024年第1期32-34,共3页
文章主要探讨电声技术在人工智能语音识别中的应用和挑战,并给出相关优化策略。麦克风、扬声器、音频处理以及声学模型等电声技术对提升语音识别系统的性能具有重要意义,但噪声干扰、硬件限制、识别准确性及实时处理能力仍是技术发展的... 文章主要探讨电声技术在人工智能语音识别中的应用和挑战,并给出相关优化策略。麦克风、扬声器、音频处理以及声学模型等电声技术对提升语音识别系统的性能具有重要意义,但噪声干扰、硬件限制、识别准确性及实时处理能力仍是技术发展的难题。通过精细调整声学模型、对硬件性能进行升级、使用先进的噪声抑制算法以及加速系统处理等措施,能够有效提高人工智能语音识别的性能。 展开更多
关键词 电声技术 人工智能语音识别 麦克风 扬声器 音频处理
下载PDF
基于深度嵌入向量的说话人分割研究
4
作者 许铭洋 王华朋 +2 位作者 闫道申 杨海涛 楚宪腾 《刑事技术》 2023年第5期466-472,共7页
为提高多说话人混合语音分割的准确度,本文提出了采用广义端到端损失函数训练说话人深度嵌入向量提取模型用于多说话人分割。该方法首先训练基于长短时记忆的深度神经网络作为深度嵌入向量提取器;其次,在音频文件中截取每个说话人的参... 为提高多说话人混合语音分割的准确度,本文提出了采用广义端到端损失函数训练说话人深度嵌入向量提取模型用于多说话人分割。该方法首先训练基于长短时记忆的深度神经网络作为深度嵌入向量提取器;其次,在音频文件中截取每个说话人的参考语音段并训练其嵌入向量;最后,比较音频文件的连续嵌入与每个说话人嵌入之间的余弦相似度得分,实现说话人分割。该方法采用先识别后分割的原理,在能够预知说话人数量的场景中有较好的分割效果,可以为多说话人自动识别系统自动分割目标说话人语音,提高工作效率。 展开更多
关键词 说话人分割 长短时记忆 广义端到端 音频嵌入 余弦相似度
下载PDF
汽车音响系统中电声技术的应用与优化
5
作者 李前官 吴程 《电声技术》 2023年第10期26-28,54,共4页
电声技术在汽车音响系统中起着重要作用,能够将电信号转换为可听见的声音。在汽车音响系统的应用中,扬声器的选择与布局、音响系统的设计原则以及对汽车噪声的控制是提升音质的关键。优化扬声器性能、信号处理以及系统调试,可以大幅提... 电声技术在汽车音响系统中起着重要作用,能够将电信号转换为可听见的声音。在汽车音响系统的应用中,扬声器的选择与布局、音响系统的设计原则以及对汽车噪声的控制是提升音质的关键。优化扬声器性能、信号处理以及系统调试,可以大幅提高听觉体验。随着技术的发展,虚拟环绕声技术、音响系统的智能化和绿色节能等,成为汽车音响系统发展的新趋势。 展开更多
关键词 电声技术 汽车音响系统 扬声器 音响系统
下载PDF
基于动态贝叶斯网络的音视频双模态说话人识别 被引量:11
6
作者 吴志勇 蔡莲红 《计算机研究与发展》 EI CSCD 北大核心 2006年第3期470-475,共6页
动态贝叶斯网络在描述具有多个通道的复杂随机过程方面具有优异的性能.基于动态贝叶斯网络进行音视频双模态说话人识别的工作.分析了音视频联合建模的层级结构,利用动态贝叶斯网络对不同层级的音视频关联关系建立模型,并基于该模型进行... 动态贝叶斯网络在描述具有多个通道的复杂随机过程方面具有优异的性能.基于动态贝叶斯网络进行音视频双模态说话人识别的工作.分析了音视频联合建模的层级结构,利用动态贝叶斯网络对不同层级的音视频关联关系建立模型,并基于该模型进行音视频说话人识别的实验.通过对不同层级的建模过程及说话人识别实验的结果进行分析,结果表明,动态贝叶斯网络为描述音视频间的时序相关性和特征相关性提供了有效的建模方法,在不同语音信噪比的情况下均能提高说话人识别的性能. 展开更多
关键词 生物识别 说话人识别 音视频联合建模 融合 动态贝叶斯网络
下载PDF
多通道音频功放监控与保护系统的设计 被引量:2
7
作者 周静雷 张星 董姣 《信息技术》 2016年第9期143-145,151,共4页
为了在扬声器功率测试过程中对音频功放的各个通道和运行环境进行实时监控与保护,设计了一种智能监控与保护系统。采用ARM7作为系统的主控制器,以USB通讯实现上位机终端与下位机的数据交换,通过真有效值转换和AD采集监控每个通道的运行... 为了在扬声器功率测试过程中对音频功放的各个通道和运行环境进行实时监控与保护,设计了一种智能监控与保护系统。采用ARM7作为系统的主控制器,以USB通讯实现上位机终端与下位机的数据交换,通过真有效值转换和AD采集监控每个通道的运行状态,利用温度传感器实时获取系统温度,由继电器负责切断出现故障的通道,同时通过LED灯指出故障所在位置。经过实验测试表明,系统性能稳定,实时性良好,可以达到监控与保护的目的,并有效地降低了音频功放故障维护的难度,提高了测试效率和安全性。 展开更多
关键词 扬声器 音频功放 ARM7 USB通讯 AD采集
下载PDF
基于发音特征的音视频说话人识别鲁棒性的研究 被引量:2
8
作者 陈雁翔 刘鸣 《电子学报》 EI CAS CSCD 北大核心 2010年第12期2920-2924,共5页
人类对语音的感知是多模态的,会同时受到听觉和视觉的影响.以语音及其视觉特征的融合为研究核心,依据发音机理中揭示的音视频之间非同步关联的深层次成因,采用多个发音特征的非同步关联,去描述表面上观察到的音视频之间的非同步,提出了... 人类对语音的感知是多模态的,会同时受到听觉和视觉的影响.以语音及其视觉特征的融合为研究核心,依据发音机理中揭示的音视频之间非同步关联的深层次成因,采用多个发音特征的非同步关联,去描述表面上观察到的音视频之间的非同步,提出了一个基于动态贝叶斯网络的语音与唇动联合模型,并通过音视频双模态的多层次融合,实现了说话人识别系统鲁棒性的提高.音视频双模态数据库上的实验表明了,在不同语音信噪比的条件下多层次融合均达到了更好的性能. 展开更多
关键词 发音特征 音视频 说话人识别 动态贝叶斯网络
下载PDF
相控阵扬声器系统 被引量:3
9
作者 彭妙颜 王齐祥 王恒 《广州大学学报(自然科学版)》 CAS 2012年第4期75-78,共4页
论述了相控阵扬声器系统的设计原理,结构、特色及工程应用.一般的扬声器系统,利用基于机械震动的物理、声学方法来获得良好性能,目前广为流行的线阵列扬声器系统,是将物理、声学技术发挥到极致,而相控阵扬声器系统则是将电子技术、数字... 论述了相控阵扬声器系统的设计原理,结构、特色及工程应用.一般的扬声器系统,利用基于机械震动的物理、声学方法来获得良好性能,目前广为流行的线阵列扬声器系统,是将物理、声学技术发挥到极致,而相控阵扬声器系统则是将电子技术、数字技术、计算机技术、电声技术结合并创造性地运用DSP技术,研制适用的算法,对扬声器阵列中的所有单元的各个频段,分别进行适当的相位调控、音效处理,从而实现实时调控扬声器阵列辐射主瓣的辐射角、指向性和放声效果. 展开更多
关键词 相控阵扬声器 数字声频处理器 幅射角 指向性
下载PDF
基于UniSpeech-SDA80D51的车载音响声控系统 被引量:1
10
作者 王琼 郭恒飞 孙保群 《电子技术应用》 北大核心 2011年第5期42-44,48,共4页
提出一种语音命令控制车载音响操作的设计方案,以德国Infineon公司新推出的具有DSP和单片机双核的SoC语音处理芯片UniSpeech-SDA80D51为核心组成非特定人车载音响语音控制系统,并实现了系统样机的研制。该系统在江淮同悦SL1102C1型车载... 提出一种语音命令控制车载音响操作的设计方案,以德国Infineon公司新推出的具有DSP和单片机双核的SoC语音处理芯片UniSpeech-SDA80D51为核心组成非特定人车载音响语音控制系统,并实现了系统样机的研制。该系统在江淮同悦SL1102C1型车载音响上进行了语音控制实测,实测数据表明系统语音识别率可达到95%。 展开更多
关键词 非特定人语音识别 车载音响语音控制 UniSpeech—SDA80D51 隐马尔可夫模型
下载PDF
音频强声系统的设计与实现 被引量:1
11
作者 陈克安 汪嵩 +1 位作者 刘玲 许妍妍 《电声技术》 2014年第7期27-31,57,共6页
研究目的是设计和实现一套音频强声系统,用于输出高强度噪声和语音,用于强声拒止和远距离语音传输。首先,基于声学理论知识和阵列波束形成基本原理,运用有限元和边界元方法进行声学仿真,设计扬声器基阵阵型;其次,基于声学仿真结果对音... 研究目的是设计和实现一套音频强声系统,用于输出高强度噪声和语音,用于强声拒止和远距离语音传输。首先,基于声学理论知识和阵列波束形成基本原理,运用有限元和边界元方法进行声学仿真,设计扬声器基阵阵型;其次,基于声学仿真结果对音频强声系统加以实现,在全消声室环境测试系统辐射指向性,对比声学仿真和测试结果并得出结论;最后,使用音频强声系统进行躁怒度主观评价实验,研究人群对音频强声系统辐射声场的躁怒度评价及影响评价的因素。 展开更多
关键词 音频强声系统 扬声器基阵 声学仿真 指向性
下载PDF
基于非特定人车载音响语音控制系统的设计与实现 被引量:1
12
作者 孙保群 郭恒飞 王琼 《微型机与应用》 2011年第5期105-108,共4页
提出一种语音命令控制车载音响操作的设计方案,以德国Infineon公司新推出的具有DSP和单片机双核的SoC语音处理芯片UniSpeech-SDA80D51为核心组成非特定人车载音响语音控制系统,并实现了系统样机的研制。该系统在江淮同悦SL1102C1型车载... 提出一种语音命令控制车载音响操作的设计方案,以德国Infineon公司新推出的具有DSP和单片机双核的SoC语音处理芯片UniSpeech-SDA80D51为核心组成非特定人车载音响语音控制系统,并实现了系统样机的研制。该系统在江淮同悦SL1102C1型车载音响上进行了语音控制实测,实测数据表明系统语音识别率可达到95%。 展开更多
关键词 非特定人语音识别 车载音响语音控制 UniSpeech—SDA80D51 隐马尔可夫模型
下载PDF
江阴广电演播室音频处理与扩声设备的选用 被引量:1
13
作者 丁雷 《电声技术》 2016年第8期1-9,18,共10页
结合江阴广电中心大型演播室电声系统设计的实际,对系统中的扩声与制播调音台、数字音频处理器、数字功率放大器、主扩声线性阵列、台口补声、返听及监听扬声器等设备进行了具体品牌、型号的选择,对其功能参数进行了描述,并对这些设备... 结合江阴广电中心大型演播室电声系统设计的实际,对系统中的扩声与制播调音台、数字音频处理器、数字功率放大器、主扩声线性阵列、台口补声、返听及监听扬声器等设备进行了具体品牌、型号的选择,对其功能参数进行了描述,并对这些设备如何进行系统整合进行了介绍。 展开更多
关键词 演播室 电声 调音台 音频处理器 功放 扬声器
下载PDF
说话人听觉识别研究综述
14
作者 杨俊杰 李剑 《贵州警官职业学院学报》 2010年第6期64-67,共4页
说话人的听觉识别一直都是司法话者识别的重要方法之一。国外实验表明:听觉识别率随时间的延长在降低,它与样本的长度、质量、内容以及听辨人的身份相关而与听辨人的性别无关。国外,亲听证人听辨法已经成为一种常见的司法话者识别方法,... 说话人的听觉识别一直都是司法话者识别的重要方法之一。国外实验表明:听觉识别率随时间的延长在降低,它与样本的长度、质量、内容以及听辨人的身份相关而与听辨人的性别无关。国外,亲听证人听辨法已经成为一种常见的司法话者识别方法,而我国实践中却应用得较少,因此有必要加强相关理论的应用研究。 展开更多
关键词 司法话者识别 听觉识别 亲听证人听辨法
下载PDF
楼寓对讲系统免提终端设备音频设计考虑要素
15
作者 戎玲 《电视技术》 北大核心 2011年第16期46-49,共4页
通话传输特性是评价楼寓对讲系统性能的重要指标之一,因此楼寓对讲设备终端的音频设计非常重要。从电路设计和结构设计两大方面出发,较系统地讨论了楼寓对讲系统免提终端设备音频设计需考虑的要素,对通话质量的提高有一定的实际作用。
关键词 楼寓对讲系统 免提终端 音频 扬声器 传声器 结构设计
下载PDF
基于NE5532和LM1875T音频功率放大器的设计与制作 被引量:3
16
作者 王刚 陈卓彦 《中国西部科技》 2015年第12期6-9,共4页
本文全面介绍了以NE5532和LM1875T为核心元件,制作高保真双声道立体超低音功率放大器的方法和步骤,包括原理图设计,装配调试和音箱制作等,对初学者有很好的参考和实践价值。
关键词 音频功率放大器 LM1875T NE5532 音箱制作
下载PDF
基于HMM模型的非特定人车载音响语音控制系统
17
作者 王琼 郭恒飞 +1 位作者 孙冬 夏光 《电气自动化》 2011年第2期38-40,共3页
提出一种语音命令控制车载音响操作的设计方案,以德国Infineon公司新推出的具有DSP和单片机双核的Soc语音处理芯片UniSpeech—SDA80D51为核心组成非特定人车载音响语音控制器系统,实现对SL1102C1车载音响的语音控制。介绍了语音控制... 提出一种语音命令控制车载音响操作的设计方案,以德国Infineon公司新推出的具有DSP和单片机双核的Soc语音处理芯片UniSpeech—SDA80D51为核心组成非特定人车载音响语音控制器系统,实现对SL1102C1车载音响的语音控制。介绍了语音控制器系统的构成、专用语音处理芯片SDA80D51功能及工作原理、非特定人语音识别软件HMM算法以及SDA80D51与SL1102C1接口控制方案。系统在江淮同悦SL1102C1型车载音响上进行了语音控制实测,实测数据表明系统语音识别率可达到95%。 展开更多
关键词 HMM 非特定人语音识别 UniSpeech—SDA80D51 车载音响
下载PDF
2017年司法语音及声学研究 被引量:4
18
作者 康锦涛 王莉 +3 位作者 王晓笛 盛卉 李敬阳 黄文林 《刑事技术》 2018年第3期179-186,共8页
司法语音及声学在2017年发展迅速,本文对其中的代表性成果进行梳理。在语音同一认定方面,VPA成为听觉分析的热点,一些机构对鉴定意见表述分类更加细致,自动识别技术不断发展,其与专家鉴定的关系各方仍有不同意见,部分机构与学者开始推... 司法语音及声学在2017年发展迅速,本文对其中的代表性成果进行梳理。在语音同一认定方面,VPA成为听觉分析的热点,一些机构对鉴定意见表述分类更加细致,自动识别技术不断发展,其与专家鉴定的关系各方仍有不同意见,部分机构与学者开始推动检验过程向更加透明化的方向发展。在语音人身分析方面,除了传统的对性别、年龄、地域、体形等属性的推断,语音情感分析也成为研究热点,无论是专家分析还是自动分析都取得了进步。录音的真实性检验中,除了传统检验流程的深入研究,电网频率仍是关注热点。降噪及语音增强开始使用深度神经网络技术并取得了一定成果。 展开更多
关键词 司法语音及声学 语音同一认定 语音人身分析 录音的真实性检验 降噪及语音增强
下载PDF
回顾与展望:历史节点上的中国视听传播研究(2018) 被引量:1
19
作者 高贵武 薛翔 《中国新闻传播研究》 2019年第4期79-91,共13页
本文在分析2018年发表的有关视听传播研究的论文后发现:2018年的中国视听传播研究既包括对广电事业发展的历史回顾,也包括5G、区块链、人工智能等新技术对视听传播影响的展望;既有对文化综艺、纪录片和短视频等热门视听内容的关注,也有... 本文在分析2018年发表的有关视听传播研究的论文后发现:2018年的中国视听传播研究既包括对广电事业发展的历史回顾,也包括5G、区块链、人工智能等新技术对视听传播影响的展望;既有对文化综艺、纪录片和短视频等热门视听内容的关注,也有对传统广电媒体转型的探讨,整体呈现出与视听传播前沿发展同步协振的特征。 展开更多
关键词 视听传播 文化综艺 智能音箱 短视频 互联网电视 媒体转型 广电改革 竖屏
下载PDF
初探基于WFS波场合成技术的工程设计应用——以上海大剧院全息声长廊工程为例 被引量:2
20
作者 徐真德 邹四维 +1 位作者 林勇 刘诗莹 《电声技术》 2017年第4期1-8,共8页
浅析了坐落于上海大剧院的全息声音长廊从工程的建声设计、全息声音响系统设计再到最终应用到现场表演以及音乐制作的实例应用,分三部分阐述了应用波场合成技术的全息声音响系统为大剧院营造出一个具有实验性、创新性的声音艺术空间。... 浅析了坐落于上海大剧院的全息声音长廊从工程的建声设计、全息声音响系统设计再到最终应用到现场表演以及音乐制作的实例应用,分三部分阐述了应用波场合成技术的全息声音响系统为大剧院营造出一个具有实验性、创新性的声音艺术空间。在未来的声音艺术创新中,随着听众审美水平的提高,丰富多变的公共文化空间内,全息声音响系统这一基于波场合成声音技术是一个有效的解决方案,大剧院的案例标志着未来在各类公共文化空间内应用的前瞻性。 展开更多
关键词 波场合成 建声设计 全息声 音响设计 扬声器阵列
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部