声源定位因素包括双耳时间差、双耳声级差、谱因素等,文章在介绍声源定位因素的基础上,引出了人体头部相关传输函数HRTF定义及其特性。基于美国MIT Media Lab发布的HRTF数据库,利用计算机合成两声道虚拟三维音频,并对虚拟声源进行了定...声源定位因素包括双耳时间差、双耳声级差、谱因素等,文章在介绍声源定位因素的基础上,引出了人体头部相关传输函数HRTF定义及其特性。基于美国MIT Media Lab发布的HRTF数据库,利用计算机合成两声道虚拟三维音频,并对虚拟声源进行了定位测试实验,12名听觉正常者参与了主观听音实验,选取10个具有方位信息的音频信号作为刺激信号,听音者将听到的方位记录下来,与预设方位进行对比。最后对实验结果进行了总结分析。展开更多
头相关传输函数(Head Related Transfer Function,HRTF)描述了在自由场情况下,点声源到人耳鼓膜处的传输过程,其中包含有重要的声源定位信息。本文搭建HRTF测量与实验环境,设计和实现一个HRTF数据库,数据库包含中国人平均头模BHead210 ...头相关传输函数(Head Related Transfer Function,HRTF)描述了在自由场情况下,点声源到人耳鼓膜处的传输过程,其中包含有重要的声源定位信息。本文搭建HRTF测量与实验环境,设计和实现一个HRTF数据库,数据库包含中国人平均头模BHead210 481个空间方位的头相关脉冲响应(Head Related Impulse Response)数据。进行主观定位判听实验,比较BHead210人工头测量的HRTF数据和KEMAR人工头HRTF数据在中国受试者上的判听效果。展开更多
为了研究声学头模上不同的头部官能结构对头相关传输函数(Head-Related Transfer Function,HRTF)及录音听感上的影响,对具有不同官能结构的头模进行HRTF测量和对比分析,得出头部不同官能结构对HRTF的影响。进一步的主观评价实验也验证...为了研究声学头模上不同的头部官能结构对头相关传输函数(Head-Related Transfer Function,HRTF)及录音听感上的影响,对具有不同官能结构的头模进行HRTF测量和对比分析,得出头部不同官能结构对HRTF的影响。进一步的主观评价实验也验证了不同的头部官能结构对于声源定位的影响程度不同这一结论。其中,耳廓对声源定位的影响较大,是不可缺少的一个结构,而有无鼻子、头发等其他细节官能结构对声源定位产生的影响则要弱得多,同时这些头部官能结构对听感上的影响与声源类型和入射方向的关系十分密切。展开更多
针对数字助听器中现存声源定位算法精确度低和算法复杂度高的问题,提出一种新的双耳声源定位算法.首先,采集到的双耳声源信号通过Gammatone滤波器分解为若干个子带信号,根据能量的大小对数据进行压缩.然后,利用头相关传递函数(head-rela...针对数字助听器中现存声源定位算法精确度低和算法复杂度高的问题,提出一种新的双耳声源定位算法.首先,采集到的双耳声源信号通过Gammatone滤波器分解为若干个子带信号,根据能量的大小对数据进行压缩.然后,利用头相关传递函数(head-related transfer function,HRTF)中包含的双耳线索,即双耳时间差、双耳声级差及耳间相关性,提取声源位置的特征.最后,声源的位置信息由高斯混合模型(Gaussian mixture model,GMM)分类器识别.实验结果表明,建议的算法具有高精确度、低复杂度及强鲁棒性.展开更多
In order to approach to head related transfer functions (HRTFs), this paper employs and compares three kinds of one input neural network models, namely, multi layer perceptron (MLP) networks, radial basis function ...In order to approach to head related transfer functions (HRTFs), this paper employs and compares three kinds of one input neural network models, namely, multi layer perceptron (MLP) networks, radial basis function (RBF) networks and wavelet neural networks (WNN) so as to select the best network model for further HRTFs approximation. Experimental results demonstrate that wavelet neural networks are more efficient and useful.展开更多
本文设计实现了一个深度神经网络模型,根据人体生理参数及角度信息重建个性化头相关传递函数(Head Related Transfer Function,HRTF),仅需一次训练即可得到全部方向的预测HRTFs。网络模型由将人体测量参数作为输入的深度神经网络、将角...本文设计实现了一个深度神经网络模型,根据人体生理参数及角度信息重建个性化头相关传递函数(Head Related Transfer Function,HRTF),仅需一次训练即可得到全部方向的预测HRTFs。网络模型由将人体测量参数作为输入的深度神经网络、将角度信息作为输入的展开层以及将前两者的输出作为输入的深度神经网络组成。最后对所提出方法的整体性能进行了客观评价。展开更多
三维(Three-dimension,3D)多媒体技术,尤其是和3D视频相比有所差距的3D音频技术受到了广泛的关注。当前三维音频技术研究可分为基于物理声场重建的多声道音频技术和基于感知的声音场景重建的多声道音频技术两大类。物理声场重建技术的...三维(Three-dimension,3D)多媒体技术,尤其是和3D视频相比有所差距的3D音频技术受到了广泛的关注。当前三维音频技术研究可分为基于物理声场重建的多声道音频技术和基于感知的声音场景重建的多声道音频技术两大类。物理声场重建技术的重要代表是基于球谐分解的声重放技术和波场合成技术(Wave field synthesis,WFS),基于感知的声音场景重建技术主要包括幅度平移技术(Amplitude panning,AP)和基于头相关传输函数的双耳重建技术(Head related transfer function,HRTF)。本文对上述4类三维音频技术及其对应的典型系统进行了介绍及对比分析,并对三维音频技术当前3大主要研究热点:空间听觉机制、三维音频压缩编码以及三维音频系统精简的现状与前沿技术进行了介绍。展开更多
文摘声源定位因素包括双耳时间差、双耳声级差、谱因素等,文章在介绍声源定位因素的基础上,引出了人体头部相关传输函数HRTF定义及其特性。基于美国MIT Media Lab发布的HRTF数据库,利用计算机合成两声道虚拟三维音频,并对虚拟声源进行了定位测试实验,12名听觉正常者参与了主观听音实验,选取10个具有方位信息的音频信号作为刺激信号,听音者将听到的方位记录下来,与预设方位进行对比。最后对实验结果进行了总结分析。
文摘头相关传输函数(Head Related Transfer Function,HRTF)描述了在自由场情况下,点声源到人耳鼓膜处的传输过程,其中包含有重要的声源定位信息。本文搭建HRTF测量与实验环境,设计和实现一个HRTF数据库,数据库包含中国人平均头模BHead210 481个空间方位的头相关脉冲响应(Head Related Impulse Response)数据。进行主观定位判听实验,比较BHead210人工头测量的HRTF数据和KEMAR人工头HRTF数据在中国受试者上的判听效果。
文摘为了研究声学头模上不同的头部官能结构对头相关传输函数(Head-Related Transfer Function,HRTF)及录音听感上的影响,对具有不同官能结构的头模进行HRTF测量和对比分析,得出头部不同官能结构对HRTF的影响。进一步的主观评价实验也验证了不同的头部官能结构对于声源定位的影响程度不同这一结论。其中,耳廓对声源定位的影响较大,是不可缺少的一个结构,而有无鼻子、头发等其他细节官能结构对声源定位产生的影响则要弱得多,同时这些头部官能结构对听感上的影响与声源类型和入射方向的关系十分密切。
文摘针对数字助听器中现存声源定位算法精确度低和算法复杂度高的问题,提出一种新的双耳声源定位算法.首先,采集到的双耳声源信号通过Gammatone滤波器分解为若干个子带信号,根据能量的大小对数据进行压缩.然后,利用头相关传递函数(head-related transfer function,HRTF)中包含的双耳线索,即双耳时间差、双耳声级差及耳间相关性,提取声源位置的特征.最后,声源的位置信息由高斯混合模型(Gaussian mixture model,GMM)分类器识别.实验结果表明,建议的算法具有高精确度、低复杂度及强鲁棒性.
文摘In order to approach to head related transfer functions (HRTFs), this paper employs and compares three kinds of one input neural network models, namely, multi layer perceptron (MLP) networks, radial basis function (RBF) networks and wavelet neural networks (WNN) so as to select the best network model for further HRTFs approximation. Experimental results demonstrate that wavelet neural networks are more efficient and useful.
文摘本文设计实现了一个深度神经网络模型,根据人体生理参数及角度信息重建个性化头相关传递函数(Head Related Transfer Function,HRTF),仅需一次训练即可得到全部方向的预测HRTFs。网络模型由将人体测量参数作为输入的深度神经网络、将角度信息作为输入的展开层以及将前两者的输出作为输入的深度神经网络组成。最后对所提出方法的整体性能进行了客观评价。
文摘三维(Three-dimension,3D)多媒体技术,尤其是和3D视频相比有所差距的3D音频技术受到了广泛的关注。当前三维音频技术研究可分为基于物理声场重建的多声道音频技术和基于感知的声音场景重建的多声道音频技术两大类。物理声场重建技术的重要代表是基于球谐分解的声重放技术和波场合成技术(Wave field synthesis,WFS),基于感知的声音场景重建技术主要包括幅度平移技术(Amplitude panning,AP)和基于头相关传输函数的双耳重建技术(Head related transfer function,HRTF)。本文对上述4类三维音频技术及其对应的典型系统进行了介绍及对比分析,并对三维音频技术当前3大主要研究热点:空间听觉机制、三维音频压缩编码以及三维音频系统精简的现状与前沿技术进行了介绍。