-
题名基于神经网络的声源定位算法研究
- 1
-
-
作者
马国昊
牛长流
王阳
-
机构
北方工业大学信息学院
-
出处
《数字技术与应用》
2021年第7期106-109,共4页
-
文摘
声音作为人们日常生活中信息表达和接收的重要方式之一,包含了大量的有用信息,其应用范围涵盖了生活的方方面面。因此对于声源定位的深入研究依旧具有广泛的现实意义。本文研究了基于神经网络的声源定位技术,首先介绍了三种传统的声源定位算法,并主要研究了基于相位变换的广义互相关的定位算法(GCC-PHAT),随后根据一种新的单声道和多声道录音数据库(SMARD)建立了房间冲激响应(RIR)模型,并通过麦克风阵列对空间随机生成的声源进行采集,结合全连接神经网络模型进行训练,利用训练好的模型对信号进行分类,最终得到声源的方位。实验结果表明,在不同混响条件和信噪比的环境下,基于神经网络的声源定位算法具有较高的定位准确率。
-
关键词
声源定位
麦克风阵列
神经网络
广义互相关
房间冲激响应
-
Keywords
Sound source localization
Microphone array
Neural networks
Generalized cross-correlation
Room impulse response
-
分类号
TN912.3
[电子电信—通信与信息系统]
-
-
题名基于深度学习的多人语音识别研究
被引量:1
- 2
-
-
作者
王阳
牛长流
马国昊
王乐
牛青妍
王天
-
机构
北方工业大学信息学院
-
出处
《数字技术与应用》
2021年第7期71-74,共4页
-
文摘
随着计算机与通信技术的发展,个人信息泄露的问题日益严重,人们对个人信息安全也越发重视,身份鉴别则是信息安全的重要一环,寻求更加方便快捷且可靠性高的身份验证方式成为了当今许多研究人员的研究重点。语言作为人类交流最重要的工具,每个人的声音都是独一无二的,因此将声音作为身份鉴别的技术引起了研究人员的兴趣。使用声音鉴别身份的原理是提取说话人语音的特征参数,为其建立数学模型,与待测语音进行比对,从而判断出说话人身份。同时随着深度学习技术的不断发展,解决了传统数学模型的过拟合问题,并且可以更好地对说话人特征进行学习。
-
关键词
说话人识别
特征提取
深度学习
-
Keywords
Speaker recognition
Feature extraction
Deep learning
-
分类号
TN912.34
[电子电信—通信与信息系统]
-
-
题名基于T-BOX的车联网安全研究
被引量:1
- 3
-
-
作者
黄媛媛
牛长流
王阳
马国昊
-
机构
北方工业大学信息学院
-
出处
《数字技术与应用》
2021年第5期187-189,共3页
-
文摘
本文基于车载T-BOX模型进行渗透攻击从而进一步定位车联网的安全风险。文中介绍了车联网智能终端T-BOX的基本内容和对其进行入侵攻击的方法,以及高危漏洞挖掘。同时对车联网的安全加固提出解决方案。
-
关键词
车联网
T-BOX
安全渗透
智能固件
-
Keywords
Internet of vehicles
T-BOX
Penetration test
Smart firmware
-
分类号
TP309
[自动化与计算机技术—计算机系统结构]
-