期刊文献+
共找到408篇文章
< 1 2 21 >
每页显示 20 50 100
杨立东:用高品质的产品和服务回报社会
1
作者 杨立东 《智能建筑与城市信息》 2004年第4期71-71,共1页
2003年下半年施耐德电气正式进入了中国综合布线市场。随着技术的进步、语音、数据、图像(VDI)在信息处理和工业自动化控制领域成为了不可分割的整体,满足VDI信息传输的布线系统成为施耐德电气全球范围内服务用户的“透明工厂,透明建... 2003年下半年施耐德电气正式进入了中国综合布线市场。随着技术的进步、语音、数据、图像(VDI)在信息处理和工业自动化控制领域成为了不可分割的整体,满足VDI信息传输的布线系统成为施耐德电气全球范围内服务用户的“透明工厂,透明建筑”这一系统解决方案的基本组成。 展开更多
关键词 智能建筑 综合布线工程 品牌 杨立东
下载PDF
基于改进残差和注意力的CT肺癌辅助诊断
2
作者 谷宇 迟靖千 +3 位作者 张宝华 杨立东 李建军 唐思源 《传感器与微系统》 CSCD 北大核心 2024年第9期30-34,共5页
为了提高结节检测和肺癌诊断的性能,本文提出一种改进的卷积神经网络(CNN)模型用于这2个步骤的结节特征提取。该模型以一种改进U-Net网络作为基础网络,并引入了ResNeXt模块和注意力机制,在保持模型复杂度的同时,提高网络学习多种形状和... 为了提高结节检测和肺癌诊断的性能,本文提出一种改进的卷积神经网络(CNN)模型用于这2个步骤的结节特征提取。该模型以一种改进U-Net网络作为基础网络,并引入了ResNeXt模块和注意力机制,在保持模型复杂度的同时,提高网络学习多种形状和大小的结节特征的能力。实验结果表明:该模型在DSB数据集上表现良好,结节检测的灵敏度和特异性分别达到了99.15%和99.99%,肺癌诊断的准确率和AUC值分别达到了80.43%和0.86。可见,本文方法对于多种多样的结节特征具有高度敏感性,具有一定的临床价值。 展开更多
关键词 肺结节辅助检测 肺癌辅助诊断 CT图像 卷积神经网络 ResNeXt模块 注意力机制
下载PDF
脉冲噪声下基于Sigmoid的LFM信号参数估计 被引量:1
3
作者 王厚友 郭勇 杨立东 《电子测量技术》 北大核心 2024年第2期176-184,共9页
由于脉冲噪声具有的短时大幅值特性,使得基于高斯假设的信号参数估计方法无法在脉冲噪声环境下有效估计参数。针对此问题,利用α稳定分布模拟随机脉冲噪声,提出了一种基于Sigmoid-CFRFT的LFM信号参数估计方法。首先,建立了一种自适应Sig... 由于脉冲噪声具有的短时大幅值特性,使得基于高斯假设的信号参数估计方法无法在脉冲噪声环境下有效估计参数。针对此问题,利用α稳定分布模拟随机脉冲噪声,提出了一种基于Sigmoid-CFRFT的LFM信号参数估计方法。首先,建立了一种自适应Sigmoid函数,证明了信号经过此非线性变换后,信号的2阶矩由无界变为有界,且信号的相位信息保持不变。其次,将变换后的信号进行离散时间CFRFT,建立了数学优化模型,并使用水循环算法搜索最优值点。最后,利用了非标准SαS分布噪声的修正方法,分析了标准和非标准分布下参数估计的性能。仿真结果说明,所提方法不仅可以有效抑制脉冲噪声对LFM信号分数谱特征的影响,而且能够实现低信噪比信号参数的高精度估计。相比于现有的基于非线性变换的参数估计方法,本文方法具有更好的精度,稳定性和噪声鲁棒性。 展开更多
关键词 线性调频信号 SIGMOID函数 简明分数阶傅里叶变换 脉冲噪声 参数估计
下载PDF
改进知识蒸馏Transformer的新冠肺炎医学影像分类
4
作者 白浩田 谷宇 +7 位作者 杨立东 张宝华 李建军 吕晓琪 唐思源 张祥松 贾成一 贺群 《激光杂志》 CAS 北大核心 2024年第2期152-160,共9页
针对在筛查新型冠状病毒感染肺炎患者时核酸检测假阴性率较高的问题,提出了一种DRPL-ViT计算机辅助诊断网络。在Vision Transformer的基础上首先引入知识蒸馏机制,使Transformer结构在小数据集上训练取得更好的拟合效果;然后,在patches... 针对在筛查新型冠状病毒感染肺炎患者时核酸检测假阴性率较高的问题,提出了一种DRPL-ViT计算机辅助诊断网络。在Vision Transformer的基础上首先引入知识蒸馏机制,使Transformer结构在小数据集上训练取得更好的拟合效果;然后,在patches的位置信息编码上,通过更适合视觉任务的相对位置编码方式,使tokens之间的依赖关系能够被更好地捕捉;为了关注到更多的局部特征,在Transformer Encoder模块中引入了传统的卷积模块提取局部特征。实验在四分类测试集上平均分类准确率达到92.11%,对新冠肺炎分类准确率达到97.85%。实验结果表明,所提出的网络对新冠肺炎及其他肺部病变分类准确率较高,有一定的临床应用价值。 展开更多
关键词 医学图像分类 Vision Transformer架构 深度学习 计算机X线摄影 新冠肺炎
下载PDF
面向虚拟现实场景的房间脉冲响应计算模型
5
作者 李知禹 王晶 +3 位作者 岳欣雯 杨立东 赵胜辉 谢湘 《声学学报》 EI CAS CSCD 北大核心 2024年第6期1186-1196,共11页
提出了一种面向虚拟现实应用场景的房间脉冲响应计算模型,将深度学习神经网络技术与心理声学感知参数结合,能够高效地从虚拟现实场景信息中预测具有听觉感知意义的房间脉冲响应。在确保高质量预测结果的同时,该模型可以满足虚拟现实音... 提出了一种面向虚拟现实应用场景的房间脉冲响应计算模型,将深度学习神经网络技术与心理声学感知参数结合,能够高效地从虚拟现实场景信息中预测具有听觉感知意义的房间脉冲响应。在确保高质量预测结果的同时,该模型可以满足虚拟现实音频场景中生成房间脉冲响应所需的实时性、高采样率、非受限长度和轻量化的要求。模型首先通过图卷积神经网络将场景中的声学信息编码,然后通过神经声场与转置卷积模型将声学信息解码得到房间脉冲响应感知参数,最后根据房间脉冲响应感知参数恢复出房间脉冲响应信号。实验结果表明,所提模型在房间脉冲响应生成质量、计算开销以及功能性方面都有较大的优势,可较好地满足虚拟现实音频对于实时生成房间脉冲响应的需求。 展开更多
关键词 房间脉冲响应 深度学习 感知参数 虚拟现实
下载PDF
脉冲噪声下基于CNN-FRFT的线性调频信号参数估计方法
6
作者 卢景琳 郭勇 杨立东 《探测与控制学报》 CSCD 北大核心 2024年第1期96-104,113,共10页
由于脉冲噪声破坏了线性调频(LFM)信号的分数谱特征,使得基于分数谱特征的参数估计方法无法有效估计参数。针对这个问题,提出一种脉冲噪声环境下基于CNN-FRFT的LFM信号参数估计方法。首先,利用α稳定分布拟合随机脉冲噪声,构建加性含噪... 由于脉冲噪声破坏了线性调频(LFM)信号的分数谱特征,使得基于分数谱特征的参数估计方法无法有效估计参数。针对这个问题,提出一种脉冲噪声环境下基于CNN-FRFT的LFM信号参数估计方法。首先,利用α稳定分布拟合随机脉冲噪声,构建加性含噪信号,输入卷积神经网络(CNN)进行训练和测试;其次,利用训练好的CNN模型对信号进行去噪,并验证模型的去噪能力和泛化能力;最后,利用分数阶傅里叶变换(FRFT)建立去噪信号的分数谱,通过峰值点位置来估计LFM信号的参数。实验结果表明,相比于传统的基于非线性函数的方法,该方法在强脉冲噪声环境下具有更好的精度和噪声鲁棒性,CNN的应用使其具有更强的泛化能力,在实测脉冲噪声下仍可以准确估计参数。 展开更多
关键词 脉冲噪声 线性调频信号 参数估计 卷积神经网络 分数阶傅里叶变换
下载PDF
脉冲噪声下基于DCNN的LFM信号去噪方法
7
作者 卢景琳 郭勇 杨立东 《现代雷达》 CSCD 北大核心 2024年第10期104-114,共11页
由于脉冲噪声具有明显的尖峰脉冲特性,使得基于高斯假设的传统去噪方法无法有效滤除脉冲噪声。针对这个问题,文中提出了一种脉冲噪声下基于深度卷积神经网络(DCNN)的线性调频(LFM)信号去噪方法。首先,生成LFM信号和随机脉冲噪声,构建不... 由于脉冲噪声具有明显的尖峰脉冲特性,使得基于高斯假设的传统去噪方法无法有效滤除脉冲噪声。针对这个问题,文中提出了一种脉冲噪声下基于深度卷积神经网络(DCNN)的线性调频(LFM)信号去噪方法。首先,生成LFM信号和随机脉冲噪声,构建不同广义信噪比下的数据集,输入DCNN进行训练和测试。进而,从时域波形图、分数谱、时频分布三个方面验证模型的去噪能力。最后,对去噪LFM信号进行分数阶傅里叶变换,通过搜寻分数谱中的峰值点来估计LFM信号的参数。仿真实验结果表明,文中方法不仅能够有效去除含噪信号中的随机脉冲噪声,而且还可以保持LFM信号的时域特征、分数谱特征和时频特征基本不变,进而提高了参数估计的噪声鲁棒性。与传统的基于非线性变换的方法相比,本文方法在低信噪比下仍能有效保持信号的分数谱特征和时频特征,具有更好的去噪性能和泛化能力。 展开更多
关键词 脉冲噪声 深度卷积神经网络 线性调频信号 分数阶傅里叶变换
下载PDF
河北省沧州城区6~14岁学龄儿童眼病现况调查 被引量:10
8
作者 杨立东 赵华 +7 位作者 杨云东 张歆 贾洪强 梁四妥 周畅达 周文宗 李亚楠 徐深 《国际眼科杂志》 CAS 2014年第5期908-912,共5页
目的:了解沧州地区学龄儿童眼部多发眼病种类及其相关危险因素,为学龄儿童眼部疾病预防及治疗提供可靠的流行病学依据。方法:我们对河北省沧州市区及所辖县市单纯随机抽取20所学校作为调查点,抽取调查对象3 150例6 299眼,一到三年级儿... 目的:了解沧州地区学龄儿童眼部多发眼病种类及其相关危险因素,为学龄儿童眼部疾病预防及治疗提供可靠的流行病学依据。方法:我们对河北省沧州市区及所辖县市单纯随机抽取20所学校作为调查点,抽取调查对象3 150例6 299眼,一到三年级儿童只接受医生眼部健康状况检查,四到六年级儿童接受医生眼部健康状况检查及眼表疾病指数问卷调查。所有结果资料采用SPSS 16.0进行统计学分析。结果:视力<0.9者42.42%,共2 672眼;干眼858例,患病率27.24%;睑缘及结膜炎症1 423眼,患病率22.59%;斜视189例,患病率6.00%。其他:先天性白内障8眼,患病率为0.13%;先天性上睑下垂78眼,患病率1.90%;下睑倒睫89眼,患病率1.41%;陈旧性眼外伤13眼,先天小视乳头4眼,男性儿童中有1眼为义眼。结论:学龄期儿童视力<0.9者比例较高,而低视力中近视所占的比例最高,提示广大眼科医师及家长儿童眼病的防治工作必须从保健入手,从小抓起,早发现、早治疗各种眼病以确保儿童较好的视力。 展开更多
关键词 流行病学调查 学龄期儿童 低于正常视力 屈光不正 弱视 眼压 干眼症
下载PDF
基于低秩张量补全的多声道音频信号恢复方法 被引量:5
9
作者 杨立东 王晶 +2 位作者 谢湘 赵毅 匡镜明 《电子与信息学报》 EI CSCD 北大核心 2016年第2期394-399,共6页
多声道音频信号在r采集、压缩、传输过程中可能造成音频数据丢失,为了确保给听众带来更真实的听觉感受,该文提出一种基于低秩张量补全的音频丢失数据恢复方法。首先,把多声道音频信号表示为一个张量;其次,把张量补全作为一个凸优化问题... 多声道音频信号在r采集、压缩、传输过程中可能造成音频数据丢失,为了确保给听众带来更真实的听觉感受,该文提出一种基于低秩张量补全的音频丢失数据恢复方法。首先,把多声道音频信号表示为一个张量;其次,把张量补全作为一个凸优化问题建模,利用松弛技术和变量分离技术得到闭合的增强拉格朗日函数;最后,通过交替迭代方法求解得到恢复的音频张量。在不同数据丢失率的实验中,通过与线性预测、加权优化的CANDECOMP/PARAFAC分解方法进行对比分析,表明利用张量补全方法具有更高的音频信号恢复精度,隐藏参考和基准的多激励测试结果也显示低秩张量补全方法能够有效地恢复多声道音频的丢失数据,从而获得更好的听觉效果。 展开更多
关键词 音频信号恢复 张量补全 迹范数 凸优化
下载PDF
基于张量分解模型的语音信号特征提取方法 被引量:7
10
作者 杨立东 王晶 +1 位作者 谢湘 匡镜明 《北京理工大学学报》 EI CAS CSCD 北大核心 2013年第11期1171-1175,共5页
提出了一种通过张量分解提取语音信号特征的方法.该方法对语音信号进行预处理,然后对每帧语音信号进行小波分解得到不同尺度上的信息,对这些信息提取传统特征参数,构建一个帧结构×分解尺度×特征参数的三阶张量,并经过张量分... 提出了一种通过张量分解提取语音信号特征的方法.该方法对语音信号进行预处理,然后对每帧语音信号进行小波分解得到不同尺度上的信息,对这些信息提取传统特征参数,构建一个帧结构×分解尺度×特征参数的三阶张量,并经过张量分解得到各阶投影矩阵,从而建立语音信号在高阶空间上的特征体系,以便充分表征语音信号的特征.实验结果表明,本文提出的方法与传统特征参数体系比较,有利于语音识别系统性能的提高,并且对于带噪语音的识别具有一定的鲁棒性. 展开更多
关键词 张量分解 特征提取 投影矩阵
下载PDF
语音信号特征选择优化提取仿真研究 被引量:7
11
作者 杨立东 谷宇 张明 《计算机仿真》 CSCD 北大核心 2016年第2期409-412,417,共5页
在语音识别系统中,表示语音信号的高维特征矢量会使系统复杂度上升。由于语音信号存在无用和冗余信息,为了去除冗余和不相关特征,当语音信号经过预处理、提取特征参数之后,使用蚁群优化算法在特征矢量空间中选择本质特征,从而以不牺牲... 在语音识别系统中,表示语音信号的高维特征矢量会使系统复杂度上升。由于语音信号存在无用和冗余信息,为了去除冗余和不相关特征,当语音信号经过预处理、提取特征参数之后,使用蚁群优化算法在特征矢量空间中选择本质特征,从而以不牺牲识别率为前提完成降维。利用隐马尔科夫模型(HMM)进行语音识别的仿真结果表明,在汉语数字语音识别系统上,蚁群优化算法的性能优于传统的遗传算法和未进行特征选择的原始特征集合。分析结果显示利用蚁群优化的特征集合可以提高识别系统的性能,而且识别速度得到了提高。 展开更多
关键词 蚁群优化 特征提取 特征选择 语音识别
下载PDF
基于Tucker分解的音频分类研究 被引量:3
12
作者 杨立东 王晶 +1 位作者 谢湘 匡镜明 《信号处理》 CSCD 北大核心 2015年第2期221-225,共5页
提出一种利用Tucker分解获得鲁棒性较强的音频信号不同属性的特征,在高斯混合模型上测试音频信号分类性能的方法。音频信号经过预处理后,提取其不同类型特征集合,包括常规声学特征参数集合、听觉感知特征参数集合、心理声学特征参数集合... 提出一种利用Tucker分解获得鲁棒性较强的音频信号不同属性的特征,在高斯混合模型上测试音频信号分类性能的方法。音频信号经过预处理后,提取其不同类型特征集合,包括常规声学特征参数集合、听觉感知特征参数集合、心理声学特征参数集合;然后由三种特征集合构建三阶特征张量,通过Tucker分解得到每一类特征阶投影矩阵并进行主分量分析;最后使用包括音乐、语音、噪声3种类型的300条音频数据测试不同特征集合的分类效果,在此过程中使用了有监督学习的高斯混合模型作为分类器。实验中比较了不同特征集合使用高斯混合模型的分类正确率。实验结果表明,Tucker分解获得的特征集合实现了较好的分类,说明该方法性能优于传统特征集合。 展开更多
关键词 音频分类 Tucker分解 高斯混合模型 心理声学特征
下载PDF
角膜板层切除氟康唑角膜基质注射联合自体结膜移植治疗真菌性角膜炎 被引量:1
13
作者 杨立东 杨云东 +2 位作者 张歆 贾洪强 徐深 《国际眼科杂志》 CAS 2013年第8期1592-1594,共3页
目的: 探讨角膜板层切除、氟康唑角膜基质注射、自体结膜移植三联术治疗中、浅层真菌性角膜炎的手术适应证及时机,并对其临床效果进行分析。方法: 对我院2005-03/2010-06药物治疗效果不显著、病灶位于角膜中、浅层的真菌性角膜炎患者168... 目的: 探讨角膜板层切除、氟康唑角膜基质注射、自体结膜移植三联术治疗中、浅层真菌性角膜炎的手术适应证及时机,并对其临床效果进行分析。方法: 对我院2005-03/2010-06药物治疗效果不显著、病灶位于角膜中、浅层的真菌性角膜炎患者168例,大于病灶边缘0.5mm角膜刀板层切除病变角膜至基本透明,角膜基质注射2g/L氟康唑至水肿区大于病变区切缘约0.5mm,依病灶大小自患眼就近取带蒂结膜瓣连续缝合覆盖植床。术后第1d常规开放点眼,并观察角膜感染有无复发,注射造成水肿消退情况,结膜植片血运及患眼刺激症状,及视力变化。结果: 患者157眼成功实施三联手术治疗,占拟实施此术式患者93.5%;术后7d好转率96.2%,术后1mo,复发率3.8%,痊愈率95.5%,好转率0.6%;注射药物后角膜基质水肿平均消退时间为13.4h;术后1mo视力较术前提高者占24.8%,无明显变化者占58.0%,下降者占17.2%;角膜内皮损失率0~8%,平均2.9%;术后刺激症状:轻度87%,中度10%,重度3%;住院天数平均7.3d;住院费用平均2160元;术后3mo发现4例角膜轻微膨隆。结论: 角膜板层切除、氟康唑角膜基质注射、自体结膜移植三联术治疗早、中期真菌性角膜炎经济实用、疗效好、痊愈快,二期常规安全行光学性角膜移植术,对于经济条件差患者和角膜供体短缺地区,三联手术可作为首要选择。 展开更多
关键词 角膜板层切除 氟康唑角膜基质注射 自体结膜移植 真菌性角膜炎
下载PDF
AML-M2复发患者白血病细胞中AUER小体增多1例分析 被引量:2
14
作者 杨立东 黄玉平 马云枫 《当代医学》 2016年第5期59-61,共3页
Auer(奥氏小体)小体从发现到现在已经100多年的历史了。它最早是由美国医师John Auer于1906年在粒细胞白血病细胞胞质中发现条状小体,称为Auer小体[1],有关Auer小体的形成、化学成分、形态特点、诊断意义及其与临床疗效的研究虽时有... Auer(奥氏小体)小体从发现到现在已经100多年的历史了。它最早是由美国医师John Auer于1906年在粒细胞白血病细胞胞质中发现条状小体,称为Auer小体[1],有关Auer小体的形成、化学成分、形态特点、诊断意义及其与临床疗效的研究虽时有报道但其与临床疗效、预后的关系等仍待进一步研究探讨。随着血液学的不断发展,人们对Auer小体的观察愈来愈深入,其在白血病等的诊断价值被人们了解的越来越多。 展开更多
关键词 急性髓系白血病 急性粒细胞白血病部分分化型AML-M2 AUER小体 初诊 复发 瑞姬染色 急性糖尿病
下载PDF
基于MySQL数据库的大学生档案管理系统开发
15
作者 李惠娟 张红亮 +1 位作者 杨立东 张晓明 《办公自动化》 2024年第13期73-76,共4页
学生档案是人事档案的重要组成部分,在后续求职、升学、社保等环节发挥着重要的凭证和参考作用。为了推进学院档案管理的现代化和信息化进程,针对目前学院学生档案管理工作存在的问题,基于MySQL数据库和WebStorm开发一套学生档案管理系... 学生档案是人事档案的重要组成部分,在后续求职、升学、社保等环节发挥着重要的凭证和参考作用。为了推进学院档案管理的现代化和信息化进程,针对目前学院学生档案管理工作存在的问题,基于MySQL数据库和WebStorm开发一套学生档案管理系统,可实现学生档案信息管理、滞留档案管理、学籍异动档案管理和账号管理的功能,为缓解管理人员的工作压力、提高档案管理质量提供支撑。 展开更多
关键词 学生档案 管理系统 MYSQL数据库
下载PDF
改进卷积神经网络的音频场景分类研究 被引量:5
16
作者 杨立东 张壮壮 《现代电子技术》 2021年第3期91-94,共4页
音频场景分类作为声学场景理解的关键环节,对机器感知复杂环境并做出智能选择有着非常重要的意义。针对音频场景分类性能提升这一问题,提出改进的基于卷积神经网络模型的音频场景分类方法。首先对音频数据重新采样,预处理后得到对数梅... 音频场景分类作为声学场景理解的关键环节,对机器感知复杂环境并做出智能选择有着非常重要的意义。针对音频场景分类性能提升这一问题,提出改进的基于卷积神经网络模型的音频场景分类方法。首先对音频数据重新采样,预处理后得到对数梅尔谱图,随后输入到改进的卷积神经网络模型,进行卷积和池化处理提取谱图的特征,由Softmax分类器对音频场景标签进行分类。实验最后在城市音频数据集上进行十折交叉验证,实验结果表明,所提模型比传统的卷积神经网络模型的分类准确率更高,准确率达到了80%。 展开更多
关键词 音频场景分类 卷积神经网络 Softmax分类器 特征提取 梅尔谱图 准确率
下载PDF
结合高效通道注意力机制的语音增强算法仿真 被引量:1
17
作者 杨立东 曾江蛟 董桂官 《计算机仿真》 北大核心 2023年第3期258-262,535,共6页
语音增强能有效解决人机交互和语音识别等技术中的噪声干扰问题。为了提高语音增强的效果,提出了一种结合高效通道注意力机制的生成对抗网络,并在两种不同的数据集下进行实验。该方法通过在生成对抗网络的生成器中加入高效的通道注意力... 语音增强能有效解决人机交互和语音识别等技术中的噪声干扰问题。为了提高语音增强的效果,提出了一种结合高效通道注意力机制的生成对抗网络,并在两种不同的数据集下进行实验。该方法通过在生成对抗网络的生成器中加入高效的通道注意力机制来提高抑制无关于语音增强的信息来提高模型的灵活度与准确率。该模型在Nonspeech-100数据集相较于基线模型下语音感知质量评估(PESQ)平均提升了2.79%,语音短时客观可懂度(STOI)平均提升了0.95%;在NoiseX-92数据集下,ESQ平均提升了3.8%,STOI平均提升了2.03%。实验结果表明,该方法在没有增加很大的计算量的情况下提高了模型的性能。 展开更多
关键词 语音增强 生成对抗网络 通道注意力 神经网络
下载PDF
CNN-XGBoost混合模型在音频场景分类中的应用 被引量:2
18
作者 杨立东 胡江涛 张壮壮 《小型微型计算机系统》 CSCD 北大核心 2021年第1期213-217,共5页
在拥有海量数据和强大计算能力的人工智能时代,音频场景分类成为了场景理解的重要研究内容之一.针对音频场景分类建模困难和精确率不高的问题,本文提出一种基于卷积神经网络和极端梯度提升算法相结合的系统模型.首先,将预处理后的音频... 在拥有海量数据和强大计算能力的人工智能时代,音频场景分类成为了场景理解的重要研究内容之一.针对音频场景分类建模困难和精确率不高的问题,本文提出一种基于卷积神经网络和极端梯度提升算法相结合的系统模型.首先,将预处理后的音频信号转换成梅尔声谱图,然后输入到卷积神经网络中完成抽象特征提取,最后利用极端梯度提升算法进行分类.为了评估模型的有效性,在城市音频场景UrbanSound8K数据集上进行分类性能测试,结果表明,该混合算法模型对音频场景的分类精确率可以达到89%,优于传统的神经网络算法模型,说明该混合模型对音频场景分类问题的有效性. 展开更多
关键词 音频场景分类 卷积神经网络 极端梯度提升 梅尔声谱图
下载PDF
多优化机制下深度神经网络的音频场景识别 被引量:2
19
作者 杨立东 胡江涛 《信号处理》 CSCD 北大核心 2021年第10期1969-1976,共8页
随着并行计算能力的不断攀升和音频数据量的日益扩增,音频场景识别成为场景理解领域重要的研究内容之一。针对音频场景识别建模难度大和识别准确率不高的问题,本文提出了融合多优化机制的并行卷积循环神经网络算法模型。首先,将音频信... 随着并行计算能力的不断攀升和音频数据量的日益扩增,音频场景识别成为场景理解领域重要的研究内容之一。针对音频场景识别建模难度大和识别准确率不高的问题,本文提出了融合多优化机制的并行卷积循环神经网络算法模型。首先,将音频信号经预处理后转化为一定尺寸的梅尔声谱图,之后输入到网络模型中进行充分的空间特征和时间特征学习,最后进行识别。为了验证模型的有效性,在DCASE2019音频场景数据集上进行识别性能测试,结果显示,该算法模型对音频场景的识别准确率能够达到88.84%,优于传统网络模型,说明该算法模型对音频场景识别问题的有效性。 展开更多
关键词 音频场景识别 卷积神经网络 批标准化机制 双向门控循环单元
下载PDF
基于音频分类的森林盗伐事件场景识别 被引量:3
20
作者 杨立东 靳浩杨 +1 位作者 王硕 辛文超 《计算机仿真》 北大核心 2020年第8期431-434,共4页
森林是地球上最宝贵的资源,但森林和古树被盗伐的事件却经常发生。将音频分类技术应用于森林保护,通过对盗伐过程中产生的音频进行识别,达到森林保护预警的目的。针对盗伐事件的音频场景特性,提取电锯声、引擎声、机器轰鸣声、手锯声、... 森林是地球上最宝贵的资源,但森林和古树被盗伐的事件却经常发生。将音频分类技术应用于森林保护,通过对盗伐过程中产生的音频进行识别,达到森林保护预警的目的。针对盗伐事件的音频场景特性,提取电锯声、引擎声、机器轰鸣声、手锯声、风噪等五种声音的音频特征,然后使用支持向量机作为分类器对音频事件进行识别。最后根据识别结果确定是否有盗伐行为发生。通过不同训练样本数量对比实验、随机样本实验和单项音频识别准确率实验最终确定总体识别率为99.1%,各项音频单独识别率在90%以上,说明此方法具有较好的识别效果。 展开更多
关键词 音频分类 特征提取 支持向量机
下载PDF
上一页 1 2 21 下一页 到第
使用帮助 返回顶部