期刊文献+
共找到49篇文章
< 1 2 3 >
每页显示 20 50 100
Image Augmentation-Based Food Recognition with Convolutional Neural Networks 被引量:6
1
作者 Lili Pan Jiaohua Qin +3 位作者 Hao Chen Xuyu Xiang Cong Li Ran Chen 《Computers, Materials & Continua》 SCIE EI 2019年第4期297-313,共17页
Image retrieval for food ingredients is important work,tremendously tiring,uninteresting,and expensive.Computer vision systems have extraordinary advancements in image retrieval with CNNs skills.But it is not feasible... Image retrieval for food ingredients is important work,tremendously tiring,uninteresting,and expensive.Computer vision systems have extraordinary advancements in image retrieval with CNNs skills.But it is not feasible for small-size food datasets using convolutional neural networks directly.In this study,a novel image retrieval approach is presented for small and medium-scale food datasets,which both augments images utilizing image transformation techniques to enlarge the size of datasets,and promotes the average accuracy of food recognition with state-of-the-art deep learning technologies.First,typical image transformation techniques are used to augment food images.Then transfer learning technology based on deep learning is applied to extract image features.Finally,a food recognition algorithm is leveraged on extracted deepfeature vectors.The presented image-retrieval architecture is analyzed based on a smallscale food dataset which is composed of forty-one categories of food ingredients and one hundred pictures for each category.Extensive experimental results demonstrate the advantages of image-augmentation architecture for small and medium datasets using deep learning.The novel approach combines image augmentation,ResNet feature vectors,and SMO classification,and shows its superiority for food detection of small/medium-scale datasets with comprehensive experiments. 展开更多
关键词 Image augmentation small-scale dataset deep feature deep learning convolutional neural network
下载PDF
基于K-means聚类和特征空间增强的噪声标签深度学习算法 被引量:1
2
作者 吕佳 邱小龙 《智能系统学报》 CSCD 北大核心 2024年第2期267-277,共11页
深度学习中神经网络的性能依赖于高质量的样本,然而噪声标签会降低网络的分类准确率。为降低噪声标签对网络性能的影响,噪声标签学习算法被提出。该算法首先将训练样本集划分成干净样本集和噪声样本集,然后使用半监督学习算法对噪声样... 深度学习中神经网络的性能依赖于高质量的样本,然而噪声标签会降低网络的分类准确率。为降低噪声标签对网络性能的影响,噪声标签学习算法被提出。该算法首先将训练样本集划分成干净样本集和噪声样本集,然后使用半监督学习算法对噪声样本集赋予伪标签。然而,错误的伪标签以及训练样本数量不足的问题仍然限制着噪声标签学习算法性能的提升。为解决上述问题,提出基于K-means聚类和特征空间增强的噪声标签深度学习算法。首先,该算法利用K-means聚类算法对干净样本集进行标签聚类,并根据噪声样本集与聚类中心的距离大小筛选出难以分类的噪声样本,以提高训练样本的质量;其次,使用mixup算法扩充干净样本集和噪声样本集,以增加训练样本的数量;最后,采用特征空间增强算法抑制mixup算法新生成的噪声样本,从而提高网络的分类准确率。并在CIFAR10、CIFAR100、MNIST和ANIMAL-10共4个数据集上试验验证了该算法的有效性。 展开更多
关键词 噪声标签学习 深度学习 半监督学习 机器学习 神经网络 K-MEANS聚类 特征空间增强 mixup算法
下载PDF
纺织品车缝线迹分割网络
3
作者 李鑫 崔文婷 +3 位作者 金帆 於全豪 余烨 路强 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2024年第8期1246-1254,共9页
针对织物车缝线缝制工艺多样,造成其种类多、形态不定以及缝线与织物纹理近似性等导致车缝线准确分割困难等问题,提出一个基于多尺度特征的纺织品车缝线迹分割网络.首先采用融合注意力机制的残差网络提取其位置信息;然后使用增强特征金... 针对织物车缝线缝制工艺多样,造成其种类多、形态不定以及缝线与织物纹理近似性等导致车缝线准确分割困难等问题,提出一个基于多尺度特征的纺织品车缝线迹分割网络.首先采用融合注意力机制的残差网络提取其位置信息;然后使用增强特征金字塔模块,充分利用多尺度特征得到预候选区域的语义信息,将其融合后经过筛选得到车缝线候选区域;最后经过全卷积网络实现车缝线的分割.在真实纺织品车缝线数据集SewTrace上进行实验的结果表明,所提网络对纺织品车缝线迹分割的均值平均精度为0.96,计算量为1.5G;在具有相似特征的公开数据集CrackForest,CRKWH100和Kolektor上与其他同类网络进行实验的结果表明,该网络的均值平均精度分别达到0.85,0.89和0.89,分割精度和预测速度指标优于其他同类网络,证明其能够有效地提高线形目标分割精度. 展开更多
关键词 车缝线 多尺度特征 图像分割 注意力机制 增强特征金字塔
下载PDF
基于ASGRU-CNN时空双通道的语音情感识别 被引量:1
4
作者 高鹏淇 黄鹤鸣 《计算机仿真》 2024年第4期180-186,共7页
语音情感识别是实现人机交互的关键,如何提升语音情感识别的准确率以及更有效地提取具有情感代表性的特征是语音情感识别所面临的问题之一。针对以上问题,构建了一种包含空间特征提取模块和时序特征提取模块的双通道时空语音情感识别模... 语音情感识别是实现人机交互的关键,如何提升语音情感识别的准确率以及更有效地提取具有情感代表性的特征是语音情感识别所面临的问题之一。针对以上问题,构建了一种包含空间特征提取模块和时序特征提取模块的双通道时空语音情感识别模型ASGRU-CNN。模型总体框架由两条并行分支组成:第一分支为空间特征提取模块,由三维卷积、二维卷积及池化操作共同构成级联结构;第二分支为时序特征提取模块,由切片循环神经网络内嵌门控循环单元及注意力机制构成。模型以韵律特征及谱特征的融合特征作为输入特征,经过双分支处理后,进入全连接层进行语音情感分类。在CASIA与EMO-DB数据库上进行相关实验,并通过数据扩充增加训练样本,与其它语音情感识别模型实验结果相比,所提出的模型具有较好的鲁棒性和泛化性。 展开更多
关键词 语音情感识别 融合特征 切片循环神经网络 注意力机制 数据扩充
下载PDF
基于数据增强和RFE-PCA-BP的少样本芘浓度分类方法
5
作者 马晨宇 黄越洋 +1 位作者 石元博 孔宪明 《化学研究与应用》 CAS 北大核心 2024年第2期292-298,共7页
该文提出了一种基于数据增强的特征选择拉曼光谱浓度分类方法(Recursive Feature Elimination-Princi-pal Component Analysis-Back Propagation Neural Network,RFE-PCA-BP)。实验将购买于超市的食用油与不同浓度的嵌二萘溶液滴在硅藻... 该文提出了一种基于数据增强的特征选择拉曼光谱浓度分类方法(Recursive Feature Elimination-Princi-pal Component Analysis-Back Propagation Neural Network,RFE-PCA-BP)。实验将购买于超市的食用油与不同浓度的嵌二萘溶液滴在硅藻土板上,采集九种不同浓度芘(Pyrene)的拉曼光谱数据,通过数据增强,将每种浓度数据通过添加不同信噪比(SNR)来扩充样本数量;RFE-PCA-BP浓度分类模型将拉曼光谱数据的特征消除、数据预处理、浓度分类合而为一。通过实验证明,RFE-PCA-BP算法的准确率高达99.42%远高于BP神经网络算法(Back Propagation Neural Network,BPNN)的86.67%。 展开更多
关键词 拉曼光谱 浓度分类 数据增强 神经网络 特征选择
下载PDF
基于潜在特征增强网络的视频描述生成方法
6
作者 李伟健 胡慧君 《计算机工程》 CAS CSCD 北大核心 2024年第2期266-272,共7页
视频描述生成旨在用自然语言描述视频中的物体及其相互作用。现有方法未充分利用视频中的时空语义信息,限制了模型生成准确描述语句的能力。为此,提出一种用于视频描述生成的潜在特征增强网络(LFAN)模型。利用不同的特征提取器提取外观... 视频描述生成旨在用自然语言描述视频中的物体及其相互作用。现有方法未充分利用视频中的时空语义信息,限制了模型生成准确描述语句的能力。为此,提出一种用于视频描述生成的潜在特征增强网络(LFAN)模型。利用不同的特征提取器提取外观特征、运动特征和目标特征,将对象级的目标特征分别和帧级的外观特征与运动特征融合,同时对融合后的不同特征进行增强,在生成描述前利用图神经网络和长短时记忆网络推理对象之间的时空关系,从而得到具有时空信息和语义信息的潜在特征,同时使用长短时记忆网络和门控循环单元的解码器生成视频的描述语句。该网络模型能够准确地学习到对象特征,进而引导生成更准确的词汇及与对象之间的关系。在MSVD和MSR-VTT数据集上的实验结果表明,LFAN模型可以显著提高生成描述语句的准确性,并与视频中的内容呈现出更好的语义一致性,在MSVD数据集上的BLEU@4和ROUGE-L分数分别为57.0和74.1,在MSRVTT数据集上分别为43.8和62.1。 展开更多
关键词 视频描述生成 潜在特征增强网络 时空语义信息 图神经网络 特征融合
下载PDF
融合空间特征的多尺度深度伪造检测方法
7
作者 张溢文 蔡满春 +2 位作者 陈咏豪 朱懿 姚利峰 《计算机工程》 CAS CSCD 北大核心 2024年第7期240-250,共11页
随着深度学习的快速发展,深度伪造技术作为一种基于深度学习生成模型的图像篡改技术迅速兴起。深度伪造视频图像的泛滥给国家和社会安全带来了负面影响,使得深度伪造检测技术的重要性日益凸显。然而,现有基于卷积神经网络(CNN)或ViT的... 随着深度学习的快速发展,深度伪造技术作为一种基于深度学习生成模型的图像篡改技术迅速兴起。深度伪造视频图像的泛滥给国家和社会安全带来了负面影响,使得深度伪造检测技术的重要性日益凸显。然而,现有基于卷积神经网络(CNN)或ViT的深度伪造检测技术普遍存在模型参数量大、训练速度慢、容易过拟合、应对视频压缩或噪声的鲁棒性差等问题。为此,提出一种融合空间特征的多尺度深度伪造检测方法。首先采用自动白平衡(AWB)算法对输入图像进行对比度调整,以增强模型的鲁棒性;然后利用MViT和CNN分别提取输入图像的多尺度全局和局部特征;接着提出一种改进的稀疏交叉注意力机制,对用MViT提取的全局特征和用CNN提取的局部特征进行融合,提升模型的识别效果;最后针对融合后的特征,通过多层感知机(MLP)进行分类。实验结果表明,该方法在Deepfakes、FaceSwap和Celeb-DF(v2)数据集上的帧水平AUC分别达到0.986、0.984和0.988,且在跨压缩率实验中表现出了较强的鲁棒性,模型改进前后的对比也验证了所提各模块对检测结果的提升作用。 展开更多
关键词 深度伪造 卷积神经网络 特征融合 交叉注意力 数据增强
下载PDF
域泛化问题中基于Mixup与对比损失的特征转换模型
8
作者 王岳松 张洪 《中国科学技术大学学报》 CAS CSCD 北大核心 2024年第4期37-44,36,67,共10页
当表示基础数据分布的域在训练和测试数据集之间存在差异时,传统的深度神经网络的性能会大幅下降。域泛化方法旨在仅使用源域的训练数据来提高在未知目标域上的泛化能力。主流的域泛化算法通常对一些流行的特征提取网络(如ResNet)进行修... 当表示基础数据分布的域在训练和测试数据集之间存在差异时,传统的深度神经网络的性能会大幅下降。域泛化方法旨在仅使用源域的训练数据来提高在未知目标域上的泛化能力。主流的域泛化算法通常对一些流行的特征提取网络(如ResNet)进行修改,或者在特征提取网络之后添加更复杂的参数模块。流行的特征提取网络通常在大规模数据集上进行了较好的预训练,因此具有较强的特征提取能力,而对其进行修改会削弱这种能力。添加更复杂的参数模块会导致更深的网络,并且对计算资源要求更高。本文基于域泛化中流行的特征提取网络,提出了一种新的特征转换模型,不做任何更改或添加任何模块。通过结合对比损失和数据增强策略(即Mixup),该特征转换模型的泛化能力得到了提升,并提出了一种新的样本选择策略来与Mixup和对比损失相协作。在基准数据集PACS和Domainnet上的实验结果表明,该方法优于传统的域泛化方法。 展开更多
关键词 对比损失 数据增强 深度神经网络 域泛化 特征转换
下载PDF
特征扩展的随机向量函数链神经网络
9
作者 龙茂森 王士同 《软件学报》 EI CSCD 北大核心 2024年第6期2903-2922,共20页
基于宽度学习的动态模糊推理系统(broad-learning-based dynamic fuzzy inference system,BL-DFIS)能自动构建出精简的模糊规则并获得良好的分类性能.然而,当遇到大型复杂的数据集时,BL-DFIS因会使用较多模糊规则来试图达到令人满意的... 基于宽度学习的动态模糊推理系统(broad-learning-based dynamic fuzzy inference system,BL-DFIS)能自动构建出精简的模糊规则并获得良好的分类性能.然而,当遇到大型复杂的数据集时,BL-DFIS因会使用较多模糊规则来试图达到令人满意的识别精度,从而对其可解释性造成了不利影响.对此,提出一种兼顾分类性能和可解释性的模糊神经网络,将其称为特征扩展的随机向量函数链神经网络(FA-RVFLNN).在该网络中,一个以原始数据为输入的RVFLNN被作为主体结构,BL-DFIS则用作性能补充,这意味着FA-RVFLNN包含具有性能增强作用的直接链接.由于主体结构的增强节点使用Sigmoid激活函数,因此,其推理过程可借助一种模糊逻辑算子(I-OR)来解释.而且,具有明确含义的原始输入数据也有助于解释主体结构的推理规则.在直接链接的支撑下,FA-RVFLNN可利用增强节点、特征节点和模糊节点学到更丰富的有用信息.实验表明:FA-RVFLNN既减缓了主体结构RVFLNN中过多增强节点带来的“规则爆炸”问题,也提高了性能补充结构BL-DFIS的可解释性(平均模糊规则数降低了50%左右),在泛化性能和网络规模上仍具有竞争力. 展开更多
关键词 宽度学习系统 模糊推理系统 特征扩展 随机向量函数链神经网络(RVFLNN) Sigmoid激活函数 可解释
下载PDF
基于边界辅助判别的滚动轴承故障特征增强及诊断方法
10
作者 李佰霖 鲁大臣 +1 位作者 付文龙 陈禹朋 《机电工程》 CAS 北大核心 2024年第4期643-650,共8页
滚动轴承作为机械设备重要部件,对保障设备安全稳定运行具有重要意义。针对实际诊断中的滚动轴承故障数据不平衡问题,提出了一种基于边界辅助判别的辅助分类生成对抗网络模型(BD-ACGAN)。首先,设计了一种可用于提取故障样本边界细节特... 滚动轴承作为机械设备重要部件,对保障设备安全稳定运行具有重要意义。针对实际诊断中的滚动轴承故障数据不平衡问题,提出了一种基于边界辅助判别的辅助分类生成对抗网络模型(BD-ACGAN)。首先,设计了一种可用于提取故障样本边界细节特征的边界辅助判别器,以引导生成器生成更真实的样本,并采用该生成样本解决了数据不平衡的问题;其次,采用了自适应权重损失模块,动态调整了损失权重,使该模型更加关注重要的特征信息,从而提高了该模型的生成质量和特征表达能力;利用生成样本和真实样本数据对BD-ACGAN模型进行了增强训练,提高了该模型的泛化能力和诊断能力;最后,进行了消融实验及对照实验,对BD-ACGAN模型的特征增强能力和诊断效果进行了验证,分别采用美国凯斯西储大学和西安交通大学滚动轴承数据集对模型进行了实验验证。研究结果表明:该BD-ACGAN模型能够有效利用故障样本的边界特征解决数据不平衡问题,并且故障诊断精确度为98.79%,优于其他对照模型,为滚动轴承故障诊断提供了一种新的方法。 展开更多
关键词 轴承故障诊断 数据不平衡 边界辅助判别的辅助分类生成对抗网络 故障特征增强 自适应权重损失 数据集增广
下载PDF
基于共有特征学习和数据增强的农作物病害识别算法 被引量:1
11
作者 李国强 王俊妍 王天雷 《高技术通讯》 CAS 2023年第3期261-270,共10页
针对农作物病害图像类间差异较小,传统机器学习方法在农作物病害数据集上识别精度低、模型训练复杂等问题,本文提出一种基于共有特征学习和数据增强的农作物病害识别算法。首先,对于农作物病害数据集类间数据不均衡等问题,本文使用Mixu... 针对农作物病害图像类间差异较小,传统机器学习方法在农作物病害数据集上识别精度低、模型训练复杂等问题,本文提出一种基于共有特征学习和数据增强的农作物病害识别算法。首先,对于农作物病害数据集类间数据不均衡等问题,本文使用Mixup数据增强算法对数据集进行扩充,丰富样本数量;然后,对于特征提取模块,本文在深度残差网络中嵌入通道注意力模块,使之侧重学习农作物叶片病害特征,忽略背景信息对模型带来的干扰;最后,在提取完图像特征后,将特征图送入到共有特征学习模块中,提高图像之间线性关联,增强模型泛化性能和鲁棒性。为验证所提模型的有效性和实用性,本文在Plant Diagnosis Dataset农作物病害数据集上进行训练及测试,实验结果表明,所提模型准确率达到97.9%,可有效提高农作物病害图像识别精度。 展开更多
关键词 农作物病害 深度残差网络 数据增强 注意力机制 共有特征学习
下载PDF
改进深度卷积生成式对抗网络的文本生成图像
12
作者 李云红 朱绵云 +3 位作者 任劼 苏雪平 周小计 于惠康 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2023年第8期1875-1883,共9页
针对深度卷积生成式对抗网络(DCGAN)模型高维文本输入表示的稀疏性导致以文本为条件生成的图像结构缺失和图像不真实的问题,提出了一种改进深度卷积生成式对抗网络模型CA-DCGAN。采用深度卷积网络和循环文本编码器对输入的文本进行编码... 针对深度卷积生成式对抗网络(DCGAN)模型高维文本输入表示的稀疏性导致以文本为条件生成的图像结构缺失和图像不真实的问题,提出了一种改进深度卷积生成式对抗网络模型CA-DCGAN。采用深度卷积网络和循环文本编码器对输入的文本进行编码,得到文本的特征向量表示。引入条件增强(CA)模型,通过文本特征向量的均值和协方差矩阵产生附加的条件变量,代替原来的高维文本特征向量。将条件变量与随机噪声结合作为生成器的输入,并在生成器的损失中额外加入KL损失正则化项,避免模型训练过拟合,使模型可以更好的收敛,在判别器中使用谱约束(SN)层,防止其梯度下降太快造成生成器与判别器不平衡训练而发生模式崩溃的问题。实验验证结果表明:所提模型在Oxford-102-flowers和CUB-200数据集上生成的图像质量较alignDRAW、GAN-CLS、GAN-INT-CLS、StackGAN(64×64)、StackGAN-v1(64×64)模型更好且接近于真实样本,初始得分值最低分别提高了10.9%和5.6%,最高分别提高了41.4%和37.5%,FID值最低分别降低了11.4%和8.4%,最高分别降低了43.9%和42.5%,进一步表明了所提模型的有效性。 展开更多
关键词 深度卷积生成式对抗网络 文本生成图像 文本特征表示 条件增强 KL正则化
下载PDF
一种基于特征融合的恶意代码快速检测方法 被引量:7
13
作者 王硕 王坚 +1 位作者 王亚男 宋亚飞 《电子学报》 EI CAS CSCD 北大核心 2023年第1期57-66,共10页
随着恶意代码对抗技术的发展,恶意攻击者通过加壳、代码混淆等技术繁衍大量恶意代码变种,而传统恶意代码检测方法难以对其进行有效检测.基于恶意代码可视化的恶意代码检测方法被证明是一种能够有效识别恶意代码及其变种的新方法 .针对... 随着恶意代码对抗技术的发展,恶意攻击者通过加壳、代码混淆等技术繁衍大量恶意代码变种,而传统恶意代码检测方法难以对其进行有效检测.基于恶意代码可视化的恶意代码检测方法被证明是一种能够有效识别恶意代码及其变种的新方法 .针对目前研究仅着眼于提升模型分类准确率而忽略了恶意代码检测的时效性,本文提出了一种基于特征融合的恶意代码快速检测方法 .该方法以深度神经网络为框架,采取模块化设计思想,将多尺度恶意代码特征融合与通道注意力机制结合,增强关键特征表达,并使用数据增强技术改善数据集类别不平衡问题.通过实验证明本文方法分类准确率高且参数量小、检测时效性高,优于目前的恶意代码检测技术. 展开更多
关键词 恶意代码 深度神经网络 特征融合 通道注意力机制 数据增强技术 恶意代码可视化
下载PDF
基于图神经网络多模态融合的语音情感识别模型 被引量:3
14
作者 李紫荆 陈宁 《计算机应用研究》 CSCD 北大核心 2023年第8期2286-2291,2310,共7页
目前,基于多模态融合的语音情感识别模型普遍存在无法充分利用多模态特征之间的共性和互补性、无法借助样本特征间的拓扑结构特性对样本特征进行有效地优化和聚合,以及模型复杂度过高的问题。为此,引入图神经网络,一方面在特征优化阶段... 目前,基于多模态融合的语音情感识别模型普遍存在无法充分利用多模态特征之间的共性和互补性、无法借助样本特征间的拓扑结构特性对样本特征进行有效地优化和聚合,以及模型复杂度过高的问题。为此,引入图神经网络,一方面在特征优化阶段,将经过图神经网络优化后的文本特征作为共享表示重构基于声学特征的邻接矩阵,使得在声学特征的拓扑结构特性中包含文本信息,达到多模态特征的融合效果;另一方面在标签预测阶段,借助图神经网络充分聚合当前节点的邻接节点所包含的相似性信息对当前节点特征进行全局优化,以提升情感识别准确率。同时为防止图神经网络训练过程中可能出现的过平滑问题,在图神经网络训练前先进行图增强处理。在公开数据集IEMOCAP和RAVDESS上的实验结果表明,所提出的模型取得了比基线模型更高的识别准确率和更低的模型复杂度,并且模型各个组成部分均对模型性能提升有所贡献。 展开更多
关键词 语音情感识别 多模态特征 图神经网络 图增强
下载PDF
结合局部增强与反向残差的点云语义分割网络 被引量:2
15
作者 温智成 王蕾 +1 位作者 冯锦梁 叶森辉 《激光与红外》 CAS CSCD 北大核心 2023年第7期1131-1136,共6页
激光点云是3D传感器的输出,且对它的语义分割任务是理解真实世界的基础。基于图卷积的点云分割网络在许多场景下都展现了优异的性能。然而,现有的图卷积方法存在部分问题:点云局部表示的能力未得到加强,忽略了全局几何信息,并且聚合操... 激光点云是3D传感器的输出,且对它的语义分割任务是理解真实世界的基础。基于图卷积的点云分割网络在许多场景下都展现了优异的性能。然而,现有的图卷积方法存在部分问题:点云局部表示的能力未得到加强,忽略了全局几何信息,并且聚合操作只保留局部最大响应值信息,而次最大值信息丢失。为了处理这些问题,本文提出GRes-Net网络。利用局部几何加强(Local Geometry Augment,LGA)模块,使网络对Z轴具有旋转不变性,以便加强点云局部信息表示;采用全局几何特征(Global Geometry Feature,GGF)模块,计算局部与全局的球体体积比,将其与坐标特征X进行连接,使全局几何信息特征得以保留;通过多个对称聚合操作将局部信息多方面地保留;网络中每层都使用残差操作,将上一层信息传递到下一层,以及利用反向残差模块(Reversed Residual MLP,RevResMLP)挖掘更深层次的语义信息。本文在S3DIS数据集上进行语义场景分割实验,验证网络分割的性能。实验结果表明该方法在分割精度上达到61%,相比于基准网络DGCNN提高14%,有效地提高了模型性能。 展开更多
关键词 点云语义分割 动态图卷积 局部几何加强 全局几何特征 反向残差
下载PDF
面向网络舆情分析的多任务学习策略时间卷积网络 被引量:1
16
作者 张会云 黄鹤鸣 《计算机工程》 CAS CSCD 北大核心 2023年第10期89-96,104,共9页
检测与识别网络中语音的情感状态有助于把控舆情信息,若能同时辨别说话人及其性别,则对掌握舆情的真实意图更有帮助。基于数据集EMODB,提出用于情感分类、说话人辨别和性别识别的多任务学习策略时间卷积网络(DTCN)。针对多任务学习中数... 检测与识别网络中语音的情感状态有助于把控舆情信息,若能同时辨别说话人及其性别,则对掌握舆情的真实意图更有帮助。基于数据集EMODB,提出用于情感分类、说话人辨别和性别识别的多任务学习策略时间卷积网络(DTCN)。针对多任务学习中数据集较小的问题,设计数据增强技术,在不同信噪比下采用加噪的方式对数据集EMODB进行扩充,构建单信噪比含噪数据集EMODB-10、EMODB-5、EMODB0、EMODB5、EMODB10以及多信噪比含噪数据集EMODBM。同时,通过研究单一噪声和混合噪声,验证不同噪声对DTCN模型性能的影响。为了更好地表征数据特性,提出适用于多任务学习的声学特征集。实验结果表明,在具有正信噪比和多信噪比含噪数据集上进行测试时,DTCN模型在多任务学习场景下的表现均优于基线,较容易辨别说话人性别,且随着噪声种类增多,对多任务学习的性能不断提高,在混合噪声下鲁棒性和泛化性更好。 展开更多
关键词 语音情感识别 策略时间卷积网络 多任务学习 数据扩充 特征提取
下载PDF
概念驱动的小样本判别特征学习方法
17
作者 周凯锐 刘鑫 +1 位作者 景丽萍 于剑 《智能系统学报》 CSCD 北大核心 2023年第1期162-172,共11页
小样本学习旨在让模型能够在仅有少量标记数据的新类中进行分类。基于度量学习的方法是小样本学习的一种有效方法,该类方法利用有标签的支持集样本构建类表示,再基于查询样本和类表示的相似性进行分类。因此,如何构建判别性更强的类表... 小样本学习旨在让模型能够在仅有少量标记数据的新类中进行分类。基于度量学习的方法是小样本学习的一种有效方法,该类方法利用有标签的支持集样本构建类表示,再基于查询样本和类表示的相似性进行分类。因此,如何构建判别性更强的类表示是这类方法的关键所在。多数工作在构建类表示时,忽略了类概念相关信息的挖掘,这样容易引入样本中类别无关信息,从而降低类表示的判别性。为此本文提出一种概念驱动的小样本判别特征学习方法。该方法首先利用类别的语义信息来指导模型挖掘样本中类概念相关信息,进而构建更具判别性的类表示。其次,设计了随机掩码混合机制增加样本的多样性和识别难度,进一步提升类表示的质量。最后对处于决策边界附近的查询样本赋予更大的权重,引导模型关注难样本,从而更好地进行类表示学习。大量实验的结果表明本文提出的方法能够有效提升小样本分类任务的准确率,并且在多个数据集上优于当前先进的算法。 展开更多
关键词 小样本学习 度量学习 类表示学习 判别特征学习 数据增强 图像分类 神经网络 深度学习
下载PDF
基于增强特征表示的语义分割神经网络
18
作者 程坦 许开强 安竹林 《计算机仿真》 北大核心 2023年第11期122-125,共4页
语义分割是计算机视觉领域中一个基础而重要的话题,针对语义分割中边界分割困难的问题,提出了一种利用类别整体特征以增强模型表征能力的语义分割神经网络结构。通过分析同类别内各像素特征应具有相似性、不同类别内的特征应具有可分性... 语义分割是计算机视觉领域中一个基础而重要的话题,针对语义分割中边界分割困难的问题,提出了一种利用类别整体特征以增强模型表征能力的语义分割神经网络结构。通过分析同类别内各像素特征应具有相似性、不同类别内的特征应具有可分性的特点,利用区域提议汇聚各类别区域内的特征,并使用关注特征的方法建立像素点与类别之间的联系,从而增强模型表征能力。通过在公开数据集上的实验分析比较,上述结构能有效提升像素点特征表示能力。 展开更多
关键词 语义分割 深度神经网络 特征增强表示 多尺度上下文编码 特征表示
下载PDF
基于多尺度加权形态网络的燃气流量计健康状态评估
19
作者 胡凡 张永 谢林柏 《仪器仪表学报》 EI CAS CSCD 北大核心 2023年第8期198-208,共11页
燃气流量计是天然气贸易计量的重要仪器,而其健康状态的改变会造成计量偏差。为了减少燃气企业的经济损失,本文提出了一种基于多模态数据扩充、形态学特征学习和多尺度自适应加权形态学网络的燃气流量计健康状态评估方法。首先,采用基于... 燃气流量计是天然气贸易计量的重要仪器,而其健康状态的改变会造成计量偏差。为了减少燃气企业的经济损失,本文提出了一种基于多模态数据扩充、形态学特征学习和多尺度自适应加权形态学网络的燃气流量计健康状态评估方法。首先,采用基于Wasserstein距离和谱归一化的ACGAN算法进行数据扩充。其次,针对燃气流量计振动信号数据的复杂性和噪声影响,提出了一种基于平均帽变换的形态学方法提取信号的正负脉冲信息。最后,针对非平稳、变工况的工业条件,引入多尺度自适应加权形态学网络,采用具有不同结构元素尺度的多个分量来分别提取脉冲信息,并利用自适应加权融合来增强提供强脉冲分量的尺度。通过实验结果表明,所提出的方法对燃气流量计健康状态评估的准确度超过94%。该方法对实际燃气贸易计量有重要的应用价值。 展开更多
关键词 燃气流量计 健康状态评估 多模态数据增强 形态学特征学习 多尺度自适应加权网络
下载PDF
用于高精度催化性能预测的精细结构敏感型深度学习框架
20
作者 陈宇卓 王浩 +4 位作者 陆冰 易倪 曹亮 王勇 毛善俊 《Chinese Journal of Catalysis》 SCIE EI CAS CSCD 2023年第7期284-296,共13页
催化剂表面的精细结构对结构敏感型反应有很大影响,高通量(HT)筛选和机器学习(ML)可以有效地探索这些影响因素.为了将ML与化学相结合,必须首先将化学结构转换为可用作ML模型输入的特征编码,目前常用的两种转换方法为描述符和图.然而,描... 催化剂表面的精细结构对结构敏感型反应有很大影响,高通量(HT)筛选和机器学习(ML)可以有效地探索这些影响因素.为了将ML与化学相结合,必须首先将化学结构转换为可用作ML模型输入的特征编码,目前常用的两种转换方法为描述符和图.然而,描述符的构建往往忽略原子连接,这使得ML模型难以捕获与催化性能最相关的几何信息.基于图的ML模型在更新节点的过程中会不可避免地丢失吸附位点的几何排列信息,同时消息传递神经网络复杂,导致其对电子或几何结构不敏感、缺乏可解释性.因此,目前仍然缺乏可以同时兼顾多相催化中电子和几何精细结构的可解释ML框架.相比之下,将化学结构转换为网格数据可以完全保留精细的几何信息.鉴于此,通过将催化剂表面结构和吸附位点信息分别转换为二维网格和一维描述符,本文创建了一个名为“整体+局部”卷积神经网络(GLCNN)的数据增强(DA)卷积神经网络(CNN)ML框架,其结合“整体+局部”特征,无需复杂的编码即可捕获原始精细结构,DA的加入可以扩充数据集并减缓过拟合.GLCNN可以很好地预测和区分碳基过渡金属单原子催化剂上OH的吸附能,平均绝对误差小于0.1 eV,这是在大型数据集上训练的ML模型所能达到的较好结果.将GLCNN与基于描述符或图的模型对比,结果表明,对比模型无法完全准确预测包含IB和IIB过渡金属或者顺式/反式构型催化剂的OH吸附能.而GLCNN模型的预测效果明显好于对比模型,表明网格和描述符的组合可以更好地体现催化活性中心的电子和精细几何结构信息.另外,对DA处理后的样本计算平均标准误差后发现,通过DA获得的不同晶胞几乎不影响预测结果,说明DA对晶胞的平移并不改变晶胞的性质,表明GLCNN可以学习到周期性表面的边界条件信息.与传统的CNN和基于描述符的单边特征提取不同,本文中对精细结构敏感的ML框架可以通过不包含人类偏见的可解释性分析,从几何和化学/电子特征中提取影响催化性能的关键因素,如对称和配位元素.一维描述符的特征重要性分析表明,吸附位点的电子结构和对称性特征至关重要,且金属对于催化性能的影响强于其配位环境.将CNN卷积部分的中间输出可视化后发现,碳基载体上远离金属的区域中很大一部分对催化性能几乎没有直接影响,且卷积层会优先对金属原子反复关注,再次强调金属的重要性高于其配位环境,表明卷积核可以自动提取符合催化常识化学结构的几何信息.对全连接层(FC)进行降维可视化分析后发现,随着层数的增加,FC基于基本催化知识逐渐寻找特征提取的方向,提取出更抽象的有利于吸附能预测的高维特征,这与卷积部分类似.综上,GLCNN框架为具有广阔物理和化学空间的多相催化剂的高精度HT筛选提供了可行方案. 展开更多
关键词 非均相催化 机器学习 精细结构敏感 “整体+局部”特征 可解释性 数据增强 “整体+局部”卷积神经网络
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部