期刊文献+
共找到117篇文章
< 1 2 6 >
每页显示 20 50 100
Fast and Accurate Machine Learning Inverse Lithography Using Physics Based Feature Maps and Specially Designed DCNN
1
作者 Xuelong Shi Yan Yan +4 位作者 Tao Zhou Xueru Yu Chen Li Shoumian Chen Yuhang Zhao 《Journal of Microelectronic Manufacturing》 2020年第4期51-58,共8页
Inverse lithography technology(ILT)is intended to achieve optimal mask design to print a lithography target for a given lithography process.Full chip implementation of rigorous inverse lithography remains a challengin... Inverse lithography technology(ILT)is intended to achieve optimal mask design to print a lithography target for a given lithography process.Full chip implementation of rigorous inverse lithography remains a challenging task because of enormous computational resource requirements and long computational time.To achieve full chip ILT solution,attempts have been made by using machine learning techniques based on deep convolution neural network(DCNN).The reported input for such DCNN is the rasterized images of the lithography target;such pure geometrical input requires DCNN to possess considerable number of layers to learn the optical properties of the mask,the nonlinear imaging process,and the rigorous ILT algorithm as well.To alleviate the difficulties,we have proposed the physics based optimal feature vector design for machine learning ILT in our early report.Although physics based feature vector followed by feedforward neural network can provide the solution to machine learning ILT,the feature vector is long and it can consume considerable amount of memory resource in practical implementation.To improve the resource efficiency,we proposed a hybrid approach in this study by combining first few physics based feature maps with a specially designed DCNN structure to learn the rigorous ILT algorithm.Our results show that this approach can make machine learning ILT easy,fast and more accurate. 展开更多
关键词 Optimal feature maps inverse lithography technology(ILT) deep convolution neural network(DCNN).
下载PDF
An Emotion Analysis Method Using Multi-Channel Convolution Neural Network in Social Networks 被引量:1
2
作者 Xinxin Lu Hong Zhang 《Computer Modeling in Engineering & Sciences》 SCIE EI 2020年第10期281-297,共17页
As an interdisciplinary comprehensive subject involving multidisciplinary knowledge,emotional analysis has become a hot topic in psychology,health medicine and computer science.It has a high comprehensive and practica... As an interdisciplinary comprehensive subject involving multidisciplinary knowledge,emotional analysis has become a hot topic in psychology,health medicine and computer science.It has a high comprehensive and practical application value.Emotion research based on the social network is a relatively new topic in the field of psychology and medical health research.The text emotion analysis of college students also has an important research significance for the emotional state of students at a certain time or a certain period,so as to understand their normal state,abnormal state and the reason of state change from the information they wrote.In view of the fact that convolutional neural network cannot make full use of the unique emotional information in sentences,and the need to label a large number of highquality training sets for emotional analysis to improve the accuracy of the model,an emotional analysismodel using the emotional dictionary andmultichannel convolutional neural network is proposed in this paper.Firstly,the input matrix of emotion dictionary is constructed according to the emotion information,and the different feature information of sentences is combined to form different network input channels,so that the model can learn the emotion information of input sentences from various feature representations in the training process.Then,the loss function is reconstructed to realize the semi supervised learning of the network.Finally,experiments are carried on COAE 2014 and self-built data sets.The proposed model can not only extract more semantic information in emotional text,but also learn the hidden emotional information in emotional text.The experimental results show that the proposed emotion analysis model can achieve a better classification performance.Compared with the best benchmark model gram-CNN,the F1 value can be increased by 0.026 in the self-built data set,and it can be increased by 0.032 in the COAE 2014 data set. 展开更多
关键词 Emotion analysis model emotion dictionary convolution neural network semi supervised learning deep learning pooling feature feature mapping
下载PDF
Instance Retrieval Using Region of Interest Based CNN Features
3
作者 Jingcheng Chen Zhili Zhou +1 位作者 Zhaoqing Pan Ching-nung Yang 《Journal of New Media》 2019年第2期87-99,共13页
Recently, image representations derived by convolutional neural networks(CNN) have achieved promising performance for instance retrieval, and they outperformthe traditional hand-crafted image features. However, most o... Recently, image representations derived by convolutional neural networks(CNN) have achieved promising performance for instance retrieval, and they outperformthe traditional hand-crafted image features. However, most of existing CNN-based featuresare proposed to describe the entire images, and thus they are less robust to backgroundclutter. This paper proposes a region of interest (RoI)-based deep convolutionalrepresentation for instance retrieval. It first detects the region of interests (RoIs) from animage, and then extracts a set of RoI-based CNN features from the fully-connected layerof CNN. The proposed RoI-based CNN feature describes the patterns of the detected RoIs,so that the visual matching can be implemented at image region-level to effectively identifytarget objects from cluttered backgrounds. Moreover, we test the performance of theproposed RoI-based CNN feature, when it is extracted from different convolutional layersor fully-connected layers. Also, we compare the performance of RoI-based CNN featurewith those of the state-of-the-art CNN features on two instance retrieval benchmarks.Experimental results show that the proposed RoI-based CNN feature provides superiorperformance than the state-of-the-art CNN features for in-stance retrieval. 展开更多
关键词 Image retrieval instance retrieval ROI CNN convolutional layer convolutional feature maps
下载PDF
基于锚点的快速三维手部关键点检测算法
4
作者 秦晓飞 何文 +2 位作者 班东贤 郭宏宇 于景 《电子科技》 2024年第4期77-86,共10页
在人机协作任务中,手部关键点检测为机械臂提供目标点坐标,A2J(Anchor-to-Joint)是具有代表性的一种利用锚点进行关键点检测的方法。A2J以深度图为输入,可实现较好的检测效果,但对全局特征获取能力不足。文中设计了全局-局部特征融合模... 在人机协作任务中,手部关键点检测为机械臂提供目标点坐标,A2J(Anchor-to-Joint)是具有代表性的一种利用锚点进行关键点检测的方法。A2J以深度图为输入,可实现较好的检测效果,但对全局特征获取能力不足。文中设计了全局-局部特征融合模块(Global-Local Feature Fusion,GLFF)对骨干网络浅层和深层的特征进行融合。为了提升检测速度,文中将A2J的骨干网络替换为ShuffleNetv2并对其进行改造,用5×5深度可分离卷积替换3×3深度可分离卷积,增大感受野,有效提升了骨干网络对全局特征的提取能力。文中在锚点权重估计分支引入高效通道注意力模块(Efficient Channel Attention,ECA),提升了网络对重要锚点的关注度。在主流数据集ICVL和NYU上进行的训练和测试结果表明,相比于A2J,文中所提方法的平均误差分别降低了0.09 mm和0.15 mm。在GTX1080Ti显卡上实现了151 frame·s^(-1)的检测速率,满足人机协作任务对于实时性的要求。 展开更多
关键词 人机协作 三维手部关键点检测 锚点 深度图 全局-局部特征融合 ShuffleNetv2 深度可分离卷积 高效通道注意力
下载PDF
基于多分支特征融合的密集人群计数网络
5
作者 孙爽 何立风 +1 位作者 朱纷 张梦颖 《计算机工程与设计》 北大核心 2024年第3期814-821,共8页
针对人群计数任务中存在的多尺度变化、背景噪声等问题,提出一种基于多分支特征融合的人群计数网络。在网络前端设计一个双向特征融合路径,将网络深层的语义信息和浅层的空间细节信息进行反复提取融合,使用位置注意力机制和通道注意力... 针对人群计数任务中存在的多尺度变化、背景噪声等问题,提出一种基于多分支特征融合的人群计数网络。在网络前端设计一个双向特征融合路径,将网络深层的语义信息和浅层的空间细节信息进行反复提取融合,使用位置注意力机制和通道注意力机制增强网络对人群和背景之间的判别能力,生成高质量特征图;网络后端采用密集残差连接增强网络对人头连续的多尺度信息提取能力,得到最终的人群密度图。在ShanghaiTech、UCF_CC_50和UCF_QNRF数据集上分别进行的对比实验的结果表明,该模型的计数性能优于先前诸多方法,有着良好的计数精度。 展开更多
关键词 人群计数 多尺度变化 特征融合 注意力机制 密集残差连接 空洞卷积 密度图
下载PDF
融合注意力特征及动态卷积的肺结节辅助诊断 被引量:1
6
作者 谷宇 刘佳琪 +3 位作者 杨立东 张宝华 张祥松 贾成一 《科学技术与工程》 北大核心 2023年第16期6834-6844,共11页
针对肺结节关键影像征象信息不易获取,部分卷积神经网络(convolutional neural networks,CNN)模型对肺结节的识别率不高的问题,提出一种融合注意力特征的动态卷积残差网络(dynamic convolutional residual networks incorporating atten... 针对肺结节关键影像征象信息不易获取,部分卷积神经网络(convolutional neural networks,CNN)模型对肺结节的识别率不高的问题,提出一种融合注意力特征的动态卷积残差网络(dynamic convolutional residual networks incorporating attention features,DcANet),并在有效实现肺结节良恶性分类的基础上对所提模型的诊断结果进行可视化分析。此网络以适应肺结节三维小尺寸输入特点的残差网络为基本框架,在DcABlock部分使用可以自适应调整卷积参数的动态卷积以及迭代注意特征融合模块,使模型能够更准确地获取肺结节信息,提高模型的表征能力。此外,还使用类激活映射将三维图像的各层切片进行可视化分析。实验在最终测试集上的准确率为85.87%,平衡F分数(F1)值为82.67%,敏感度和特异性的综合指标Gmean值为85.51%。实验结果表明:该网络可以提升对肺结节良恶性分类的准确性,诊断结果具有可信性,有一定的临床应用价值。 展开更多
关键词 肺结节辅助诊断 动态卷积 迭代注意特征融合模块 深度学习 类激活映射
下载PDF
基于特征融合的牵引电机轴承声学故障诊断
7
作者 杨岗 卫昱乾 李芾 《机车电传动》 北大核心 2023年第2期103-112,共10页
滚动轴承作为高速列车牵引电机的重要部件,其故障情况严重影响列车运行安全。声学轴承故障诊断方式具有无安装侵入性、运维成本低的优点,但也具有信噪比低、故障特征难以提取的缺点,机器学习则具有克服噪声影响的鲁棒性。针对应用机器... 滚动轴承作为高速列车牵引电机的重要部件,其故障情况严重影响列车运行安全。声学轴承故障诊断方式具有无安装侵入性、运维成本低的优点,但也具有信噪比低、故障特征难以提取的缺点,机器学习则具有克服噪声影响的鲁棒性。针对应用机器学习进行声学故障诊断时,少量特征无法全面表征轴承故障的难题,文章提出将格拉姆角场(GAF)与小波时频图进行叠加融合,构成6通道融合特征图用以有效表征轴承的故障。首先,建立牵引电机轴承声学故障试验台获取故障声学信号;其次,建立基于GAF的声学信号融合特征图,然后使用残差网络(ResNET)模型针对融合特征图特征训练并验证故障分类模型,并与以单种特征图作为特征的故障分类方法进行准确率对比。结果表明,基于GAF的融合特征图的声学故障分类模型具有99.89%的准确率,融合特征图能更有效地映射轴承故障。 展开更多
关键词 牵引电机轴承 声学故障诊断 卷积神经网络 融合特征图 格拉姆角场 高速列车
下载PDF
基于特征图融合的对抗样本生成方法
8
作者 张世辉 张晓微 +1 位作者 宋丹丹 路佳琪 《燕山大学学报》 CAS 北大核心 2023年第4期337-346,共10页
为检验现有深度学习算法的鲁棒性和安全性,提出一种基于特征图融合的对抗样本生成方法。首先,分析卷积神经网络在图像分类任务中所提取不同层次特征图的特点,提出利用多层次特征图进行对抗扰动构造的方法思想;其次,引入通道注意力模块... 为检验现有深度学习算法的鲁棒性和安全性,提出一种基于特征图融合的对抗样本生成方法。首先,分析卷积神经网络在图像分类任务中所提取不同层次特征图的特点,提出利用多层次特征图进行对抗扰动构造的方法思想;其次,引入通道注意力模块对卷积层输出特征图进行权重分配,以此代表不同特征图对分类结果的影响程度;再次,构建基础网络用于选取高权重特征图,并对显著特征信息进行像素值修改来生成扰动特征图;最后,将不同扰动特征图融合为对抗扰动,并添加至原始输入样本中生成对抗样本。实验结果表明,所提对抗样本生成方法在CIFAR-10和MNIST数据集上兼顾了攻击成功率和样本视觉感知效果,与现有代表性对抗样本生成方法相比,在高难度的非交互式黑盒模型上取得了较好的攻击效果。 展开更多
关键词 对抗样本 特征图 通道注意力模块 卷积神经网络 图像分类
下载PDF
基于特征融合编解码的人群计数和密度估计 被引量:1
9
作者 邹敏 黄虹 +1 位作者 杜渂 黄继风 《计算机工程与设计》 北大核心 2023年第7期2110-2117,共8页
为解决人群计数任务中因人群大小不一导致的计数偏差问题,提出一种基于特征融合的编解码卷积神经网络模型(CFFNet)。前端网络模块对输入的人群图像自动编码,提取不同尺度的人群特征语义信息;后端网络模块对编码后的人群特征信息进行融... 为解决人群计数任务中因人群大小不一导致的计数偏差问题,提出一种基于特征融合的编解码卷积神经网络模型(CFFNet)。前端网络模块对输入的人群图像自动编码,提取不同尺度的人群特征语义信息;后端网络模块对编码后的人群特征信息进行融合和解码,得到最终的估计密度图。将该模型在4个公开数据集上进行实验,并与历年的主要方法进行对比,实验结果表明,该模型在ShanghaiTech PartA、UCSD和Mall数据集上取得了更好的MAE指标,优于目前的这些算法,验证了模型对不同的人群尺度具有很好的适应性。 展开更多
关键词 人群计数 卷积神经网络 编码器 人群尺度 解码器 特征融合 密度图
下载PDF
基于多传感器融合声纹特征图谱的变压器铁芯松动故障诊断方法 被引量:1
10
作者 李楠 马宏忠 +2 位作者 段大卫 朱昊 何萍 《振动与冲击》 EI CSCD 北大核心 2023年第15期129-137,198,共10页
变压器铁芯轻微松动故障给变压器安全稳定运行留下巨大隐患,目前尚缺乏切实可靠的诊断方法。提出一种基于多传感器融合声纹特征图谱的变压器铁芯松动故障诊断方法。首先,利用4个传感器采集声纹时序序列,通过小波变换生成声纹特征图谱,... 变压器铁芯轻微松动故障给变压器安全稳定运行留下巨大隐患,目前尚缺乏切实可靠的诊断方法。提出一种基于多传感器融合声纹特征图谱的变压器铁芯松动故障诊断方法。首先,利用4个传感器采集声纹时序序列,通过小波变换生成声纹特征图谱,利用熵权法确定不同传感器信号的权重分配,将4个声纹特征图谱加权融合,从而形成多传感器融合声纹特征图谱。其次,将融合声纹特征图谱输入优化后的ShuffleNetV2模型,通过分组卷积和通道混洗得到铁芯松动程度。最后,通过现场试验验证了方法的有效性。结果表明,所提方法对25%,50%,75%及100%的松动程度均能实现可靠诊断,平均准确率高达99.6%。与采用傅里叶频谱(fast Fourier transform, FFT)、格拉米角场(Gramian angular field, GAF)、马尔可夫变换场(Markov transform field, MTF)以及混沌特征(recurrence plot, RP)等传统声纹特征图谱的诊断相比,所提方法识别准确率提高了12.2%;与采用单传感器声纹特征图谱的诊断相比,所提方法识别准确度提高了5.8%;与采用AlexNet、MobilleNetV2、GoogleNet以及ResNet等卷积神经网络模型的诊断相比,所提方法识别准确率提高了2.7%。 展开更多
关键词 电力变压器 铁芯松动故障 声纹特征图谱 多传感器融合 卷积神经网络
下载PDF
基于三维特征图和改进DenseNet的脑电情绪识别方法 被引量:1
11
作者 苏靖然 李秋生 《石河子大学学报(自然科学版)》 CAS 北大核心 2023年第3期381-389,共9页
情感作为人脑的高级功能,对人的心理健康状态有很大的影响。为了充分考虑脑电信号的空间信息以及时频信息,更好地实现人机交互,论文提出了1种基于三维特征图的改进DenseNet情绪识别模型。通过提取脑电信号θ、α、β和γ 4个频段的微分... 情感作为人脑的高级功能,对人的心理健康状态有很大的影响。为了充分考虑脑电信号的空间信息以及时频信息,更好地实现人机交互,论文提出了1种基于三维特征图的改进DenseNet情绪识别模型。通过提取脑电信号θ、α、β和γ 4个频段的微分熵特征,结合脑电通道电极的位置映射关系,构造三维特征图,最后使用改进DenseNet网络进行二次特征提取与分类。为了验证该方法的有效性,在SEED数据集上进行了包含积极、中性、消极3种情绪的分类实验,单被试者实验和所有被试者实验获得的分类准确率分别达98.51%和98.68%。实验结果表明,三维特征图结合特征重用方法能够得到高精度的分类结果,为情绪识别提供了可以尝试的新方向。 展开更多
关键词 脑电信号 电极映射 三维特征图 特征重用 多尺度卷积核
下载PDF
融合关键点属性与注意力表征的人脸表情识别 被引量:1
12
作者 高红霞 郜伟 《计算机工程与应用》 CSCD 北大核心 2023年第3期118-126,共9页
人脸的表情变化非常细微,通常表现在图像中某些局部点区域的改变,现有的人脸表情识别方法难以捕捉到表情的细微变化,对非表情区域干扰不具有鲁棒性。为了获得描述人脸表情变化的高效特征表示,提出了一种融合关键点属性与注意力表征的人... 人脸的表情变化非常细微,通常表现在图像中某些局部点区域的改变,现有的人脸表情识别方法难以捕捉到表情的细微变化,对非表情区域干扰不具有鲁棒性。为了获得描述人脸表情变化的高效特征表示,提出了一种融合关键点属性与注意力表征的人脸表情识别方法。通过添加通道注意力和空间注意力的神经网络提取人脸图像中的关键点信息,实现不同维度和位置的权重分配,有效避免非表情区域的干扰,捕获图像中局部关键点的特征表征。引入Transformer模块学习不同关键点之间的相关联系,引导网络构建对表情类型更具分辨力的特征表示,从而实现精准识别。通过在CK+、JAFFE、FER2013三种公开数据集上进行实验的结果表明:提出算法的识别准确率分别达到了99.22%、96.57%、73.37%。 展开更多
关键词 人脸表情识别 关键点属性表征 注意力机制 卷积神经网络 学习特征图
下载PDF
3分支多层次Transformer特征交互的RGB–D显著性目标检测
13
作者 孟令兵 袁梦雅 +4 位作者 时雪涵 刘晴晴 程菲 黎玲利 何术锋 《工程科学与技术》 EI CAS CSCD 北大核心 2023年第6期245-256,共12页
RGB深度图像(RGB–D)显著性目标检测是计算机视觉领域的研究任务之一,很多模型在简单场景下取得了较好的检测效果,却无法有效地处理多目标、深度图质量低下及显著性目标色彩与背景相似等复杂场景。因此,本文提出一种3分支多层次Transfor... RGB深度图像(RGB–D)显著性目标检测是计算机视觉领域的研究任务之一,很多模型在简单场景下取得了较好的检测效果,却无法有效地处理多目标、深度图质量低下及显著性目标色彩与背景相似等复杂场景。因此,本文提出一种3分支多层次Transformer特征交互的RGB–D显著性目标检测模型。首先,提出一个跨模态坐标注意力模块,该模块通过采用坐标注意力抑制RGB图像和深度图的噪声信息,从而提取出更为显著的特征信息用于后续解码。其次,通过特征融合模块将高层的3层特征图调整到相同的分辨率送入Transformer层,有效地获取远距离显著性目标之间的关联关系和整幅图像的全局信息。然后,提出一个多层次特征交互模块,该模块有效地聚合多层次信息进行特征交互,从而能够更精准地定位显著性目标的位置,同时对显著性目标的边界进行细化。最后,设计一个密集扩张特征细化模块,利用密集扩张卷积获取丰富的多尺度特征,有效地应对显著性目标数量和尺寸变化。将模型在5个公开的基准数据集上与19种主流模型相比,实验结果表明:本文方法在多个测评指标上有较好的提升效果,提高了在特定复杂场景下的检测精度;从P–R(precision–recall)曲线、F–measure曲线和显著图也可以直观看出,本文方法取得了较好的检测结果,生成的显著图更完整、清晰,相比其他模型更加接近真值图。 展开更多
关键词 显著性目标检测 坐标注意力 TRANSFORMER 特征交互 密集卷积 显著图
下载PDF
基于特征图可视化的医学图像分析
14
作者 汪颖萍 邵海见 邓星 《江苏科技大学学报(自然科学版)》 CAS 北大核心 2023年第4期65-71,共7页
现有的医学图像分类算法中普遍存在模型的可解释性问题,将同一卷积神经网络应用到不同的数据集上,分类性能千差万别.针对这一问题,提出了一种基于特征图可视化的医学图像分析方法.在卷积神经网络的特征提取阶段设计4个特征图可视化模型... 现有的医学图像分类算法中普遍存在模型的可解释性问题,将同一卷积神经网络应用到不同的数据集上,分类性能千差万别.针对这一问题,提出了一种基于特征图可视化的医学图像分析方法.在卷积神经网络的特征提取阶段设计4个特征图可视化模型,这些模型将具有与网络相同的输入层以及权重,但输出则是一系列特征图.采用SSIM相似度对信息熵最大的特征图评估,分析4个模型提取到的特征信息.在kaggle官网上提供的BreaKHis、Chest X-Ray、Retinal OCT 3类数据集上进行实验,其中基于VGG16网络的特征图可视化模型提取到的特征相似度分别集中在0.95,0.93,0.85,分类精度分别为75.96%,77.19%,99.40%.此外,在ResNet18网络上也有相同的表现.研究表明:分类性能取决于网络的特征提取能力,在保证相似性的前提下,卷积层之间提取到的特征其相似度越低,该数据集在同一网络上往往表现出更好的分类性能. 展开更多
关键词 卷积神经网络 医学图像分类 特征图可视化 VGG16
下载PDF
跨模态融合和边界可变形卷积引导的RGB-D显著性目标检测
15
作者 孟令兵 袁梦雅 +3 位作者 时雪涵 张乐 吴锦华 程菲 《电子学报》 EI CAS CSCD 北大核心 2023年第11期3155-3166,共12页
RGB-Depth(RGB-D)显著性目标检测是一项有意义且具有挑战性的任务,基于现有卷积神经网络检测方法在简单场景中获得了良好的检测性能,但不能有效应对背景信息混乱,深度图质量低和目标轮廓复杂的情况.为应对上述问题,本文提出了一种跨模... RGB-Depth(RGB-D)显著性目标检测是一项有意义且具有挑战性的任务,基于现有卷积神经网络检测方法在简单场景中获得了良好的检测性能,但不能有效应对背景信息混乱,深度图质量低和目标轮廓复杂的情况.为应对上述问题,本文提出了一种跨模态融合和边界可变形卷积引导的RGB-D显著性目标检测方法.首先,本文以Swin-Transformer为特征提取器,分别对RGB模态与深度图模态进行特征提取,并通过跨模态注意力增强特征模块对两种模态特征进行融合以挖掘显著物的共性与互补特征.接着将提出的相邻多尺度特征增强模块嵌入编码器深层,以获得丰富的全局上下文特征信息,更精准地定位显著物的位置.然后通过构建一个边界特征提取解码器(U-Net架构)生成显著物的边界线索图,并重复采用跨模态融合特征确保生成显著物边界的完整性.最后,本文设计了一个边界可变形卷积引导模块,使用边界线索图与可变形卷积引导跨模态融合特征进行解码以得到更加准确的显著图.通过在6个公开基准数据集上与25种主流方法相比较,本文所提模型在多个指标上均有较明显的提升,从而证明了本文方法的有效性. 展开更多
关键词 显著性目标检测 跨模态融合 边界特征 可变形卷积 显著图
下载PDF
基于深度迁移学习与多尺度特征融合的场景识别方法
16
作者 王桥 胡春燕 李菲菲 《电子科技》 2023年第11期19-27,共9页
卷积神经网络(Convolutional Neural Networks,CNN)在场景识别领域取得了较好的研究成果,但该方法并未充分考虑到场景的特殊性。同类场景图像由于采样时的尺度、视角以及背景的不同而具有类内差异性,存在于异类场景间的共有物体又使异... 卷积神经网络(Convolutional Neural Networks,CNN)在场景识别领域取得了较好的研究成果,但该方法并未充分考虑到场景的特殊性。同类场景图像由于采样时的尺度、视角以及背景的不同而具有类内差异性,存在于异类场景间的共有物体又使异类场景图像间具有一定的相似性。考虑到不同尺度大小的场景图像也会影响其中物体的大小,文中提出一种基于深度迁移学习与多尺度特征融合的场景识别方法。首先,使用迁移学习将在Places数据集上预训练出的网络参数迁移到CNN模型中,然后微调并再次训练网络,降低训练成本。随后,将从类激活图中获取的多尺度图像块送入CNN进行特征提取,并融合得到特征向量,使最终得到的场景图像特征更丰富。在SUN397数据集上的实验结果表明,与其它基于CNN算法相比,文中提出的算法提高了场景识别的准确度。 展开更多
关键词 场景识别 卷积神经网络 SE-Block 类激活图 迁移学习 多尺度 特征融合 支持向量机
下载PDF
基于云图特征的超短期光伏发电功率预测模型 被引量:1
17
作者 叶畅 柳丹 曹侃 《电网与清洁能源》 CSCD 北大核心 2023年第10期70-79,共10页
云团运动的不确定性使得光伏系统输出功率较难准确估计,从而影响新能源并网的可靠性和经济性。为了有效利用卫星的云观测数据,提出了基于云图特征的超短期光伏发电功率预测模型。利用卷积神经网络对卫星云图进行特征提取,且和通过相关... 云团运动的不确定性使得光伏系统输出功率较难准确估计,从而影响新能源并网的可靠性和经济性。为了有效利用卫星的云观测数据,提出了基于云图特征的超短期光伏发电功率预测模型。利用卷积神经网络对卫星云图进行特征提取,且和通过相关性分析后的4种气象特征进行融合,作为光伏发电功率预测模型输入。在此基础上,通过卷积神经网络解析这些特征之间的空间联系,并使用长短期记忆网络实现对光伏输出功率的时间序列预测。此外,考虑到一个自然日中不同时段数据对预测影响不同,引入多头注意力机制来确定关键时间点与关键特征,由此进一步提高所提模型精度。使用光伏电站实际数据以及对应的卫星云图和天气数据,对所提模型的预测效果进行验证。算例分析结果表明,该模型预测精度高且时效性好,特别对于正午辐照较大以及云团运动波动剧烈的时段,模型仍能保证较高的预测精度。 展开更多
关键词 光伏功率预测 云图特征 长短期记忆网络 卷积神经网络 注意力机制
下载PDF
FPGA平台轻量化卷积神经网络辐射源信号识别方法
18
作者 肖帅 龚帅阁 +2 位作者 李想 王昊 陶诗飞 《计算技术与自动化》 2023年第4期140-146,共7页
针对卷积神经网络计算资源消耗大、难以在边缘侧应用等问题,提出了一种面向FPGA(Field Programmable Gate Array)平台的基于知识蒸馏的轻量化卷积神经网络辐射源信号识别方法。该方法以信号时频图作为特征提取对象,结合改进的知识蒸馏... 针对卷积神经网络计算资源消耗大、难以在边缘侧应用等问题,提出了一种面向FPGA(Field Programmable Gate Array)平台的基于知识蒸馏的轻量化卷积神经网络辐射源信号识别方法。该方法以信号时频图作为特征提取对象,结合改进的知识蒸馏方法对卷积神经网络进行轻量化处理,通过注意力图增强知识信息传递,并融合深度可分离卷积,进一步提高网络稀疏度。最后,将该轻量化网络在FPGA平台上进行结构优化,通过改进循环策略和流水线并行设计,加速轻量化卷积神经网络的辐射源信号识别过程。仿真结果显示,利用本文提出的轻量化卷积神经网络辐射源信号识别算法,网络参数量降低了81.8%,在信噪比不低于-12dB的条件下,信号识别准确率达到了90%以上,FPGA平台信号识别时间为86ms,平均功耗为2W,可满足边缘侧终端对信号实时检测以及低功耗的实际应用需求。 展开更多
关键词 时频特征 轻量化网络 知识蒸馏 注意力图 深度可分离卷积神经网络
下载PDF
基于语义信息的人脸特征匹配方法
19
作者 叶培楚 杨伟钧 曾宪贤 《广州城市职业学院学报》 2023年第3期91-95,共5页
人脸识别在图像处理领域是一个非常重要的研究方向,如何准确地从大量的人脸图像中识别出特定的人脸,是一个非常重要且迫切的问题。为此,提出一种能够有效提高识别准确率的辅助人脸识别方法。基于深度学习的人脸识别方法,是将人脸图像输... 人脸识别在图像处理领域是一个非常重要的研究方向,如何准确地从大量的人脸图像中识别出特定的人脸,是一个非常重要且迫切的问题。为此,提出一种能够有效提高识别准确率的辅助人脸识别方法。基于深度学习的人脸识别方法,是将人脸图像输入到一个训练好的卷积网络中,网络输出一个关于输入图像的特征描述向量。因此在人脸识别的过程中,只需计算两帧图像的描述向量间的相似性即可。但研究发现,识别准确率还有提升空间,因此利用第五层卷积特征图的特征,结合深度学习方法最终生成的图像描述向量,可以在人脸识别过程中显著提高识别准确率。大量实验证明,本方法可用于辅助基于深度学习方法的图像识别问题,能够有效提高识别准确率。 展开更多
关键词 人脸识别 辅助识别 卷积特征图 深度学习
下载PDF
基于融合逆透射率图的水下图像增强算法
20
作者 张剑钊 郭继昌 汪昱东 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2023年第5期921-929,共9页
针对水下图像质量退化严重的问题,提出一种端到端的基于融合逆透射率图的水下图像增强算法.将原始RGB图像和基于传统方法得到的逆透射率图分别输入到双流卷积神经网络的2个编码器中;通过跨模态特征融合模块使得2种图像信息充分融合互补... 针对水下图像质量退化严重的问题,提出一种端到端的基于融合逆透射率图的水下图像增强算法.将原始RGB图像和基于传统方法得到的逆透射率图分别输入到双流卷积神经网络的2个编码器中;通过跨模态特征融合模块使得2种图像信息充分融合互补,让网络更好地学习到水下光学成像的特点;通过特征增强模块,增强特征的表达能力;通过残差解码模块连接解码器和编码器,以补充和丰富RGB特征.通过逆透射率图的水下图像增强算法以及跨模态跨尺度的信息融合,由粗到细地进行逐级处理,最终输出增强后的RGB图像.实验结果表明,所提算法能够有效地提升水下图像视觉质量.综合主观评价和客观评价,所提算法优于所对比的白平衡WB、直方图均衡化HE、Water-Net、UGAN、UWCNN、Ucolor 6种算法. 展开更多
关键词 逆透射率图 水下图像增强 水下光学成像 双流卷积神经网络 特征融合
下载PDF
上一页 1 2 6 下一页 到第
使用帮助 返回顶部