期刊文献+
共找到165篇文章
< 1 2 9 >
每页显示 20 50 100
A Lightweight Convolutional Neural Network with Hierarchical Multi-Scale Feature Fusion for Image Classification
1
作者 Adama Dembele Ronald Waweru Mwangi Ananda Omutokoh Kube 《Journal of Computer and Communications》 2024年第2期173-200,共28页
Convolutional neural networks (CNNs) are widely used in image classification tasks, but their increasing model size and computation make them challenging to implement on embedded systems with constrained hardware reso... Convolutional neural networks (CNNs) are widely used in image classification tasks, but their increasing model size and computation make them challenging to implement on embedded systems with constrained hardware resources. To address this issue, the MobileNetV1 network was developed, which employs depthwise convolution to reduce network complexity. MobileNetV1 employs a stride of 2 in several convolutional layers to decrease the spatial resolution of feature maps, thereby lowering computational costs. However, this stride setting can lead to a loss of spatial information, particularly affecting the detection and representation of smaller objects or finer details in images. To maintain the trade-off between complexity and model performance, a lightweight convolutional neural network with hierarchical multi-scale feature fusion based on the MobileNetV1 network is proposed. The network consists of two main subnetworks. The first subnetwork uses a depthwise dilated separable convolution (DDSC) layer to learn imaging features with fewer parameters, which results in a lightweight and computationally inexpensive network. Furthermore, depthwise dilated convolution in DDSC layer effectively expands the field of view of filters, allowing them to incorporate a larger context. The second subnetwork is a hierarchical multi-scale feature fusion (HMFF) module that uses parallel multi-resolution branches architecture to process the input feature map in order to extract the multi-scale feature information of the input image. Experimental results on the CIFAR-10, Malaria, and KvasirV1 datasets demonstrate that the proposed method is efficient, reducing the network parameters and computational cost by 65.02% and 39.78%, respectively, while maintaining the network performance compared to the MobileNetV1 baseline. 展开更多
关键词 MobileNet Image Classification Lightweight convolutional neural network Depthwise dilated Separable convolution Hierarchical Multi-Scale Feature Fusion
下载PDF
Multi-Classification of Polyps in Colonoscopy Images Based on an Improved Deep Convolutional Neural Network 被引量:1
2
作者 Shuang Liu Xiao Liu +9 位作者 Shilong Chang Yufeng Sun Kaiyuan Li Ya Hou Shiwei Wang Jie Meng Qingliang Zhao Sibei Wu Kun Yang Linyan Xue 《Computers, Materials & Continua》 SCIE EI 2023年第6期5837-5852,共16页
Achieving accurate classification of colorectal polyps during colonoscopy can avoid unnecessary endoscopic biopsy or resection.This study aimed to develop a deep learning model that can automatically classify colorect... Achieving accurate classification of colorectal polyps during colonoscopy can avoid unnecessary endoscopic biopsy or resection.This study aimed to develop a deep learning model that can automatically classify colorectal polyps histologically on white-light and narrow-band imaging(NBI)colonoscopy images based on World Health Organization(WHO)and Workgroup serrAted polypS and Polyposis(WASP)classification criteria for colorectal polyps.White-light and NBI colonoscopy images of colorectal polyps exhibiting pathological results were firstly collected and classified into four categories:conventional adenoma,hyperplastic polyp,sessile serrated adenoma/polyp(SSAP)and normal,among which conventional adenoma could be further divided into three sub-categories of tubular adenoma,villous adenoma and villioustublar adenoma,subsequently the images were re-classified into six categories.In this paper,we proposed a novel convolutional neural network termed Polyp-DedNet for the four-and six-category classification tasks of colorectal polyps.Based on the existing classification network ResNet50,Polyp-DedNet adopted dilated convolution to retain more high-dimensional spatial information and an Efficient Channel Attention(ECA)module to improve the classification performance further.To eliminate gridding artifacts caused by dilated convolutions,traditional convolutional layers were used instead of the max pooling layer,and two convolutional layers with progressively decreasing dilation were added at the end of the network.Due to the inevitable imbalance of medical image data,a regularization method DropBlock and a Class-Balanced(CB)Loss were performed to prevent network overfitting.Furthermore,the 5-fold cross-validation was adopted to estimate the performance of Polyp-DedNet for the multi-classification task of colorectal polyps.Mean accuracies of the proposed Polyp-DedNet for the four-and six-category classifications of colorectal polyps were 89.91%±0.92%and 85.13%±1.10%,respectively.The metrics of precision,recall and F1-score were also improved by 1%∼2%compared to the baseline ResNet50.The proposed Polyp-DedNet presented state-of-the-art performance for colorectal polyp classifying on white-light and NBI colonoscopy images,highlighting its considerable potential as an AI-assistant system for accurate colorectal polyp diagnosis in colonoscopy. 展开更多
关键词 Colorectal polyps four-and six-category classifications convolutional neural network dilated residual network
下载PDF
1D-CNN:Speech Emotion Recognition System Using a Stacked Network with Dilated CNN Features 被引量:5
3
作者 Mustaqeem Soonil Kwon 《Computers, Materials & Continua》 SCIE EI 2021年第6期4039-4059,共21页
Emotion recognition from speech data is an active and emerging area of research that plays an important role in numerous applications,such as robotics,virtual reality,behavior assessments,and emergency call centers.Re... Emotion recognition from speech data is an active and emerging area of research that plays an important role in numerous applications,such as robotics,virtual reality,behavior assessments,and emergency call centers.Recently,researchers have developed many techniques in this field in order to ensure an improvement in the accuracy by utilizing several deep learning approaches,but the recognition rate is still not convincing.Our main aim is to develop a new technique that increases the recognition rate with reasonable cost computations.In this paper,we suggested a new technique,which is a one-dimensional dilated convolutional neural network(1D-DCNN)for speech emotion recognition(SER)that utilizes the hierarchical features learning blocks(HFLBs)with a bi-directional gated recurrent unit(BiGRU).We designed a one-dimensional CNN network to enhance the speech signals,which uses a spectral analysis,and to extract the hidden patterns from the speech signals that are fed into a stacked one-dimensional dilated network that are called HFLBs.Each HFLB contains one dilated convolution layer(DCL),one batch normalization(BN),and one leaky_relu(Relu)layer in order to extract the emotional features using a hieratical correlation strategy.Furthermore,the learned emotional features are feed into a BiGRU in order to adjust the global weights and to recognize the temporal cues.The final state of the deep BiGRU is passed from a softmax classifier in order to produce the probabilities of the emotions.The proposed model was evaluated over three benchmarked datasets that included the IEMOCAP,EMO-DB,and RAVDESS,which achieved 72.75%,91.14%,and 78.01%accuracy,respectively. 展开更多
关键词 Affective computing one-dimensional dilated convolutional neural network emotion recognition gated recurrent unit raw audio clips
下载PDF
数据驱动的半无限介质裂纹识别模型研究
4
作者 江守燕 邓王涛 +1 位作者 孙立国 杜成斌 《力学学报》 EI CAS CSCD 北大核心 2024年第6期1727-1739,共13页
缺陷识别是结构健康监测的重要研究内容,对评估工程结构的安全性具有重要的指导意义,然而,准确确定结构缺陷的尺寸十分困难.论文提出了一种创新的数据驱动算法,将比例边界有限元法(scaled boundary finite element methods,SBFEM)与自... 缺陷识别是结构健康监测的重要研究内容,对评估工程结构的安全性具有重要的指导意义,然而,准确确定结构缺陷的尺寸十分困难.论文提出了一种创新的数据驱动算法,将比例边界有限元法(scaled boundary finite element methods,SBFEM)与自编码器(autoencoder,AE)、因果膨胀卷积神经网络(causal dilated convolutional neural network,CDCNN)相结合用于半无限介质中的裂纹识别.在该模型中,SBFEM用于模拟波在含不同裂纹状缺陷半无限介质中的传播过程,对于不同的裂纹状缺陷,仅需改变裂纹尖端的比例中心和裂纹开口处节点的位置,避免了复杂的重网格过程,可高效地生成足够的训练数据.模拟波在半无限介质中传播时,建立了基于瑞利阻尼的吸收边界模型,避免了对结构全域模型进行计算.搭建了CDCNN,确保了时序数据的有序性,并获得更大的感受野而不增加神经网络的复杂性,可捕捉更多的历史信息,AE具有较强的非线性特征提取能力,可将高维的原始输入特征向量空间映射到低维潜在特征向量空间,以获得低维潜在特征用于网络模型训练,有效提升了网络模型的学习效率.数值算例表明:提出的模型能够高效且准确地识别半无限介质中裂纹的量化信息,且AE-CDCNN模型的识别效率较单CDCNN模型提高了约2.7倍. 展开更多
关键词 数据驱动 比例边界有限元法 自编码器 因果膨胀卷积神经网络 裂纹识别
下载PDF
联合多连接特征编解码与小波池化的轻量级语义分割
5
作者 易清明 王渝 +1 位作者 石敏 骆爱文 《电子科技大学学报》 EI CAS CSCD 北大核心 2024年第3期366-375,共10页
语义分割是当前场景理解领域的基础技术之一。现存的语义分割网络通常结构复杂、参数量大、图像特征信息损失过多和计算效率低。针对以上问题,基于编-解码器框架和离散小波变换,设计了一个联合多连接特征编解码与小波池化的轻量级语义... 语义分割是当前场景理解领域的基础技术之一。现存的语义分割网络通常结构复杂、参数量大、图像特征信息损失过多和计算效率低。针对以上问题,基于编-解码器框架和离散小波变换,设计了一个联合多连接特征编解码与小波池化的轻量级语义分割网络MLWP-Net(Multi-Link Wavelet-Pooled Network),在编码阶段利用多连接策略并结合深度可分离卷积、空洞卷积和通道压缩设计了轻量级特征提取瓶颈结构,并设计了低频混合小波池化操作替代传统的下采样操作,有效降低编码过程造成的信息丢失;在解码阶段,设计了多分支并行空洞卷积解码器以融合多级特征并行实现图像分辨率的恢复。实验结果表明,MLWP-Net仅以0.74 MB的参数量在数据集Cityscapes和CamVid上分别达到74.1%和68.2%mIoU的分割精度,验证了该算法的有效性。 展开更多
关键词 实时语义分割 轻量级神经网络 多连接特征融合 小波池化 多分支空洞卷积
下载PDF
多层特征融合与语义增强的盲图像质量评价
6
作者 赵文清 许丽娇 +1 位作者 陈昊阳 李梦伟 《智能系统学报》 CSCD 北大核心 2024年第1期132-141,共10页
针对现有盲图像质量评价算法在面对真实失真图像时性能较差的问题,本文提出多层特征融合和语义信息增强相结合的无参考图像质量评价算法。提取图像的局部和全局失真特征,利用特征融合模块对特征进行多层融合;利用多层扩张卷积增强语义信... 针对现有盲图像质量评价算法在面对真实失真图像时性能较差的问题,本文提出多层特征融合和语义信息增强相结合的无参考图像质量评价算法。提取图像的局部和全局失真特征,利用特征融合模块对特征进行多层融合;利用多层扩张卷积增强语义信息,进而指导失真图像到质量分数的映射过程;考虑预测分数和主观分数之间的相对排名关系,对L_(1)损失函数和三元组排名损失函数进行融合,构建新的损失函数L_(mix)。为了验证本文方法的有效性,在野生图像质量挑战数据集上进行了验证和对比实验,该算法的斯皮尔曼等级相关系数与皮尔逊线性相关系数指标相比原算法分别提升2.3%和2.3%;在康斯坦茨真实图像质量数据数据集和野生图像质量挑战数据集上进行了跨数据集实验,该算法在面对真实失真图像时表现出了良好的泛化性能。 展开更多
关键词 深度学习 图像质量 卷积神经网络 特征提取 通道注意力结构 多层次特征融合 扩张卷积 三元组损失函数
下载PDF
比例融合与多层规模感知的人群计数方法
7
作者 孟月波 张娅琳 王宙 《智能系统学报》 CSCD 北大核心 2024年第2期307-315,共9页
针对密集场景下人群图像拍摄视角或距离多变造成的多尺度特征获取不足、融合不佳和全局特征利用不充分等问题,提出一种比例融合与多层规模感知的人群计数网络。首先采用骨干网络VGG16提取人群密度初始特征;其次,设计多层规模感知模块,... 针对密集场景下人群图像拍摄视角或距离多变造成的多尺度特征获取不足、融合不佳和全局特征利用不充分等问题,提出一种比例融合与多层规模感知的人群计数网络。首先采用骨干网络VGG16提取人群密度初始特征;其次,设计多层规模感知模块,获得人群多尺度信息的丰富表达;再次,提出比例融合策略,根据卷积层捕获的特征权重重构多尺度信息,提取显著性人群特征;最后,采用卷积回归策略进行密度图的回归。同时,提出一种局部一致性损失函数,通过区域化密度图的方式增强生成密度图与真实密度图的相似度,提高计数性能。在多个人群数据集上的试验结果表明,所提模型优于近年人群计数的先进方法,且在车辆计数上有较好推广性。 展开更多
关键词 人群密度估计与计数 卷积神经网络 多层规模感知 比例融合 局部一致性损失 密度图回归 多尺度信息 空洞卷积
下载PDF
RIB-NER:基于跨度的中文命名实体识别模型
8
作者 田红鹏 吴璟玮 《计算机工程与科学》 CSCD 北大核心 2024年第7期1311-1320,共10页
命名实体识别是自然语言处理领域中诸多下游任务的重要基础。汉语作为重要的国际语言,在许多方面具有独特性。传统上,中文命名实体识别任务模型使用序列标记机制,该机制需要条件随机场捕获标签的依赖性,然而,这种方法容易出现标签的错... 命名实体识别是自然语言处理领域中诸多下游任务的重要基础。汉语作为重要的国际语言,在许多方面具有独特性。传统上,中文命名实体识别任务模型使用序列标记机制,该机制需要条件随机场捕获标签的依赖性,然而,这种方法容易出现标签的错误分类。针对这个问题,提出基于跨度的命名实体识别模型RIB-NER。首先,以RoBERTa-wwm-ext作为模型嵌入层,提供字符级嵌入,以获得更多的上下文语义信息和词汇信息。其次,利用IDCNN的并行卷积核来增强词之间的位置信息,从而使词与词之间联系更加紧密。同时,在模型中融合BiLSTM网络来获取上下文信息。最后,采用双仿射模型对句子中的开始标记和结束标记评分,使用这些标记探索跨度。在MSRA和Weibo 2个语料库上的实验结果表明,RIB-NER能够较为准确地识别实体边界,并分别获得了95.11%和73.94%的F1值。与传统深度学习相比,有更好的识别效果。 展开更多
关键词 中文命名实体识别 双仿射模型 迭代膨胀卷积神经网络 预训练模型 跨度
下载PDF
基于卷积神经网络的抽油机故障诊断
9
作者 吴昊臻 许燕 +2 位作者 周建平 谢欣岳 彭东 《燕山大学学报》 北大核心 2024年第1期30-38,共9页
抽油机故障诊断对于保障油气田的稳定运行至关重要.针对已有基于深度学习的故障诊断模型参数量大导致应用范围受限的问题提出一种基于空洞卷积和惩罚机制的卷积神经网络模型.该模型在浅层神经网络部署不同空洞卷积率的空洞残差模块高效... 抽油机故障诊断对于保障油气田的稳定运行至关重要.针对已有基于深度学习的故障诊断模型参数量大导致应用范围受限的问题提出一种基于空洞卷积和惩罚机制的卷积神经网络模型.该模型在浅层神经网络部署不同空洞卷积率的空洞残差模块高效获取示功图轮廓特征的同时降低了模型参数量.其次将惩罚机制融入Softmax损失函数增强模型诊断气体影响等难分样本的故障准确率.采用抽油机实况数据集进行实验验证结果表明该模型参数量为0.94 M浮点型计算量为165.24 M.与MobileNetV3相比改进后的算法模型在准确率同为96.6%的前提下参数量减少了3.30 M浮点型计算量减少了52.22 M更易部署在资源受限的故障诊断平台. 展开更多
关键词 卷积神经网络 抽油机 故障诊断 空洞卷积 损失函数
下载PDF
基于改进MobileNetV3-Small的色素减退性皮肤病诊断
10
作者 高埂 肖风丽 杨飞 《计算机与现代化》 2024年第5期120-126,共7页
传统的色素减退性皮肤病诊断依赖于皮肤科医生主观的临床经验,难以确保每位患者的皮肤病都能被及时精确诊断。因而,亟需一个快速而不依赖于经验的诊断方法。卷积神经网络(Convolutional Neural Network,CNN)具有强大的特征识别能力,为... 传统的色素减退性皮肤病诊断依赖于皮肤科医生主观的临床经验,难以确保每位患者的皮肤病都能被及时精确诊断。因而,亟需一个快速而不依赖于经验的诊断方法。卷积神经网络(Convolutional Neural Network,CNN)具有强大的特征识别能力,为该方法的实现提供了可能。目前基于CNN的诊断方法主要集中在ResNet50等较深的模型,虽然取得了较高的准确率,但是这些模型存在参数量大、识别慢、在移动设备上可用性差的缺点。为此,本文基于MobileNetV3-Small提出一个新的轻量级CNN模型。首先,舍弃MobileNetV3-Small中计算复杂的挤压-激发(Squeeze-and-Excitation,SE)模块,引入较轻量的高效通道注意力(Efficient Channel Attention,ECA)机制;其次,使用计算方便、稳定性好的Leaky-ReLU激活函数;最后,在卷积层中引入空洞卷积,扩大感受野。经过实验测试表明,本文提出的模型相较于现有的诊断模型实现了参数量、识别时间和FLOPs的大幅减少,满足移动应用场景下的高可用性,同时其准确率和F1值仍取得领先性能。最后,基于提出的模型设计出一个移动端的色素减退性皮肤病临床诊断工具。 展开更多
关键词 色素减退性皮肤病 卷积神经网络 注意力机制 激活函数 空洞卷积
下载PDF
基于变分模态分解与空洞卷积神经网络的配电网故障选线方法
11
作者 李成钢 刘亚东 +4 位作者 杨雪凤 侍哲 于非桐 刘乃毓 罗国敏 《电网与清洁能源》 CSCD 北大核心 2024年第2期110-118,126,共10页
小电流接地系统发生单相接地故障时,零序电流故障特征微弱且繁杂多变,传统选线方法可靠性有待提高。提出了一种基于变分模态分解(variational mode decomposition,VMD)与空洞卷积神经网络的配电网故障选线方法。首先,分析配电网健全线... 小电流接地系统发生单相接地故障时,零序电流故障特征微弱且繁杂多变,传统选线方法可靠性有待提高。提出了一种基于变分模态分解(variational mode decomposition,VMD)与空洞卷积神经网络的配电网故障选线方法。首先,分析配电网健全线路和故障线路的电气特征,采用零序电流作为故障特征信号,为选线模型的输入量提供理论依据;其次,通过变分模态分解把零序电流序列分成不同频率的固有模态函数,提高故障信号特征的平稳性和差异性;然后,采用空洞卷积神经网络作为选线网络,以增大卷积操作感受野的方式增强模型的自适应分类能力;最后,在MATLAB/Simulink中构建10kV配电网进行算例分析,结果表明,该方法在不同故障场景条件下均有较高的选线效果,验证了所提方法的鲁棒性与准确性。 展开更多
关键词 变分模态分解 空洞卷积神经网络 单相接地故障 故障选线 配电网
下载PDF
基于卷积神经网络和Transformer的高效图像超分辨率重建
12
作者 李邦源 杨家全 +3 位作者 薛若漪 张晓宇 汪航 孙宏滨 《云南电力技术》 2024年第2期41-48,共8页
深度学习推动了图像超分辨率重建技术的显著进步,但复杂的操作导致计算和内存成本高昂,限制了其实际应用。为此,提出了一种新颖的算法,融合了Transformer和卷积神经网络,同时采用膨胀卷积和深度可分离卷积技术。在五个基准数据集上的实... 深度学习推动了图像超分辨率重建技术的显著进步,但复杂的操作导致计算和内存成本高昂,限制了其实际应用。为此,提出了一种新颖的算法,融合了Transformer和卷积神经网络,同时采用膨胀卷积和深度可分离卷积技术。在五个基准数据集上的实验证明,所提EHN模型能够高效提取超分辨率特征,在更少参数和推理时间下实现与现有方法相当甚至更好的超分辨率效果。特别地,在×2、×3和×4放大倍数下,EHN的推理时间仅为现有网络的18.4%、18.9%和20.3%,这一优势对于处理大量图像的场景至关重要,能够显著减少计算时间和资源消耗,提升整体效率。 展开更多
关键词 图像超分辨率 TRANSFORMER 卷积神经网络 膨胀卷积 深度可分离卷积
下载PDF
融合注意力与多分支膨胀卷积的音频隐写算法
13
作者 廖浩媛 高勇 《通信技术》 2024年第2期125-131,共7页
为提升音频隐写算法的透明性与安全性,提出了一种将多分支膨胀卷积网络(Multi-Branch Dilated Convolutional Network,MBDC)与残差瓶颈注意力模块相结合的高透明性、高鲁棒性和高隐藏容量的音频隐写算法。编码器采用不同膨胀率组成的多... 为提升音频隐写算法的透明性与安全性,提出了一种将多分支膨胀卷积网络(Multi-Branch Dilated Convolutional Network,MBDC)与残差瓶颈注意力模块相结合的高透明性、高鲁棒性和高隐藏容量的音频隐写算法。编码器采用不同膨胀率组成的多分支膨胀卷积网络进行局部编码,完成对音频的嵌入,在音频采样率相同时,可用更少的参数获得更大的感受野,更全面地捕捉音频信号的上下文信息。在编码器与解码器后增加残差注意力模块,增加了网络对音频关键特征的辨别能力,提高了音频隐写算法的透明性与隐藏容量。将算法在多个音频数据集中进行实验,结果表明,该隐写算法具有较好的泛化能力,与传统隐写算法和其他神经网络模型相比,具有更好的透明性与隐藏容量,同时该算法对不同噪声干扰具有良好的鲁棒性。 展开更多
关键词 音频隐写 神经网络 膨胀卷积 注意力机制
下载PDF
基于新型Contention网络的滚动轴承早期故障诊断方法研究
14
作者 赵俊豪 郑煜 +1 位作者 王英 王凯 《机械设计与制造工程》 2024年第3期87-91,共5页
针对滚动轴承早期故障诊断问题,为了同时建模振动信号中的高频和低频特征,实现高精度诊断,提出了一种新的模型Contention。它以一种互补的方式集成了空洞卷积和自注意力机制的优点,具有同时捕捉高频和低频信息的能力。为了验证其诊断能... 针对滚动轴承早期故障诊断问题,为了同时建模振动信号中的高频和低频特征,实现高精度诊断,提出了一种新的模型Contention。它以一种互补的方式集成了空洞卷积和自注意力机制的优点,具有同时捕捉高频和低频信息的能力。为了验证其诊断能力,首先,在完整信息原则下将振动信号连续构造成数据集;其次,搭建Contention网络并训练,其最终测试集准确度可达100%,t-SNE显示随网络层次的深入特征被明显聚类;最后,设置对照实验,将该模型与传统RNN、CNN、Transformer模型对比,证明该模型具备突出的诊断能力。 展开更多
关键词 Contention网络 空洞卷积 自注意力机制 滚动轴承 早期故障诊断
下载PDF
改进多阶段渐进式的受电弓碳滑板图像去模糊
15
作者 刘伟民 张梦准 +2 位作者 郑爱云 刘晋 郑直 《电子测量技术》 北大核心 2024年第5期85-93,共9页
针对高铁运行速度过快,容易导致受电弓碳滑板的监测图像出现运动模糊问题,提出了一种改进多阶段渐进式网络的图像去模糊方法。首先,引入混合膨胀卷积作为特征提取网络,在不改变计算量和特征图分辨率前提下,可以增大局部感受野,进而可获... 针对高铁运行速度过快,容易导致受电弓碳滑板的监测图像出现运动模糊问题,提出了一种改进多阶段渐进式网络的图像去模糊方法。首先,引入混合膨胀卷积作为特征提取网络,在不改变计算量和特征图分辨率前提下,可以增大局部感受野,进而可获取高质量的图像纹理和细节信息;其次,引入像素点注意力机制,自适应地选择每个像素点的权重值,增强模型去模糊质量;再次,引入混合损失函数,提高模型对不同类型模糊的鲁棒性;最后,制作1600对受电弓碳滑板监测图像合成数据集以供模型进行训练和测试。为了评估所提网络的去模糊效果,将训练所得模型在上述数据集上进行了测试,实验结果表明峰值信噪比达到了38.82 dB、结构相似性达到了0.9723,在视觉上较另外7种经典方法能更好地复原图像的边缘轮廓和纹理细节信息。有效地提升了模型的鲁棒性。 展开更多
关键词 图像去模糊 卷积神经网络 混合膨胀卷积 像素点注意力 混合损失函数
下载PDF
轻量化沥青路面裂缝图像分割网络PIPNet
16
作者 封筠 毕健康 +1 位作者 霍一儒 李家宽 《计算机应用》 CSCD 北大核心 2024年第5期1520-1526,共7页
裂缝分割是对路面病害损坏程度评估的重要前提,为平衡深度神经网络分割的有效性与实时性,提出一种基于U-Net编码-解码结构的轻量化沥青路面裂缝图像分割网络PIPNet(Parallel dilated convolution of Inverted Pyramid Network)。编码部... 裂缝分割是对路面病害损坏程度评估的重要前提,为平衡深度神经网络分割的有效性与实时性,提出一种基于U-Net编码-解码结构的轻量化沥青路面裂缝图像分割网络PIPNet(Parallel dilated convolution of Inverted Pyramid Network)。编码部分为倒金字塔结构,提出了具有不同空洞率的多分支并行空洞卷积模块,结合深度可分离卷积和普通卷积,逐级减少并行卷积的个数,对表层、中层及底层特征提取多尺度信息并降低模型复杂度;同时借鉴GhostNet特点,设计了逆残差轻量化模块,嵌入并行双池化注意力。在GAPs384数据集上的测试结果表明,PIPNet在参数量(Params)和计算量(MFLOPs)仅为ResNet50编码近1/6的情况下,平均交并比(mIoU)提高了1.10个百分点,且较轻量化GhostNet和SegNet分别高出4.14与9.95个百分点。实验结果表明,PIPNet在降低模型复杂度的同时,有着较好的裂缝分割性能,且对不同路面裂缝图像分割适应性良好。 展开更多
关键词 沥青路面图像 裂缝分割 轻量化神经网络 倒金字塔结构 并行空洞卷积
下载PDF
基于空洞卷积神经网络的铝硅合金实体关系联合抽取模型(英文)
17
作者 李武亮 邱洪顺 +3 位作者 周治邦 罗光辉 郜洪波 王鸿湫 《材料导报》 EI CAS CSCD 北大核心 2024年第S01期501-511,共11页
近年来,材料基因组计划(Material genome initiative,MGI)已经成为全球热点。随着材料科学的不断发展,材料文献中包含的海量信息成为研究人员关注的焦点,如何获取大量有效的材料数据是现阶段的主要挑战。本文采用自然语言处理(Natural l... 近年来,材料基因组计划(Material genome initiative,MGI)已经成为全球热点。随着材料科学的不断发展,材料文献中包含的海量信息成为研究人员关注的焦点,如何获取大量有效的材料数据是现阶段的主要挑战。本文采用自然语言处理(Natural language processing,NLP)技术从铝硅合金材料文献中获取数据。命名实体识别(Named entity recognition,NER)和关系抽取(Relation extraction,RE)是NLP的两个子任务,可以高效地从文本中提取单词信息及其之间的关系。铝硅合金文献中存在多种命名实体及多种关系,本文从材料科学文献中选择11种实体类型和13种关系类型,手动标注构建了铝硅合金实体关系数据集,将命名实体识别与关系抽取进行联合学习,即对实体识别和关系抽取进行统一建模。此外,针对基础模型的编码层存在捕捉文本语义信息不充分问题,通过改进模型的编码层,将基础模型的BiLSTM层与空洞卷积模型结合,组成了新的编码器,避免了BiLSTM处理文本信息丢失的问题,最终使铝硅合金实体关系联合抽取模型能够更好地捕捉文本中句子的语义单元信息。 展开更多
关键词 材料基因组 铝硅合金文献 实体关系联合抽取 数据集 空洞卷积神经网络
下载PDF
基于密集扩张卷积残差网络的地震数据随机噪声压制方法 被引量:1
18
作者 高磊 沈侯森 闵帆 《石油物探》 CSCD 北大核心 2023年第4期655-668,共14页
地震数据处理过程中压制随机噪声是提高地震数据质量的重要环节之一,其关键是有效压制噪声并尽可能地保留有效信号。针对深度学习方法在地震数据去噪处理时局部特征提取的局限性,提出了一种基于密集扩张卷积残差网络(DDCRN)的去噪方法。... 地震数据处理过程中压制随机噪声是提高地震数据质量的重要环节之一,其关键是有效压制噪声并尽可能地保留有效信号。针对深度学习方法在地震数据去噪处理时局部特征提取的局限性,提出了一种基于密集扩张卷积残差网络(DDCRN)的去噪方法。DDCRN主要由多个密集扩张卷积特征融合块(DDCFFB)构成,DDCFFB内部的密集块和多尺度扩张卷积可以用来并行提取特征,融合结构可以用来融合特征,残差结构则跳跃连接通道数。其中,密集块连接不同的卷积层来学习特征,关注局部特征的传播和重用,高效提取复杂信息;多尺度扩张卷积扩大感受野,增加特征提取范围;残差学习则加快网络训练的收敛速度。分别采用K奇异值分解(KSVD)、频域空间域反卷积(f-x decon)、去噪卷积神经网络(DnCNN)、U型网络(Unet)以及DDCRN去噪方法对合成地震数据和实际地震数据进行去噪处理。结果表明,DDCRN去噪方法不仅能更有效地压制随机噪声,同时还能更完整地保留同相轴的连续性。 展开更多
关键词 地震数据去噪 特征融合 卷积神经网络 密集块 扩张卷积
下载PDF
结合全局注意力机制的实时语义分割网络 被引量:2
19
作者 李涛 高志刚 +2 位作者 管晟媛 徐久成 马媛媛 《智能系统学报》 CSCD 北大核心 2023年第2期282-292,共11页
针对轻量化网络结构从特征图提取有效语义信息不足,以及语义信息与空间细节信息融合模块设计不合理而导致分割精度降低的问题,本文提出一种结合全局注意力机制的实时语义分割网络(global attention mechanism with real time semantic s... 针对轻量化网络结构从特征图提取有效语义信息不足,以及语义信息与空间细节信息融合模块设计不合理而导致分割精度降低的问题,本文提出一种结合全局注意力机制的实时语义分割网络(global attention mechanism with real time semantic segmentation network,GaSeNet)。首先在双分支结构的语义分支中引入全局注意力机制,在通道与空间两个维度引导卷积神经网来关注与分割任务相关的语义类别,以提取更多有效语义信息;其次在空间细节分支设计混合空洞卷积块,在卷积核大小不变的情况下扩大感受野,以获取更多全局空间细节信息,弥补关键特征信息损失。然后重新设计特征融合模块,引入深度聚合金塔池化,将不同尺度的特征图深度融合,从而提高网络的语义分割性能。最后将所提出的方法在CamVid数据集和Vaihingen数据集上进行实验,通过与最新的语义分割方法对比分析可知,GaSeNet在分割精度上分别提高了4.29%、16.06%,实验结果验证了本文方法处理实时语义分割问题的有效性。 展开更多
关键词 实时语义分割 全局注意力机制 多尺度特征融合 混合空洞卷积 卷积神经网络 金字塔池化 感受野 特征提取
下载PDF
多局部残差连接注意网络的图像去模糊
20
作者 陈清江 王巧莹 《应用光学》 CAS 北大核心 2023年第2期337-344,共8页
针对现有的基于卷积神经网络的图像去模糊算法存在图像纹理细节恢复不清晰的问题,提出了一种基于多局部残差连接注意网络的图像去模糊算法。首先,采用一个卷积层进行浅层特征提取;其次,设计了一种新的基于残差连接和并行注意机制的多局... 针对现有的基于卷积神经网络的图像去模糊算法存在图像纹理细节恢复不清晰的问题,提出了一种基于多局部残差连接注意网络的图像去模糊算法。首先,采用一个卷积层进行浅层特征提取;其次,设计了一种新的基于残差连接和并行注意机制的多局部残差连接注意模块,用于消除图像模糊并提取上下文信息;再次,采用一个基于扩张卷积的成对连接模块进行细节恢复;最后,利用一个卷积层重建清晰图像。实验结果表明:在GoPro数据集上的PSNR(peak signal to noise ratio)和SSIM(structure similarity)分别为31.83 dB、0.9275,在定性和定量两方面都表明所提方法能够有效地恢复模糊图像的纹理细节,网络性能优于对比方法。 展开更多
关键词 卷积神经网络 注意机制 局部残差连接 扩张卷积
下载PDF
上一页 1 2 9 下一页 到第
使用帮助 返回顶部