期刊文献+
共找到378篇文章
< 1 2 19 >
每页显示 20 50 100
Static Digits Recognition Using Rotational Signatures and Hu Moments with a Multilayer Perceptron 被引量:1
1
作者 Francisco Solís Margarita Hernández +1 位作者 Amelia Pérez Carina Toxqui 《Engineering(科研)》 2014年第11期692-698,共7页
This paper presents two systems for recognizing static signs (digits) from American Sign Language (ASL). These systems avoid the use color marks, or gloves, using instead, low-pass and high-pass filters in space and f... This paper presents two systems for recognizing static signs (digits) from American Sign Language (ASL). These systems avoid the use color marks, or gloves, using instead, low-pass and high-pass filters in space and frequency domains, and color space transformations. First system used rotational signatures based on a correlation operator;minimum distance was used for the classification task. Second system computed the seven Hu invariants from binary images;these descriptors fed to a Multi-Layer Perceptron (MLP) in order to recognize the 9 different classes. First system achieves 100% of recognition rate with leaving-one-out validation and second experiment performs 96.7% of recognition rate with Hu moments and 100% using 36 normalized moments and k-fold cross validation. 展开更多
关键词 SIGN Language recognition ROTATIONAL SIGNATURES HU MOMENTS Multi-layer PERCEPTRON
下载PDF
DM-L Based Feature Extraction and Classifier Ensemble for Object Recognition
2
作者 Hamayun A. Khan 《Journal of Signal and Information Processing》 2018年第2期92-110,共19页
Deep Learning is a powerful technique that is widely applied to Image Recognition and Natural Language Processing tasks amongst many other tasks. In this work, we propose an efficient technique to utilize pre-trained ... Deep Learning is a powerful technique that is widely applied to Image Recognition and Natural Language Processing tasks amongst many other tasks. In this work, we propose an efficient technique to utilize pre-trained Convolutional Neural Network (CNN) architectures to extract powerful features from images for object recognition purposes. We have built on the existing concept of extending the learning from pre-trained CNNs to new databases through activations by proposing to consider multiple deep layers. We have exploited the progressive learning that happens at the various intermediate layers of the CNNs to construct Deep Multi-Layer (DM-L) based Feature Extraction vectors to achieve excellent object recognition performance. Two popular pre-trained CNN architecture models i.e. the VGG_16 and VGG_19 have been used in this work to extract the feature sets from 3 deep fully connected multiple layers namely “fc6”, “fc7” and “fc8” from inside the models for object recognition purposes. Using the Principal Component Analysis (PCA) technique, the Dimensionality of the DM-L feature vectors has been reduced to form powerful feature vectors that have been fed to an external Classifier Ensemble for classification instead of the Softmax based classification layers of the two original pre-trained CNN models. The proposed DM-L technique has been applied to the Benchmark Caltech-101 object recognition database. Conventional wisdom may suggest that feature extractions based on the deepest layer i.e. “fc8” compared to “fc6” will result in the best recognition performance but our results have proved it otherwise for the two considered models. Our experiments have revealed that for the two models under consideration, the “fc6” based feature vectors have achieved the best recognition performance. State-of-the-Art recognition performances of 91.17% and 91.35% have been achieved by utilizing the “fc6” based feature vectors for the VGG_16 and VGG_19 models respectively. The recognition performance has been achieved by considering 30 sample images per class whereas the proposed system is capable of achieving improved performance by considering all sample images per class. Our research shows that for feature extraction based on CNNs, multiple layers should be considered and then the best layer can be selected that maximizes the recognition performance. 展开更多
关键词 DEEP Learning Object recognition CNN DEEP MULTI-layer Feature Extraction Principal Component Analysis CLASSIFIER ENSEMBLE Caltech-101 BENCHMARK Database
下载PDF
冻土地区矿井水来源的水化学及环境同位素分析
3
作者 霍丙杰 李涛 +3 位作者 陈建平 张勇 靳京爵 张松涛 《安全与环境学报》 CAS CSCD 北大核心 2024年第6期2147-2156,共10页
冻土层季节性冻融过程会对地下水的渗流量、渗流方向和速度产生重要影响,进而导致冻土地区具有独特的地下水运移理论和机制。为了研究五九煤田胜利煤矿冻土地区矿井涌水来源及补给特征,采用水化学分析及^(13)C、^(14)C、^(18)O、D 4种... 冻土层季节性冻融过程会对地下水的渗流量、渗流方向和速度产生重要影响,进而导致冻土地区具有独特的地下水运移理论和机制。为了研究五九煤田胜利煤矿冻土地区矿井涌水来源及补给特征,采用水化学分析及^(13)C、^(14)C、^(18)O、D 4种环境同位素相结合的方法,分析矿井水的水化学特征及同位素分布特征,明确矿井涌水来源。通过对7组水样的试验研究发现:第四系水、第四系永冻层消融水、矿井水、基岩水均起源于大气降水,地表水、第四系水接受大气降水补给较快,基岩裂隙水、第四系永冻层消融水接受浅层第四系水的微量补给;采空区内黄铁矿氧化量较大,存在溶解少量瓦斯中CO_(2)的可能性,导致采空区积水中13C富集;矿井水中地表水和第四系水入渗量较小,表明第四系永冻层隔水性能良好。研究结果与实际情况相符,不仅为胜利矿水害防治提供依据,还为冻土地区类似矿井水源判别提供借鉴。 展开更多
关键词 安全工程 环境同位素 水源识别 第四系含水层 冻土地区
下载PDF
基于多层感知分类器的皮革图像缺陷识别研究
4
作者 马静 《中国皮革》 CAS 2024年第8期40-46,共7页
针对传统皮革图像缺陷识别准确率和识别效率不高的问题,提出一种改进多层感知分类器的皮革图像缺陷识别方法。首先,以多层感知分类器作为基础网络模型,对其结构进行优化,并选择适宜的激活函数、分类器和权值与偏置更新方法;然后,搭建一... 针对传统皮革图像缺陷识别准确率和识别效率不高的问题,提出一种改进多层感知分类器的皮革图像缺陷识别方法。首先,以多层感知分类器作为基础网络模型,对其结构进行优化,并选择适宜的激活函数、分类器和权值与偏置更新方法;然后,搭建一个基于改进多层感知分类器的皮革图像缺陷识别模型;最后,提出一套皮革缺陷图像数据集构建方案,通过滑窗裁剪、样本标注、图像增广等获得4类皮革缺陷图像样本,并将该数据集输入至搭建缺陷识别模型中进行缺陷识别。试验结果表明,本模型对孔洞缺陷、划痕缺陷、针眼缺陷和无缺陷4种故障样本的平均精确率、召回率、准确率和F1值分别为96.97%、96.52%、94.99%和96.14,且本模型进行缺陷识别所用时长仅为3.56 s。相较于经典卷积神经网络VGG16、残差网络ResNet10和支持向量机SVM,本模型对皮革图像不同样本的故障识别准确率更高,识别时间更短。由此说明,本模型能够提升皮革图像缺陷识别准确率和效率,模型性能具备优越性和有效性。 展开更多
关键词 多层感知分类器 皮革图像 图像增广 权值与偏置更新 缺陷识别
下载PDF
KCPStack:张量分解的卷积核分层矩阵压缩方法
5
作者 王鼎衡 刘保荣 +1 位作者 杨维 杨朝旭 《西安交通大学学报》 EI CAS CSCD 北大核心 2024年第3期137-148,共12页
针对现有张量分解卷积核压缩方法难以兼顾时空轻量化、过于依赖卷积瓶颈结构等问题,提出一种具有可观压缩与加速能力的卷积核分层矩阵压缩方法(KCPStack)。首先,在矩阵乘法视角下,将卷积核按通道拆分为2阶克罗内克规范多项式(KCP)分解,... 针对现有张量分解卷积核压缩方法难以兼顾时空轻量化、过于依赖卷积瓶颈结构等问题,提出一种具有可观压缩与加速能力的卷积核分层矩阵压缩方法(KCPStack)。首先,在矩阵乘法视角下,将卷积核按通道拆分为2阶克罗内克规范多项式(KCP)分解,所得因子张量组合为两层权重矩阵,使卷积计算转换为具有较高推理效率的双层轻量卷积结构;其次,对比所提KCPStack方法与其他典型张量分解卷积核压缩方法的参数约减空间复杂度与推理计算时间复杂度;最后,基于RK3588神经处理单元进行KCPStack方法的部署,面向实际场景目标检测识别需求开发相关应用。实验结果表明:与现有张量分解方法相比,在张量秩相同或者参数量相当的前提下,所提KCPStack方法具有最快的推理计算效率;在图像分类标准数据集CIFAR-10和ImageNet上,KCPStack方法能够将精度损失控制在1%左右,最高可减少85.0%的参数量和79.8%的计算量;在目标检测识别标准数据集COCO上,KCPStack方法相对于基线模型的平均精度下降不超过1%;采用所提KCPStack方法对实际场景进行目标检测识别,在RK3588神经处理单元上能达到95.4%的平均精度和35帧/s的图像处理帧率,内存开销仅为33.1 MB。 展开更多
关键词 克罗内克规范多项式张量分解 卷积核压缩 推理效率 分层矩阵 目标检测识别
下载PDF
基于多源差异对抗的高速列车小幅蛇行识别
6
作者 刘鑫 宁静 +3 位作者 王子轩 洪梓轩 张兵 陈春俊 《铁道科学与工程学报》 EI CAS CSCD 北大核心 2024年第9期3469-3480,共12页
高速列车的蛇行运动会增加车辆各部分的载荷,剧烈的蛇行运动会使得轮轨间产生较大冲击,产生脱轨的风险,严重威胁到行车安全,因此需要对车辆的蛇行状态进行识别,特别是对蛇行失稳状态开始之前的小幅蛇行状态的识别。目前大多数的研究主... 高速列车的蛇行运动会增加车辆各部分的载荷,剧烈的蛇行运动会使得轮轨间产生较大冲击,产生脱轨的风险,严重威胁到行车安全,因此需要对车辆的蛇行状态进行识别,特别是对蛇行失稳状态开始之前的小幅蛇行状态的识别。目前大多数的研究主要集中在利用单工况数据进行的深度学习以及单源迁移学习,然而高速列车在运行时面临复杂多变的工况。考虑到不同工况下的多源域数据具有不同的分布,仅使用单个工况数据建立的列车蛇行识别模型很难满足各种工况下的识别精度要求。提出一种基于多源双层差异对抗的高速列车小幅蛇行状态识别方法。该方法在训练过程中使用多个工况下具有不同分布的真实蛇行运动数据,并采用双层差异对抗训练策略。初层差异对抗中结合矩匹配模块和领域对抗模块,使得模型既能减小源域与目标域的分布差异,也能减小源域与源域的分布差异。在初层差异对抗的基础上,采用次层差异对抗训练方法,使得模型能够进一步对齐数据的边缘分布和条件分布,从而更好地学习可区分的特征,提高诊断任务的准确性。通过公共轴承数据验证该模型可行性后,用于高速列车蛇行状态识别研究中。实验结果表明,该方法能够正确识别出蛇行运动的不同状态,几种不同识别任务准确率均在99%以上,其诊断效果明显优于单源模型以及其他多源模型,证明了该方法的可靠性。说明该方法在高速列车蛇行状态智能监控中具有一定的工程应用价值。 展开更多
关键词 高速列车 小幅蛇行 多源域迁移学习 双层差异对抗 故障识别
下载PDF
基于时延嵌入式隐马尔科夫模型的癫痫脑电分类算法
7
作者 李沛洋 赵贯一 +4 位作者 刘宇轩 张伊诺 李存波 汪露 田银 《重庆邮电大学学报(自然科学版)》 CSCD 北大核心 2024年第4期675-686,共12页
癫痫脑电的分类识别能够为癫痫的预警和病程的发展监测提供强有力的技术支持。传统的癫痫脑电分类识别方法需要从较长的时间序列中提取特征,难以刻画大脑的瞬态变化,检测低效且耗时,降低了癫痫预警的有效性。针对上述问题,提出一种基于... 癫痫脑电的分类识别能够为癫痫的预警和病程的发展监测提供强有力的技术支持。传统的癫痫脑电分类识别方法需要从较长的时间序列中提取特征,难以刻画大脑的瞬态变化,检测低效且耗时,降低了癫痫预警的有效性。针对上述问题,提出一种基于隐马尔科夫模型的癫痫脑电分类算法。该方法通过时延嵌入式隐马尔科夫模型(time-delay embedded hidden Markov model,TDE-HMM)对脑电进行状态估计,并提取状态序列中的状态切换特征,通过多层感知机(multiple layer perceptron,MLP)实现对不同癫痫发作阶段脑电的有效辨识。实验结果表明,相较于小波变换、微分熵等传统特征,所提方法准确率高,能够有效刻画癫痫不同阶段的大脑状态变化,为癫痫脑电的分类识别和状态分析提供了新的备选方案。 展开更多
关键词 癫痫检测 脑电信号(EEG) 时延嵌入式隐马尔科夫模型(TDE-HMM) 多层感知机(MLP)
下载PDF
融合双层注意力网络的端到端老挝车牌照识别方法
8
作者 黄彬煌 毛存礼 +3 位作者 陈蕊 余正涛 黄于欣 王振晗 《云南大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第5期862-870,共9页
在中老道路互通大背景下,老挝车牌照识别研究对中国跨境车辆管理十分重要,但现有的单行车牌照识别方法无法直接应用于老挝双行车牌照识别任务中.针对老挝车牌照上行省份字符排列紧密、难以分割和下行辅音字符相似度高、难以识别的问题,... 在中老道路互通大背景下,老挝车牌照识别研究对中国跨境车辆管理十分重要,但现有的单行车牌照识别方法无法直接应用于老挝双行车牌照识别任务中.针对老挝车牌照上行省份字符排列紧密、难以分割和下行辅音字符相似度高、难以识别的问题,结合分割的思想提出一种融合双层注意力网络的端到端老挝车牌照识别方法.通过通道及空间注意力提取并加强上行省份特征和下行字符特征表示;将分类思想应用于省份信息获取,有效地处理因字符粘连而无法做单字符识别的问题;使用序列标注的方法缓解相似字符识别困难,提高字符识别准确率.实验结果表明,提出方法相比基线模型,准确率提升了0.8个百分点,达到92.7%. 展开更多
关键词 深度学习 老挝双行车牌照识别 双层注意力网络 通道及空间注意力 端到端
下载PDF
基于长短期记忆网络的CO_(2)气层识别方法
9
作者 何丽娜 吴文圣 +3 位作者 王显南 张伟 张传举 宋孝雨 《测井技术》 CAS 2024年第1期1-7,共7页
CO_(2)监测是油气开采中的关键环节,传统的CO_(2)监测方法面临很多挑战,在人工智能逐渐兴起的当下,深度学习技术被广泛应用于地球物理测井。珠江口盆地恩平凹陷深层CO_(2)气藏发育,传统测井方法无法准确评价储层流体。构建了基于长短期... CO_(2)监测是油气开采中的关键环节,传统的CO_(2)监测方法面临很多挑战,在人工智能逐渐兴起的当下,深度学习技术被广泛应用于地球物理测井。珠江口盆地恩平凹陷深层CO_(2)气藏发育,传统测井方法无法准确评价储层流体。构建了基于长短期记忆网络(LSTM)的CO_(2)气层识别模型,采用m×2正则化交叉验证优选CO_(2)敏感测井参数,并对模型进行训练。利用该模型对珠江口盆地恩平凹陷L2井CO_(2)气层进行识别,并与支持向量机和K近邻算法识别结果进行对比。结果表明,3种深度学习算法对CO_(2)气层的识别效果良好,其中LSTM算法对CO_(2)气层的识别效果最好,准确度达93.4%,为深层CO_(2)气层识别工作提供了新思路。 展开更多
关键词 CO_(2)气层识别 长短期记忆网络(LSTM) 深度学习 珠江口盆地
下载PDF
基于YOLOv5-RF的糙米内部裂纹识别方法研究
10
作者 张续博 张家瑜 +3 位作者 贲宗友 王逸凡 曾雨可 陈坤杰 《南京农业大学学报》 CAS CSCD 北大核心 2024年第4期792-802,共11页
[目的]为准确识别糙米内部裂纹,提出了一种基于改进YOLOv5l的糙米裂纹识别算法——YOLOv5-RF。[方法]使用深度卷积代替CBS(convolution+batch normalization+sigmoid linear unit)模块中的普通卷积构建出DWBS(depthwise convolution+bat... [目的]为准确识别糙米内部裂纹,提出了一种基于改进YOLOv5l的糙米裂纹识别算法——YOLOv5-RF。[方法]使用深度卷积代替CBS(convolution+batch normalization+sigmoid linear unit)模块中的普通卷积构建出DWBS(depthwise convolution+batch normalization+sigmoid linear unit)模块,然后将DWBS模块堆叠成辅助骨干网络,再与原始的Darknet-53主干网络相结合形成基于DWBS模块的同级复合骨干网络,以提高糙米内部裂纹特征提取能力;在颈部网络使用逆向连接层来增强解码端特征的丰富性,用于提高解码端对糙米内部裂纹的识别能力;利用CBAM(convolutional block attention module)注意力模块调整SPPF(spatial pyramid pooling-fast)模块的通道注意力表达,通过构建一种SPPF模块与CBAM模块结合的网络结构来提高编码阶段的语义信息表达质量。[结果]所提出的YOLOv5-RF算法的平均准确率、召回率和准确率分别为94.01%、86.92%、90.85%,相比YOLOv5l算法分别提升了4.72%、6.23%、1.23%,但添加模块对模型检测速度的影响却很小。[结论]所提方法能够准确进行糙米内部裂纹的识别,可为稻谷爆腰率检测提供技术参考。 展开更多
关键词 糙米裂纹 目标识别 特征信号增强 逆向连接层
下载PDF
基于多层动态融合的中文医疗命名实体识别
11
作者 林令德 刘纳 +2 位作者 徐贞顺 李昂 李晨 《计算机工程与应用》 CSCD 北大核心 2024年第15期161-169,共9页
针对基于预训练模型的命名实体识别方法仅使用了预训练模型最后一层隐状态,忽略了各Transformer层对应不同文本信息的问题,提出一种预训练模型多层动态融合方法。采用预训练模型进行特征提取,获得模型各层隐状态序列;通过多层动态融合... 针对基于预训练模型的命名实体识别方法仅使用了预训练模型最后一层隐状态,忽略了各Transformer层对应不同文本信息的问题,提出一种预训练模型多层动态融合方法。采用预训练模型进行特征提取,获得模型各层隐状态序列;通过多层动态融合方法对各层隐状态信息进行结合,作为预训练模型最终输出;采用条件随机场对序列进行解码,完成序列标注。多层动态融合方法可以充分利用预训练模型各层知识,使结果中包含丰富的句法、语义等特征信息,提升模型在任务中的表示能力,增强模型灵活性。通过对医疗文本数据集CMeEE、CCKS2017与通用领域数据集Resume、Weibo进行实验验证,结果证明,加入多层动态融合方法可以有效地提升命名实体识别效果。 展开更多
关键词 医疗文本挖掘 命名实体识别 预训练语言模型 多层动态融合
下载PDF
基于改进卷积的多尺度表情识别 被引量:1
12
作者 郑浩 赵光哲 《计算机工程与应用》 CSCD 北大核心 2024年第2期231-243,共13页
在表情识别任务中由于人脸特征的多样性和不确定性,导致在特征提取阶段容易出现特征缺失以及特征提取率低下等问题,与此同时,在具有特征复用结构的网络训练过程中还会堆积大量冗余特征,从而影响特征质量。针对以上问题,提出了一种基于... 在表情识别任务中由于人脸特征的多样性和不确定性,导致在特征提取阶段容易出现特征缺失以及特征提取率低下等问题,与此同时,在具有特征复用结构的网络训练过程中还会堆积大量冗余特征,从而影响特征质量。针对以上问题,提出了一种基于特征筛选结合改进卷积的残差多尺度特征融合注意力机制模型(residual multiscale feature fusion attentional network,RMFANet)。参考蓝图可分离卷积以及空洞卷积的思想,设计并引入了改进后的卷积形式,从而更有效地将卷积进行分离,提升特征提取效能;在改进后卷积模式的基础上设计并引入了多尺度并行特征提取通路,丰富了特征信息;设计并引入了特征筛选模块,以减少模型训练过程中产生的冗余特征,同时筛选出优质特征,提升特征质量;设计并引入了浅层输入特征处理层,以简化网络结构,降低计算复杂度;引入通道注意力机制,以突出局部关键特征信息;最后引入SMU激活函数,从而提升模型的非线性能力。通过实验结果可以看出,该模型可以在保证较低参数量以及计算成本的前提条件下在Fer2013数据集以及CK+数据集上分别取得70.298%和96.566%的识别准确率,相比较传统算法而言具有更好的鲁棒性。 展开更多
关键词 多尺度表情识别 改进卷积 特征筛选 浅层特征处理 通道注意力机制 SMU激活函数
下载PDF
面向武器装备领域的复杂三元组抽取方法
13
作者 游新冬 刘陌村 +2 位作者 葛昊杰 肖刚 吕学强 《小型微型计算机系统》 CSCD 北大核心 2024年第3期521-528,共8页
为解决武器装备领域中单实体重叠和实体对重叠的复杂三元组的抽取问题,提出了挂载武器装备领域知识结合多轮对抗攻击的复杂三元组抽取方法(RDA),该方法通过武器装备领域微调后的Bert获取更具领域语义的文本向量;利用在嵌入层发起多轮对... 为解决武器装备领域中单实体重叠和实体对重叠的复杂三元组的抽取问题,提出了挂载武器装备领域知识结合多轮对抗攻击的复杂三元组抽取方法(RDA),该方法通过武器装备领域微调后的Bert获取更具领域语义的文本向量;利用在嵌入层发起多轮对抗的方式,实现模型层面的数据增强,减少模型对标注样本规模的依赖;采用单层指针网络获取头实体对头实体的类别进行判定,利用维基百科知识库对武器装备领域的实体类别解释信息的向量,对武器装备类别信息以字为最小粒度进行融合,缓解分层标注的天然缺陷;最后在横纵两个维度基于不同粒度的序列标注实现复杂三元组的抽取.在武器装备领域的数据集上精准率达到88.54%,召回率达到75.88%,F1值达到81.72%,取得了SOTA效果.实验表明提出的RDA方法对武器装备领域的信息利用更加充分,有效地缓解武器装备领域遇到的单实体重叠问题(SEO)和实体对重叠(EPO)问题. 展开更多
关键词 三元组抽取 武器装备领域 复杂命名实体识别 单层指针网络 多轮对抗攻击 RDA
下载PDF
多层卷积网络目标识别算法在烟丝宽度检测中的应用研究
14
作者 刘鑫 谢真成 +2 位作者 关文锦 陈然 邝素琴 《机械设计与制造工程》 2024年第6期127-132,共6页
为了提高烟丝宽度检测效率,提出一种多层卷积网络目标识别算法。该算法以YOLOv3为基础结构,通过添加特征层、注意力机制、空间金字塔结构、改进聚类函数和损失函数的方式,实现了对传统识别算法的改进优化。基于多层卷积网络目标识别算... 为了提高烟丝宽度检测效率,提出一种多层卷积网络目标识别算法。该算法以YOLOv3为基础结构,通过添加特征层、注意力机制、空间金字塔结构、改进聚类函数和损失函数的方式,实现了对传统识别算法的改进优化。基于多层卷积网络目标识别算法构建烟丝宽度检测模型,通过获取图像中目标烟丝宽度,完成对烟丝宽度的精准检测。烟丝的主客观识别效果与宽度检测结果表明:该算法能够较好地保留烟丝轮廓细节,具有较强的识别能力和较高的检测精度,交并比、精准度、AUC分别达到了0.966、0.969、0.963,且检测最大误差为-0.073 mm,相对误差较低。实验结果证实该算法对烟丝宽度检测具有较高的实用价值,大大提高了检测精度。 展开更多
关键词 烟丝宽度检测 YOLOv3 多层卷积网络 目标识别 翻转宽度算法
下载PDF
全局跨层交互网络学习细粒度图像特征表示
15
作者 张高义 徐杨 +1 位作者 曹斌 石进 《计算机与现代化》 2024年第3期97-104,共8页
细粒度图像分类中的关键任务是提取极具鉴别性的特征。在以往的模型中,往往采用双线性池化技术及其变种来解决这个问题。然而,大多数双线性池化及其变体会忽略层内或层间特征交互,这种不充分的交互易导致鉴别信息丢失或使鉴别信息包含... 细粒度图像分类中的关键任务是提取极具鉴别性的特征。在以往的模型中,往往采用双线性池化技术及其变种来解决这个问题。然而,大多数双线性池化及其变体会忽略层内或层间特征交互,这种不充分的交互易导致鉴别信息丢失或使鉴别信息包含过多冗余信息。针对上述问题,设计一种新的学习细粒度图像特征及特征表示的方法——全局跨层交互(GCI)网络。提出的分层双三次池化方法具有平衡提取鉴别信息和过滤冗余信息能力,并能同时建模层内和层间的特征交互。进一步分析层间交互计算结构,发现易于将交互计算结构与现有的通道注意力机制结合形成交互注意力机制,以提升骨干网络的关键特征提取能力。最后,将交互注意力机制构成的特征提取网络与双三次池化方法融合得到GCI,用来提取鲁棒的细粒度图像特征表示。在3个细粒度基准数据集上进行实验,实验结果表明分层双三次池化实现了分层交互池化框架中最优效果,即在CUB-200-2011、Stanford-Cars、FGVC-Aircraft上分别达到了87.4%、93.2%和92.1%的分类精度,将交互注意力机制融入后分类精度进一步提升至88.5%、95.1%和93.9%。 展开更多
关键词 细粒度图像识别 全局跨层交互网络 分层双三次池化 层内层间特征交互 交互注意力机制
下载PDF
Resnet18模型在玻璃表面脏污识别中的应用
16
作者 苏国兴 常光超 任传成 《福建电脑》 2024年第9期17-21,共5页
为解决高层建筑窗户的玻璃表面赃污识别检测的困难,本文提出一种基于Resnet18的玻璃表面脏污识别方法。该方法以玻璃表面脏污层为研究对象,将迁移学习和计算机视觉算法相结合,实现对玻璃表面赃污的识别和检测。测试的结果表明,Resnet18... 为解决高层建筑窗户的玻璃表面赃污识别检测的困难,本文提出一种基于Resnet18的玻璃表面脏污识别方法。该方法以玻璃表面脏污层为研究对象,将迁移学习和计算机视觉算法相结合,实现对玻璃表面赃污的识别和检测。测试的结果表明,Resnet18在自建玻璃表面脏污数据集上的识别准确率达到了99.10%,可以有效地对玻璃表面脏污进行识别,对实际应用具有一定的借鉴意义。 展开更多
关键词 玻璃脏污层 图像识别 残差网络模型 迁移学习
下载PDF
基于XLNET模型的开阳磷矿成矿条件相关地质实体识别与应用
17
作者 彭彬 田宜平 +2 位作者 曾斌 吴雪超 吴文明 《地质科技通报》 CAS CSCD 北大核心 2024年第4期224-234,共11页
随着磷矿找矿难度越来越大,地质勘探成果报告也愈来愈多,通过人工识别海量文档中与磷矿成矿相关地质信息耗时低效,无法满足知识共享传播和地质报告智能管理的需求。为快速获得磷矿地质文档报告中隐藏的成矿地质知识,基于XLNET模型建立... 随着磷矿找矿难度越来越大,地质勘探成果报告也愈来愈多,通过人工识别海量文档中与磷矿成矿相关地质信息耗时低效,无法满足知识共享传播和地质报告智能管理的需求。为快速获得磷矿地质文档报告中隐藏的成矿地质知识,基于XLNET模型建立了磷矿成矿地质实体自动识别的方法。首先对实体进行BIO标注建立地质实体字典,利用XLNET作为底层预处理模型学习句子双向语义;然后使用BILSTM-Attention-CRF模型实现文本多标签的智能分类;最后通过定位磷矿实体在报告中的分布位置大致推测该处磷矿成矿条件和成矿模式。将该模型与其余3种模型比较得出结果,该模型识别的准确率(P)、召回率(R)及F1值都接近了90%,较前3种模型分别调高了2%,5%,6%。该研究为开阳磷矿地质研究人员提供了更加高效的地质实体自动识别的方法。 展开更多
关键词 地质实体识别 XLNET-BILSTM-Attention-CRF 磷矿成矿模式 预训练模型 序列标注
下载PDF
浓盐酸表面薄层分子识别优先分离铑
18
作者 杨之焯 周海涛 +3 位作者 吴雪琴 肖列发 王佳琦 黄焜 《中国有色金属学报》 EI CAS CSCD 北大核心 2024年第9期3114-3124,共11页
Rh(Ⅲ)氯络阴离子的动力学惰性和易水化特性使其难以在传统溶剂萃取过程中优先于其他共存铂族金属离子分离。本文提出一种采用分子识别剂苯并-15-冠醚-5(B15C5)选择性优先分离浓盐酸中Rh(Ⅲ)氯络阴离子的薄层油膜萃取新方法。考察了水... Rh(Ⅲ)氯络阴离子的动力学惰性和易水化特性使其难以在传统溶剂萃取过程中优先于其他共存铂族金属离子分离。本文提出一种采用分子识别剂苯并-15-冠醚-5(B15C5)选择性优先分离浓盐酸中Rh(Ⅲ)氯络阴离子的薄层油膜萃取新方法。考察了水相流速和油膜厚度对Rh(Ⅲ)、Pd(Ⅱ)、Pt(Ⅳ)萃取率及其彼此间分离系数的影响。结果表明:与传统分散油滴搅拌萃取法相比,在浓盐酸表面执行薄层油膜萃取可实现Rh(Ⅲ)>Pd(Ⅱ)>Pt(Ⅳ)的选择性识别分离顺序。由于Rh(Ⅲ)氯络阴离子的水化能力强于Pd(Ⅱ)和Pt(Ⅳ)氯络阴离子,在进入Rh(Ⅲ)氯络阴离子内界配位的水分子以及Rh(Ⅲ)氯络阴离子周围水化壳层的共同作用下,Rh(Ⅲ)氯络阴离子与B15C5分子间通过水分子为“桥”的氢键相互作用更强。同时,由于浓盐酸表面自由H_(3)O^(+)浓度较低,油膜层下方水相流速的增加有利于促进界面处Rh(Ⅲ)氯络阴离子水化,油膜层厚度的减小则有助于界面更新,从而强化了Rh(Ⅲ)与Pd(Ⅱ)、Pt(Ⅳ)的分离。 展开更多
关键词 浓盐酸 表面 薄层油膜 分离 分子识别
下载PDF
门控变关系图卷积网络的涉烟案件当事人预警
19
作者 冯鹏程 张高豪 谢刚 《大数据》 2024年第5期45-55,共11页
为了落实“精准监管”方针,烟草公司需要提高涉烟案件命中率。过往的方法缺少了对涉烟案件高危当事人的研究,阻碍了案件命中率的提高。基于烟草公司存有的大量历史数据,挖掘出准确的预警名单是提高案件命中率的有效途径。进行高危当事... 为了落实“精准监管”方针,烟草公司需要提高涉烟案件命中率。过往的方法缺少了对涉烟案件高危当事人的研究,阻碍了案件命中率的提高。基于烟草公司存有的大量历史数据,挖掘出准确的预警名单是提高案件命中率的有效途径。进行高危当事人特征分析后,提出门控变关系图卷积网络,以得到准确的高危当事人预警名单。首先,门控变关系图卷积网络使用变关系图卷积网络,捕捉当事人的关系与关键特征。然后,门控层进一步提取特征。最后,把特征输入Softmax层得到分类结果,进而得到预警名单。通过对比实验,证明构建的模型效果更佳。某市专卖局应用本项目的系列成果后,其案件命中率从约0.01%提升到了约0.5%,这证明构建的预警模型能满足真实监管的需求。 展开更多
关键词 烟草行业 涉烟案件 高危当事人识别 门控层 图卷积网络
下载PDF
基于深度学习的人脸局部遮挡表情动态识别算法
20
作者 陈曦 蔡现龙 《吉林大学学报(信息科学版)》 CAS 2024年第3期503-508,共6页
针对因人脸局部遮挡,导致表情动态特征较难提取和识别问题,提出一种基于深度学习的人脸局部遮挡表情动态识别算法。建立深度信念网络模型,将前一层输出值作为后一层输入值,设计特征堆叠单元,计算可见层中神经元的状态变量分布情况,根据... 针对因人脸局部遮挡,导致表情动态特征较难提取和识别问题,提出一种基于深度学习的人脸局部遮挡表情动态识别算法。建立深度信念网络模型,将前一层输出值作为后一层输入值,设计特征堆叠单元,计算可见层中神经元的状态变量分布情况,根据面部五官间动态关联性,将可见层的状态值作为隐藏层的输入值求得隐藏神经元状态变量。将识别过程分为训练和正向传播2个步骤,输出特征变化规律,在正向传播过程中查找符合规律变化的像素点,求解该像素点权重,同时作为损失函数标准,比对面部多个位置的识别权重,约束识别率,完成人脸局部遮挡表情动态识别。实验数据证明,该方法能降低图像失真和细节丢失,提高图像分辨率,识别率高,针对不同局部遮挡情况均能完成高效识别。 展开更多
关键词 深度学习 表情动态识别 动态关联性 深度信念网络模型 隐藏层
下载PDF
上一页 1 2 19 下一页 到第
使用帮助 返回顶部