期刊文献+
共找到467篇文章
< 1 2 24 >
每页显示 20 50 100
融合MacBERT和Talking⁃Heads Attention实体关系联合抽取模型
1
作者 王春亮 姚洁仪 李昭 《现代电子技术》 北大核心 2024年第5期127-131,共5页
针对现有的医学文本关系抽取任务模型在训练过程中存在语义理解能力不足,可能导致关系抽取的效果不尽人意的问题,文中提出一种融合MacBERT和Talking⁃Heads Attention的实体关系联合抽取模型。该模型首先利用MacBERT语言模型来获取动态... 针对现有的医学文本关系抽取任务模型在训练过程中存在语义理解能力不足,可能导致关系抽取的效果不尽人意的问题,文中提出一种融合MacBERT和Talking⁃Heads Attention的实体关系联合抽取模型。该模型首先利用MacBERT语言模型来获取动态字向量表达,MacBERT作为改进的BERT模型,能够减少预训练和微调阶段之间的差异,从而提高模型的泛化能力;然后,将这些动态字向量表达输入到双向门控循环单元(BiGRU)中,以便提取文本的上下文特征。BiGRU是一种改进的循环神经网络(RNN),具有更好的长期依赖捕获能力。在获取文本上下文特征之后,使用Talking⁃Heads Attention来获取全局特征。Talking⁃Heads Attention是一种自注意力机制,可以捕获文本中不同位置之间的关系,从而提高关系抽取的准确性。实验结果表明,与实体关系联合抽取模型GRTE相比,该模型F1值提升1%,precision值提升0.4%,recall值提升1.5%。 展开更多
关键词 MacBERT BiGRU 关系抽取 医学文本 talking⁃heads attention 深度学习 全局特征 神经网络
下载PDF
Multi-Head Attention Spatial-Temporal Graph Neural Networks for Traffic Forecasting
2
作者 Xiuwei Hu Enlong Yu Xiaoyu Zhao 《Journal of Computer and Communications》 2024年第3期52-67,共16页
Accurate traffic prediction is crucial for an intelligent traffic system (ITS). However, the excessive non-linearity and complexity of the spatial-temporal correlation in traffic flow severely limit the prediction acc... Accurate traffic prediction is crucial for an intelligent traffic system (ITS). However, the excessive non-linearity and complexity of the spatial-temporal correlation in traffic flow severely limit the prediction accuracy of most existing models, which simply stack temporal and spatial modules and fail to capture spatial-temporal features effectively. To improve the prediction accuracy, a multi-head attention spatial-temporal graph neural network (MSTNet) is proposed in this paper. First, the traffic data is decomposed into unique time spans that conform to positive rules, and valuable traffic node attributes are mined through an adaptive graph structure. Second, time and spatial features are captured using a multi-head attention spatial-temporal module. Finally, a multi-step prediction module is used to achieve future traffic condition prediction. Numerical experiments were conducted on an open-source dataset, and the results demonstrate that MSTNet performs well in spatial-temporal feature extraction and achieves more positive forecasting results than the baseline methods. 展开更多
关键词 Traffic Prediction Intelligent Traffic System Multi-head attention Graph Neural Networks
下载PDF
RepBoTNet-CESA:An Alzheimer’s Disease Computer Aided Diagnosis Method Using Structural Reparameterization BoTNet and Cubic Embedding Self Attention
3
作者 Xiabin Zhang Zhongyi Hu +1 位作者 LeiXiao Hui Huang 《Computers, Materials & Continua》 SCIE EI 2024年第5期2879-2905,共27页
Various deep learning models have been proposed for the accurate assisted diagnosis of early-stage Alzheimer’s disease(AD).Most studies predominantly employ Convolutional Neural Networks(CNNs),which focus solely on l... Various deep learning models have been proposed for the accurate assisted diagnosis of early-stage Alzheimer’s disease(AD).Most studies predominantly employ Convolutional Neural Networks(CNNs),which focus solely on local features,thus encountering difficulties in handling global features.In contrast to natural images,Structural Magnetic Resonance Imaging(sMRI)images exhibit a higher number of channel dimensions.However,during the Position Embedding stage ofMulti Head Self Attention(MHSA),the coded information related to the channel dimension is disregarded.To tackle these issues,we propose theRepBoTNet-CESA network,an advanced AD-aided diagnostic model that is capable of learning local and global features simultaneously.It combines the advantages of CNN networks in capturing local information and Transformer networks in integrating global information,reducing computational costs while achieving excellent classification performance.Moreover,it uses the Cubic Embedding Self Attention(CESA)proposed in this paper to incorporate the channel code information,enhancing the classification performance within the Transformer structure.Finally,the RepBoTNet-CESA performs well in various AD-aided diagnosis tasks,with an accuracy of 96.58%,precision of 97.26%,and recall of 96.23%in the AD/NC task;an accuracy of 92.75%,precision of 92.84%,and recall of 93.18%in the EMCI/NC task;and an accuracy of 80.97%,precision of 83.86%,and recall of 80.91%in the AD/EMCI/LMCI/NC task.This demonstrates that RepBoTNet-CESA delivers outstanding outcomes in various AD-aided diagnostic tasks.Furthermore,our study has shown that MHSA exhibits superior performance compared to conventional attention mechanisms in enhancing ResNet performance.Besides,the Deeper RepBoTNet-CESA network fails to make further progress in AD-aided diagnostic tasks. 展开更多
关键词 Alzheimer CNN structural reparameterization multi head self attention computer aided diagnosis
下载PDF
基于Viseme的连续语音识别系统及Talking Head 被引量:2
4
作者 蒋冬梅 谢磊 +3 位作者 Ilse Ravyse 赵荣椿 Hichem Sahli Jan Cornelis 《电子与信息学报》 EI CSCD 北大核心 2004年第3期375-381,共7页
为实现听觉/视觉驱动的说话人头部动画,该文给出了一个基于viseme(说话时的基本嘴形单位)的连续语音识别系统。它训练viseme隐马尔可夫模型(HMM),识别语音为viseme图像序列。建模采用triseme的概念来考虑viseme的上下文相关性,但它需要... 为实现听觉/视觉驱动的说话人头部动画,该文给出了一个基于viseme(说话时的基本嘴形单位)的连续语音识别系统。它训练viseme隐马尔可夫模型(HMM),识别语音为viseme图像序列。建模采用triseme的概念来考虑viseme的上下文相关性,但它需要超大量的训练数据。该文根据viseme图像及其相似度权值(VSW)定义视觉问题集,用来建立triseme决策树,以实现triseme的状态捆绑及HMM参数共享。为比较系统性能,基于phoneme(听觉领域的语音基本单位)的语音识别结果也被映射为viseme序列。在评价准则上,定义viseme图像相似度加权识别精度,更全面地考虑输出和参考图像序列的差别,并用嘴形圆度和VSW曲线中的突变点来评估所得viseme序列的平滑性。结果表明,基于viseme的语音识别系统能给出更平滑和合理的嘴形图像序列。 展开更多
关键词 说话人头部动画 Viseme 连续语音识别 Triseme决策树 图像相似度加权 嘴形圆度
下载PDF
基于Multi-head Attention和Bi-LSTM的实体关系分类 被引量:11
5
作者 刘峰 高赛 +1 位作者 于碧辉 郭放达 《计算机系统应用》 2019年第6期118-124,共7页
关系分类是自然语言处理领域的一项重要任务,能够为知识图谱的构建、问答系统和信息检索等提供技术支持.与传统关系分类方法相比较,基于神经网络和注意力机制的关系分类模型在各种关系分类任务中都获得了更出色的表现.以往的模型大多采... 关系分类是自然语言处理领域的一项重要任务,能够为知识图谱的构建、问答系统和信息检索等提供技术支持.与传统关系分类方法相比较,基于神经网络和注意力机制的关系分类模型在各种关系分类任务中都获得了更出色的表现.以往的模型大多采用单层注意力机制,特征表达相对单一.因此本文在已有研究基础上,引入多头注意力机制(Multi-head attention),旨在让模型从不同表示空间上获取关于句子更多层面的信息,提高模型的特征表达能力.同时在现有的词向量和位置向量作为网络输入的基础上,进一步引入依存句法特征和相对核心谓词依赖特征,其中依存句法特征包括当前词的依存关系值和所依赖的父节点位置,从而使模型进一步获取更多的文本句法信息.在SemEval-2010 任务8 数据集上的实验结果证明,该方法相较之前的深度学习模型,性能有进一步提高. 展开更多
关键词 关系分类 Bi-LSTM 句法特征 self-attention multi-head attention
下载PDF
YOLO-MFD:Remote Sensing Image Object Detection with Multi-Scale Fusion Dynamic Head
6
作者 Zhongyuan Zhang Wenqiu Zhu 《Computers, Materials & Continua》 SCIE EI 2024年第5期2547-2563,共17页
Remote sensing imagery,due to its high altitude,presents inherent challenges characterized by multiple scales,limited target areas,and intricate backgrounds.These inherent traits often lead to increased miss and false... Remote sensing imagery,due to its high altitude,presents inherent challenges characterized by multiple scales,limited target areas,and intricate backgrounds.These inherent traits often lead to increased miss and false detection rates when applying object recognition algorithms tailored for remote sensing imagery.Additionally,these complexities contribute to inaccuracies in target localization and hinder precise target categorization.This paper addresses these challenges by proposing a solution:The YOLO-MFD model(YOLO-MFD:Remote Sensing Image Object Detection withMulti-scale Fusion Dynamic Head).Before presenting our method,we delve into the prevalent issues faced in remote sensing imagery analysis.Specifically,we emphasize the struggles of existing object recognition algorithms in comprehensively capturing critical image features amidst varying scales and complex backgrounds.To resolve these issues,we introduce a novel approach.First,we propose the implementation of a lightweight multi-scale module called CEF.This module significantly improves the model’s ability to comprehensively capture important image features by merging multi-scale feature information.It effectively addresses the issues of missed detection and mistaken alarms that are common in remote sensing imagery.Second,an additional layer of small target detection heads is added,and a residual link is established with the higher-level feature extraction module in the backbone section.This allows the model to incorporate shallower information,significantly improving the accuracy of target localization in remotely sensed images.Finally,a dynamic head attentionmechanism is introduced.This allows themodel to exhibit greater flexibility and accuracy in recognizing shapes and targets of different sizes.Consequently,the precision of object detection is significantly improved.The trial results show that the YOLO-MFD model shows improvements of 6.3%,3.5%,and 2.5%over the original YOLOv8 model in Precision,map@0.5 and map@0.5:0.95,separately.These results illustrate the clear advantages of the method. 展开更多
关键词 Object detection YOLOv8 MULTI-SCALE attention mechanism dynamic detection head
下载PDF
混合CTC/attention架构端到端带口音普通话识别 被引量:10
7
作者 杨威 胡燕 《计算机应用研究》 CSCD 北大核心 2021年第3期755-759,共5页
针对普通话语音识别任务中的多口音识别问题,提出了链接时序主义(connectionist temporal classification,CTC)和多头注意力(multi-head attention)的混合端到端模型,同时采用多目标训练和联合解码的方法。实验分析发现随着混合架构中... 针对普通话语音识别任务中的多口音识别问题,提出了链接时序主义(connectionist temporal classification,CTC)和多头注意力(multi-head attention)的混合端到端模型,同时采用多目标训练和联合解码的方法。实验分析发现随着混合架构中链接时序主义权重的降低和编码器层数的加深,混合模型在带口音的数据集上表现出了更好的学习能力,同时训练一个深度达到48层的编码器—解码器架构的网络,生成模型的表现超过之前所有端到端模型,在数据堂开源的200 h带口音数据集上达到了5.6%字错率和26.2%句错率。实验证明了提出的端到端模型超过一般端到端模型的识别率,在解决带口音的普通话识别上有一定的先进性。 展开更多
关键词 口音 混合CTC/attention的端到端模型 多头注意力 链接时序主义 语音识别
下载PDF
HMM-Based Photo-Realistic Talking Face Synthesis Using Facial Expression Parameter Mapping with Deep Neural Networks
8
作者 Kazuki Sato Takashi Nose Akinori Ito 《Journal of Computer and Communications》 2017年第10期50-65,共16页
This paper proposes a technique for synthesizing a pixel-based photo-realistic talking face animation using two-step synthesis with HMMs and DNNs. We introduce facial expression parameters as an intermediate represent... This paper proposes a technique for synthesizing a pixel-based photo-realistic talking face animation using two-step synthesis with HMMs and DNNs. We introduce facial expression parameters as an intermediate representation that has a good correspondence with both of the input contexts and the output pixel data of face images. The sequences of the facial expression parameters are modeled using context-dependent HMMs with static and dynamic features. The mapping from the expression parameters to the target pixel images are trained using DNNs. We examine the required amount of the training data for HMMs and DNNs and compare the performance of the proposed technique with the conventional PCA-based technique through objective and subjective evaluation experiments. 展开更多
关键词 Visual-Speech SYNTHESIS talking head Hidden MARKOV Models (HMMs) Deep Neural Networks (DNNs) FACIAL Expression Parameter
下载PDF
DTHN: Dual-Transformer Head End-to-End Person Search Network
9
作者 Cheng Feng Dezhi Han Chongqing Chen 《Computers, Materials & Continua》 SCIE EI 2023年第10期245-261,共17页
Person search mainly consists of two submissions,namely Person Detection and Person Re-identification(reID).Existing approaches are primarily based on Faster R-CNN and Convolutional Neural Network(CNN)(e.g.,ResNet).Wh... Person search mainly consists of two submissions,namely Person Detection and Person Re-identification(reID).Existing approaches are primarily based on Faster R-CNN and Convolutional Neural Network(CNN)(e.g.,ResNet).While these structures may detect high-quality bounding boxes,they seem to degrade the performance of re-ID.To address this issue,this paper proposes a Dual-Transformer Head Network(DTHN)for end-to-end person search,which contains two independent Transformer heads,a box head for detecting the bounding box and extracting efficient bounding box feature,and a re-ID head for capturing high-quality re-ID features for the re-ID task.Specifically,after the image goes through the ResNet backbone network to extract features,the Region Proposal Network(RPN)proposes possible bounding boxes.The box head then extracts more efficient features within these bounding boxes for detection.Following this,the re-ID head computes the occluded attention of the features in these bounding boxes and distinguishes them from other persons or backgrounds.Extensive experiments on two widely used benchmark datasets,CUHK-SYSU and PRW,achieve state-of-the-art performance levels,94.9 mAP and 95.3 top-1 scores on the CUHK-SYSU dataset,and 51.6 mAP and 87.6 top-1 scores on the PRW dataset,which demonstrates the advantages of this paper’s approach.The efficiency comparison also shows our method is highly efficient in both time and space. 展开更多
关键词 TRANSFORMER occluded attention end-to-end person search person detection person re-ID Dual-Transformer head
下载PDF
基于改进Attention Mask编解码器CPI的研究
10
作者 李大舟 陈思思 +1 位作者 高巍 于锦涛 《计算机技术与发展》 2022年第2期214-220,共7页
化合物-蛋白质相互作用(CPI)的研究对药物发现有着重要作用,它可以为药物靶标选择提供有价值的信息,在一定程度上提高先导化合物的命中率,进而加快药物发现的进程。由此提出了一种基于改进Attention Mask编解码器的化合物与蛋白质相互... 化合物-蛋白质相互作用(CPI)的研究对药物发现有着重要作用,它可以为药物靶标选择提供有价值的信息,在一定程度上提高先导化合物的命中率,进而加快药物发现的进程。由此提出了一种基于改进Attention Mask编解码器的化合物与蛋白质相互作用分类的预测模型,分别使用RDkit和Item2vec处理化合物的SMILES字符串和蛋白质的氨基酸序列,将得到的化合物和蛋白质低维特征表示的向量输入到该模型,通过分配权重的方式来计算蛋白质中的哪个子序列对化合物分子更重要,使用带有Attention机制的神经网络计算权重,模拟化合物和蛋白质之间的相互作用关系,最后作为一个二分类问题输出化合物和蛋白质是否相互作用的预测概率。模型性能测评采用ROC曲线下面积、准确召回率曲线作为评价指标,实验结果表明,该模型相比于GraphDTA和GCN模型而言,拥有更好的性能表现,AUC值提高了0.04左右,PRC值提高了0.07左右。 展开更多
关键词 深度学习 多头自注意力 化合物蛋白相互作用 Item2vec 编码器-解码器
下载PDF
基于CED-YOLOv5s模型的煤矸识别方法研究
11
作者 何凯 程刚 +3 位作者 王希 葛庆楠 张辉 赵东洋 《工矿自动化》 CSCD 北大核心 2024年第2期49-56,82,共9页
由于煤矿井下高噪声、低照度、运动模糊的复杂工况和煤矸易聚集现象,导致煤矸目标检测模型特征提取困难及煤矸分类、定位不准确问题。针对该问题,提出一种基于CED-YOLOv5s模型的煤矸识别方法。首先,在YOLOv5s主干网络中引入坐标注意力(... 由于煤矿井下高噪声、低照度、运动模糊的复杂工况和煤矸易聚集现象,导致煤矸目标检测模型特征提取困难及煤矸分类、定位不准确问题。针对该问题,提出一种基于CED-YOLOv5s模型的煤矸识别方法。首先,在YOLOv5s主干网络中引入坐标注意力(CA)机制,通过将坐标信息嵌入信道关系和长程依赖关系中对特征图进行编码,充分利用通道注意力信息和空间注意力信息,使模型更加关注重要特征,抑制无用信息。其次,在YOLOv5s的检测头部引入EIoU回归损失函数,将目标框与锚框的宽高差异最小化,以增强目标的位置和边界信息,提高模型在密集目标下的定位精度和收敛速度;最后,在YOLOv5s的检测头部引入轻量化解耦头,解耦出单独的特征通道,分别用于分类任务和回归任务,解决了原模型中耦合头部分类任务与回归任务的相互干扰问题,进一步提升了模型的并行运算效率与检测精度。实验结果表明:CED-YOLOv5s模型与其他YOLO系列目标检测模型相比,综合性能最佳,平均检测精度达94.8%,相较于YOLOv5s模型提升了3.1%,检测速度达84.8帧/s,可充分满足煤矿井下煤矸实时检测需求。 展开更多
关键词 煤矸识别 YOLOv5s 坐标注意力 损失函数 轻量化解耦头 密集目标定位
下载PDF
修复缺陷嫌疑区域的无监督磁瓦表面缺陷检测
12
作者 唐善成 逯建辉 +2 位作者 张莹 金子成 赵安新 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2024年第4期718-728,共11页
磁瓦表面缺陷样本数量少,异常视觉特征分布发散,现有依赖目标特征的有监督检测方法不能有效检测未定义缺陷;磁瓦表面正常纹理呈非均匀且非周期性分布,使得经典重构网络难以准确地重构磁瓦表面正常特征,导致相关无监督检测方法性能低下.... 磁瓦表面缺陷样本数量少,异常视觉特征分布发散,现有依赖目标特征的有监督检测方法不能有效检测未定义缺陷;磁瓦表面正常纹理呈非均匀且非周期性分布,使得经典重构网络难以准确地重构磁瓦表面正常特征,导致相关无监督检测方法性能低下.为此,采用多头注意力增强的掩码图像修复网络(MIINet),长距离提取图像特征,捕捉全局信息,增强图像修复的能力;引入视觉显著性算法抑制磁瓦表面纹理信息和突显缺陷区域,以便二值化算法精准分割缺陷嫌疑区域;利用MIINet修复待检测图像缺陷嫌疑区域,选用修复前后图像的残差图像和结构相似性实现缺陷检测与缺陷判定.与经典无监督方法相比,修复缺陷嫌疑区域的表面缺陷检测方法的准确率提升了2.36%,F1值提升了1.62%. 展开更多
关键词 多头注意力 磁瓦表面缺陷检测 无监督学习 图像修复 视觉显著性
下载PDF
基于多头注意力机制字词联合的中文命名实体识别
13
作者 王进 王猛旗 +2 位作者 张昕跃 孙开伟 朴昌浩 《江苏大学学报(自然科学版)》 CAS 北大核心 2024年第1期77-84,共8页
针对现有基于字词联合的中文命名实体识别方法会引入冗余词汇干扰、模型网络结构复杂、难以迁移的问题,提出一种基于多头注意力机制字词联合的中文命名实体识别算法.算法采用多头注意力机制融合词汇边界信息,并通过分类融合BIE词集降低... 针对现有基于字词联合的中文命名实体识别方法会引入冗余词汇干扰、模型网络结构复杂、难以迁移的问题,提出一种基于多头注意力机制字词联合的中文命名实体识别算法.算法采用多头注意力机制融合词汇边界信息,并通过分类融合BIE词集降低冗余词汇干扰.建立了多头注意力字词联合模型,包含字词匹配、多头注意力、融合等模块.与现有中文命名实体识别方法相比,本算法避免了设计复杂的序列模型,方便与现有基于字的中文命名实体识别模型结合.采用召回率、精确率以及F 1值作为评价指标,通过消融试验验证模型各个部分的效果.结果表明,本算法在MSRA和Weibo数据集上F 1值分别提升0.28、0.69,在Resume数据集上精确率提升0.07. 展开更多
关键词 中文命名实体识别 词汇冗余 词汇边界信息 字词联合 多头注意力机制 BIE词集
下载PDF
基于增强多头注意力机制的Optuna-BiGRU测井岩性识别
14
作者 王婷婷 王振豪 +1 位作者 李方 赵万春 《地球科学与环境学报》 CAS 北大核心 2024年第1期127-142,共16页
测井岩性识别是油气勘探开发中至关重要的内容。针对现有算法模型在处理测井曲线数据时,无法有效捕获曲线内部深层关联和深度方向关系、拟合能力较弱、难以准确提取关键特征、噪声干扰以及模型超参数调优过程复杂困难等问题,提出了一种... 测井岩性识别是油气勘探开发中至关重要的内容。针对现有算法模型在处理测井曲线数据时,无法有效捕获曲线内部深层关联和深度方向关系、拟合能力较弱、难以准确提取关键特征、噪声干扰以及模型超参数调优过程复杂困难等问题,提出了一种通过Optuna超参数优化双向门循环单元(Optuna-BiGRU)结合增强多头注意力机制(EMHA)的测井岩性识别模型——Optuna-BiGRU-EMHA模型。该模型引入残差机制和层归一化以改进多头注意力机制模块,并结合双向门循环单元(BiGRU)解决了处理测井数据时的问题,同时使用Optuna超参数优化框架和小波包自适应阈值方法分别解决了超参数调优和噪声干扰问题。首先通过交会图分析和敏感性箱线图分析选取自然伽马、深感应电阻率、中子-密度孔隙度、平均中子-密度孔隙度和岩性密度5个特征参数的测井数据,通过小波包自适应阈值方法对数据进行去噪,并将测井数据分割成数据块,然后利用Optuna框架优化BiGRU-EMHA模型超参数,最后通过实验对比K-近邻算法(KNN)、随机森林(RF)、极端梯度提升算法(XGBoost)、长短期记忆(LSTM)神经网络、BiGRU、双向长短期记忆(BiLSTM)神经网络、BiGRU-MHA、Optuna-BiGRU-EMHA等8种模型在测井岩性识别中的精度。结果表明:Optuna-BiGRU-EMHA模型识别准确率达到80%,相对于传统机器学习模型和深度学习模型,综合岩性识别准确率分别提高15.94%~23.14%和3.93%~15.94%,该模型为常规测井岩性识别提供了坚实的理论支持。 展开更多
关键词 岩性识别 深度学习 BiGRU 增强多头注意力机制 小波包自适应阈值 超参数优化
下载PDF
基于MCB-FAH-YOLOv8的钢材表面缺陷检测算法
15
作者 崔克彬 焦静颐 《图学学报》 CSCD 北大核心 2024年第1期112-125,共14页
针对现有基于深度学习的钢材表面缺陷检测算法存在误检、漏检和检测精度低等问题,提出一种基于改进CBAM(modified CBAM,MCB)和可替换四头ASFF预测头(four-head ASFF prediction head,FAH)的YOLOv8钢材表面缺陷检测算法,简记为MCB-FAH-YO... 针对现有基于深度学习的钢材表面缺陷检测算法存在误检、漏检和检测精度低等问题,提出一种基于改进CBAM(modified CBAM,MCB)和可替换四头ASFF预测头(four-head ASFF prediction head,FAH)的YOLOv8钢材表面缺陷检测算法,简记为MCB-FAH-YOLOv8。通过加入改进后的卷积注意力机制模块(CBAM)对密集目标更好的确定;通过将FPN结构改为BiFPN更加高效的提取上下文信息;通过增加自适应特征融合(ASFF)自动找出最适合的融合特征;通过将SPPF模块替换为精度更高的SimCSPSPPF模块。同时,针对微小物体检测,提出了四头ASFF预测头,可根据数据集特点进行替换。实验结果表明,MCB-FAH-YOLOv8算法在VOC2007数据集上检测精度(mAP)达到了88.8%,在NEU-DET钢铁缺陷检测数据集上检测精度(mAP)达到了81.8%,较基准模型分别提高了5.1%和3.4%,该算法在牺牲较少检测速度的情况下取得较高的检测精度,很好的平衡了算法的精度和速度。 展开更多
关键词 MCB-FAH-YOLOv8 缺陷检测 注意力机制 四头ASFF预测头 特征融合
下载PDF
基于图神经网络的人工自然语言语义挖掘仿真
16
作者 周显春 喻佳 《计算机仿真》 2024年第1期344-348,共5页
语义挖掘工具可从批量非结构化人工自然语言文本数据中准确提取有用信息,但是由于网络环境文本具备半结构化、多尺度、海量、复杂关联等属性,导致文本数据通常维度较高,且仅有小部分节点存在明确标签,因此语义挖掘难度较大。提出基于图... 语义挖掘工具可从批量非结构化人工自然语言文本数据中准确提取有用信息,但是由于网络环境文本具备半结构化、多尺度、海量、复杂关联等属性,导致文本数据通常维度较高,且仅有小部分节点存在明确标签,因此语义挖掘难度较大。提出基于图神经网络的人工自然语言语义挖掘方法。结合多头注意力机制和半监督图卷积神经网络对人工自然语言文本降维处理。联合改进的模糊C均值聚类算法和免疫单亲遗传算法,构建人工自然语言语义挖掘算法。实验结果表明,研究方法的聚类纯度、准确率和召回率均高于95%,说明上述方法的应用性能较优。 展开更多
关键词 图神经网络 人工自然语言 语义挖掘 多头注意力机制
下载PDF
引入轻量级Transformer的无人机视觉跟踪
17
作者 谌海云 王海川 +1 位作者 黄忠义 余鸿皓 《计算机工程与应用》 CSCD 北大核心 2024年第2期244-253,共10页
随着无人机在军事和民用领域的广泛运用,对于高精度、低功耗智能无人机跟踪系统的需求日益增加。针对目标跟踪算法在无人机跟踪场景下很难平衡跟踪精度和跟踪速度的问题,提出一种引入轻量级Transformer的孪生网络无人机目标跟踪算法Sia... 随着无人机在军事和民用领域的广泛运用,对于高精度、低功耗智能无人机跟踪系统的需求日益增加。针对目标跟踪算法在无人机跟踪场景下很难平衡跟踪精度和跟踪速度的问题,提出一种引入轻量级Transformer的孪生网络无人机目标跟踪算法SiamLT。使用Transformer对AlexNet网络进行改进,在增加最小计算量的情况下捕获全局特征信息。在目标模板与搜索区域匹配方面,联合Transformer和深度互相关运算提出一种二元相关模块,同时捕获目标模板与搜索区域之间的局部相关性和全局依赖关系。在分类回归网络中引入距离交并比,并采用多监督策略训练网络,以获取更准确的目标位置。在UAV123和UAV20L跟踪基准上的实验结果表明,SiamLT算法优于主流的目标跟踪算法,更有效地平衡了跟踪精度和跟踪速度。 展开更多
关键词 无人机 目标跟踪 TRANSFORMER 孪生网络 多头注意力
下载PDF
基于Transformer模型的车辆轨迹预测
18
作者 田晟 胡啸 《广西师范大学学报(自然科学版)》 CAS 北大核心 2024年第3期47-58,共12页
准确预测车辆轨迹可以保障自动驾驶车辆行驶安全,针对已有方法对长序列轨迹建模预测能力有限的问题,本文提出一种基于Transformer网络的车辆轨迹预测模型。将车辆的运动数据与交互数据输入驾驶意图预测模块生成概率意图向量,通过Concate... 准确预测车辆轨迹可以保障自动驾驶车辆行驶安全,针对已有方法对长序列轨迹建模预测能力有限的问题,本文提出一种基于Transformer网络的车辆轨迹预测模型。将车辆的运动数据与交互数据输入驾驶意图预测模块生成概率意图向量,通过Concatenate函数与轨迹信息拼接后输入轨迹预测编码器,利用多头注意力机制充分提取轨迹特征,经解码器得到未来时刻的车辆轨迹分布。在车辆轨迹真实数据集NGSIM上进行验证,结果表明:在2 s预判时间下,驾驶意图预测模块准确率可达到85%以上;在4 s的预测时域下,轨迹预测模型相较于已有模型,其RMSE降低均达到10%以上。本文提出方法为自动驾驶车辆准确预测轨迹提供技术支持。 展开更多
关键词 自动驾驶 车辆轨迹预测 驾驶意图 特征提取 多头注意力机制
下载PDF
面向方面情感分析的多通道增强图卷积网络
19
作者 韩虎 范雅婷 徐学锋 《电子与信息学报》 EI CAS CSCD 北大核心 2024年第3期1022-1032,共11页
传统的基于单通道的特征提取方式,仅使用单一的依赖关系捕获特征,忽略单词间的语义相似性与依赖关系类型信息。尽管基于图卷积网络进行方面情感分析的方法已经取得一定成效,但始终难以同时聚合节点的语义信息和句法结构特征,在整个迭代... 传统的基于单通道的特征提取方式,仅使用单一的依赖关系捕获特征,忽略单词间的语义相似性与依赖关系类型信息。尽管基于图卷积网络进行方面情感分析的方法已经取得一定成效,但始终难以同时聚合节点的语义信息和句法结构特征,在整个迭代训练过程中最初的语义特征会逐渐遗失,影响句子最终的情感分类效果。由于缺乏先验知识会导致模型对相关情感词的误解,因此需要引入外部知识来丰富文本信息。目前,如何利用图神经网络(GNN)融合句法和语义特征的方式仍值得深入研究。针对上述问题,该文提出一种多通道增强图卷积网络模型。首先,通过对情感知识和依赖类型增强的句法图进行图卷积操作,得到基于语法的两种表示,与经过多头注意力和图卷积学习到的语义表示进行融合,使多通道的特征能够互补学习。实验结果表明,在5个公开数据集上,准确率和宏F1值优于基准模型。由此可见,依赖类型和情感知识均对增强句法图有重要影响,表明融合语义信息与句法结构的有效性。 展开更多
关键词 方面情感分析 图卷积网络 情感知识 依赖关系嵌入 多头注意力
下载PDF
基于YOLOv5水下目标检测算法研究与改进
20
作者 罗飞 王润峰 《通信与信息技术》 2024年第1期34-40,共7页
在水下目标生物的检测过程中,由于水下环境恶劣,水中光线衰弱,以及大多水下生物以小目标的形态出现等问题,使得目前的水下目标检测带来了精度损失问题,为解决相应问题,给出了一种基于YOLOv5s改进的YOLOv5s-water算法来解决。首先通过STR... 在水下目标生物的检测过程中,由于水下环境恶劣,水中光线衰弱,以及大多水下生物以小目标的形态出现等问题,使得目前的水下目标检测带来了精度损失问题,为解决相应问题,给出了一种基于YOLOv5s改进的YOLOv5s-water算法来解决。首先通过STR(Swin-Transformer)旋转窗口来对YOLOv5s的主干层(Backbone)部分进行更改,提高模型的泛化能力,进而解决水下环境恶劣以及检测目标形态变化带来的问题。使用FReLU激活函数与CBAM注意力神经机制结合成的FCM注意力机制,将其嵌入到YOLOv5s的骨干网(Neck)部分,以用来突出目标特征并抑制次要信息,从而提高算法精度,加强小目标的特征提取。小目标检测方面,在YOLOv5结构上增加小目标检测头,以提高感受野,进而提高小目标的检测精度。仿真和实验结果表明:所提方法相较于YOLOv5s检测准确率P上升1.47%,精确度mAP@0.5上升2.76%,小目标检测效果明显,证明了方法的有效性。 展开更多
关键词 小目标 光线衰弱 FReLU激活函数 CBAM注意力神经机制 Swin-Transformer 小目标检测头
下载PDF
上一页 1 2 24 下一页 到第
使用帮助 返回顶部