期刊文献+
共找到188篇文章
< 1 2 10 >
每页显示 20 50 100
Action Recognition in Surveillance Videos with Combined Deep Network Models
1
作者 ZHANG Diankai ZHAO Rui-Wei +3 位作者 SHEN Lin CHEN Shaoxiang SUN Zhenfeng JIANG Yu-Gang 《ZTE Communications》 2016年第B12期54-60,共7页
Action recognition is an important topic in computer vision. Recently, deep learning technologies have been successfully used in lots of applications including video data for sloving recognition problems. However, mos... Action recognition is an important topic in computer vision. Recently, deep learning technologies have been successfully used in lots of applications including video data for sloving recognition problems. However, most existing deep learning based recognition frameworks are not optimized for action in the surveillance videos. In this paper, we propose a novel method to deal with the recognition of different types of actions in outdoor surveillance videos. The proposed method first introduces motion compensation to improve the detection of human target. Then, it uses three different types of deep models with single and sequenced images as inputs for the recognition of different types of actions. Finally, predictions from different models are fused with a linear model. Experimental results show that the proposed method works well on the real surveillance videos. 展开更多
关键词 action recognition deep network models model fusion surveillance video
下载PDF
基于Wide&Deep-XGB2LSTM模型的超短期光伏功率预测 被引量:10
2
作者 栗然 丁星 +3 位作者 孙帆 韩怡 刘会兰 严敬汝 《电力自动化设备》 EI CSCD 北大核心 2021年第7期31-37,共7页
为了充分利用电网自身的海量历史数据进行光伏功率预测,提出一种宽度&深度(Wide&Deep)框架下融合极限梯度提升(XGBoost)算法和长短时记忆网络(LSTM)的Wide&Deep-XGB2LSTM超短期光伏功率预测模型。对历史数据进行特征提取,... 为了充分利用电网自身的海量历史数据进行光伏功率预测,提出一种宽度&深度(Wide&Deep)框架下融合极限梯度提升(XGBoost)算法和长短时记忆网络(LSTM)的Wide&Deep-XGB2LSTM超短期光伏功率预测模型。对历史数据进行特征提取,获得时间、辐照度、温度等原始特征,在此基础上进行特征重构,通过交叉组合和挖掘统计特征构造辐照度×辐照度、均值、标准差等组合特征,并通过Filter法和Embedded法进行特征选择。在TensorFlow框架下通过算例对比验证了所提模型及特征工程工作对光伏功率预测性能的提升效果。 展开更多
关键词 光伏功率预测 宽度&深度模型 极限梯度提升 长短时记忆网络 特征工程 模型融合
下载PDF
基于堆栈自编码器和DeepAR的航空发动机剩余寿命预测 被引量:8
3
作者 李浩 王卓健 +2 位作者 李哲 陈煊 李园 《推进技术》 EI CAS CSCD 北大核心 2022年第11期67-75,共9页
针对现有航空发动机剩余寿命预测大多基于单点预测模式,不能准确给出预测结果置信区间的问题,提出了一种基于堆栈自编码器结合DeepAR模型的概率分布预测模型。首先,堆栈自编码器通过无监督式深度学习对发动机监测数据进行特征提取,构建... 针对现有航空发动机剩余寿命预测大多基于单点预测模式,不能准确给出预测结果置信区间的问题,提出了一种基于堆栈自编码器结合DeepAR模型的概率分布预测模型。首先,堆栈自编码器通过无监督式深度学习对发动机监测数据进行特征提取,构建反映性能退化的健康指标(HI),基于双向长短期记忆(BiLSTM)网络构建DeepAR预测模型,将提取后的HI序列输入到DeepAR模型中,预测模型对HI序列与使用时间的隐含关系进行全局学习,并输出发动机剩余寿命的概率分布参数。利用CMPASS涡扇发动机退化数据集进行实验,验证所提方法的有效性。结果表明,本文所提预测方法同其他方法相比,对监测数据融合的效果更好,预测模型性能提高6.4%,实际剩余寿命基本在95%置信区间内。 展开更多
关键词 航空发动机 寿命预测 预测模型 深度学习 数据融合
下载PDF
基于DeepFM和XGBoost融合模型的静脉血栓预测 被引量:1
4
作者 李莉 谢超 吴迪 《计算机系统应用》 2022年第9期376-381,共6页
外周穿刺置入中心静脉导管(PICC)技术被广泛运用于中长期静脉治疗.在PICC置管时会导致各种并发症和不良反应,如PICC相关性血栓.随着机器学习和深度神经网络的不断发展与完善,为PICC相关性血栓的辅助诊断提供了基于临床医学数据的解决方... 外周穿刺置入中心静脉导管(PICC)技术被广泛运用于中长期静脉治疗.在PICC置管时会导致各种并发症和不良反应,如PICC相关性血栓.随着机器学习和深度神经网络的不断发展与完善,为PICC相关性血栓的辅助诊断提供了基于临床医学数据的解决方法.本文构建了基于DeepFM和XGBoost的融合模型,针对稀疏数据进行特征融合并能降低过拟合的情况,能够对PICC相关性血栓提供风险预测.实验结果表明,融合模型能够有效地对PICC相关性血栓进行特征重要性提取并预测患病概率,辅助临床在外周穿刺置过程中识别血栓高危风险因素,及时进行干预从而预防血栓的发生. 展开更多
关键词 机器学习 血栓预测 deepFM XGBoost 模型融合 预测模型 深度学习
下载PDF
基于Informer融合模型的油田开发指标预测方法
5
作者 张强 薛陈斌 +1 位作者 彭骨 卢青 《吉林大学学报(信息科学版)》 CAS 2024年第5期799-807,共9页
为解决油田开发指标的预测问题,提出了一种基于物质平衡方程和Informer的融合模型。首先,通过物质平衡方程领域知识建立油田开发产量递减前后的机理模型;其次,将所建机理模型作为约束与Informer模型损失函数进行融合建立符合油田开发物... 为解决油田开发指标的预测问题,提出了一种基于物质平衡方程和Informer的融合模型。首先,通过物质平衡方程领域知识建立油田开发产量递减前后的机理模型;其次,将所建机理模型作为约束与Informer模型损失函数进行融合建立符合油田开发物理规律的指标预测模型;最后,采用油田实际生产数据进行实验分析,结果表明相比于纯数据驱动的几种循环结构预测模型,本融合模型在相同数据条件下的预测效果更优。该模型的机理约束部分能引导模型的训练过程,使其收敛速度更快,且波峰波谷处的预测更准确。该融合模型具有更好的预测能力和泛化能力和比较合理的物理可解释性。 展开更多
关键词 Informer模型 机理模型 深度融合模型 预测
下载PDF
基于视觉注意力的图文跨模态情感分析 被引量:1
6
作者 王法玉 郝攀征 《计算机工程与设计》 北大核心 2024年第2期601-607,共7页
针对单模态情感分析无法完全捕获情感信息的问题,提出一种图像和文本跨模态情感分析模型(BERT-VistaNet),该模型没有直接使用视觉信息作为特征,而是利用视觉信息作为对齐方式,使用注意力机制指出文本中重要的句子,得到基于视觉注意力的... 针对单模态情感分析无法完全捕获情感信息的问题,提出一种图像和文本跨模态情感分析模型(BERT-VistaNet),该模型没有直接使用视觉信息作为特征,而是利用视觉信息作为对齐方式,使用注意力机制指出文本中重要的句子,得到基于视觉注意力的文档表示。对于视觉注意力无法完全覆盖的文本内容,使用BERT模型对文本进行情感分析,得到基于文本的文档表示,将特征进行融合应用于情感分类任务。在Yelp公开餐厅数据集上,该模型相比基线模型TFN-aVGG,准确率提高了43%,相比VistaNet模型准确率提高了1.4%。 展开更多
关键词 情感分析 视觉注意力机制 跨模态 深度学习 特征融合 预训练模型 双向门控单元
下载PDF
基于异构数据特征的城市轨道交通OD客流短时预测方法
7
作者 陈喜群 沈楼涛 +1 位作者 李俊懿 李传家 《交通信息与安全》 CSCD 北大核心 2024年第2期158-165,共8页
城市轨道交通起讫点(origin-destination,OD)客流短时预测在智能交通系统中意义重大,它为交通管控策略实施以及出行者出行选择提供了重要的决策依据。卷积神经网络被广泛用于交通数据空间相关性提取,但其平移不变性与局部敏感性导致该... 城市轨道交通起讫点(origin-destination,OD)客流短时预测在智能交通系统中意义重大,它为交通管控策略实施以及出行者出行选择提供了重要的决策依据。卷积神经网络被广泛用于交通数据空间相关性提取,但其平移不变性与局部敏感性导致该方法更重视局部特征而忽视全局特征。本研究构建了基于注意力机制的异构数据特征提取机模型(heterogeneous data feature extraction machine,HDFEM)以实现OD矩阵空间相关性的全局感知。该模型从时空特征和用地属性特征出发,构造异构数据OD时空张量与地理信息张量,依托模型张量编码层对异构数据张量进行分割与编码,通过注意力机制连接各张量块特征,提取OD矩阵中各个部分间的空间相关性。该方法不仅实现了异构数据与OD客流数据的融合,还兼顾了卷积神经网络模型未能处理的OD矩阵远距离特征,进而帮助模型更全面地学习OD客流的空间特征。对于OD时序特性,该模型使用了长短时记忆网络来处理。在杭州地铁自动售检票系统(auto fare collection,AFC)数据集上的实验结果表明:HDFEM模型相对于基于卷积神经网络的预测模型,其均方误差、平均绝对误差与标准均方根误差分别下降了4.1%,2.5%,2%,验证了全局OD特征感知对于城市轨道交通OD客流预测的重要性。 展开更多
关键词 智能交通 OD客流预测 异构数据融合模型 深度学习 注意力机制 城市轨道交通
下载PDF
基于残差密集融合对抗生成网络的PET-MRI图像融合
8
作者 刘尚旺 杨荔涵 《河南师范大学学报(自然科学版)》 CAS 北大核心 2024年第1期74-83,I0005,共11页
为了增强核磁共振与正电子发射断层扫描图像融合的纹理细节,摆脱人工设计融合规则对先验知识的依赖.提出了自适应的残差密集生成对抗网络(adaptive dense residual generative adversarial network,ADRGAN)来融合两种模态的医学图像.ADR... 为了增强核磁共振与正电子发射断层扫描图像融合的纹理细节,摆脱人工设计融合规则对先验知识的依赖.提出了自适应的残差密集生成对抗网络(adaptive dense residual generative adversarial network,ADRGAN)来融合两种模态的医学图像.ADRGAN设计了区域残差学习模块与输出级联生成器,在加深网络结构的同时避免特征丢失;然后,设计了基于自适应模块的内容损失函数,强化输出融合图像的内容信息;最后,通过源图像的联合梯度图与融合图像的梯度图构建对抗性博弈来高效训练生成器与鉴别器.实验结果表明,ADRGAN在哈佛医学院MRI/PET数据集的测试中峰值信噪比和结构相似度分别达到55.2124和0.4697,均优于目前最先进的算法;所构建的模型具有端对端和无监督两特性,无需人工干预,也不需要真实数据作为标签. 展开更多
关键词 深度学习 对抗生成网络 多模态图像融合 密集残差网络
下载PDF
一种基于YOLOX优化的轻量级路面病害检测方法 被引量:1
9
作者 者甜甜 赵新旭 +2 位作者 顾宙瑜 张博熠 刘庆华 《江苏科技大学学报(自然科学版)》 CAS 2024年第3期55-62,共8页
受限于小型嵌入式设备以及移动设备等有限的计算资源,大型网络模型难以部署在此类应用场景中.为了解决该问题,基于YOLOX提出一种高效的路面病害识别模型.首先,将YOLOX主干网络替换为优化后的GhostNet来减少网络计算参数,并参考基于卷积... 受限于小型嵌入式设备以及移动设备等有限的计算资源,大型网络模型难以部署在此类应用场景中.为了解决该问题,基于YOLOX提出一种高效的路面病害识别模型.首先,将YOLOX主干网络替换为优化后的GhostNet来减少网络计算参数,并参考基于卷积块注意力机制兼顾空间和通道方向上自适应调整信息的优势,构建DAM(Dimensional Attention Model)代替GhostBottleneck模块中的SE模块,从而充分利用有限的网络容量进行强化特征学习;其次,提出DFM(Deep Fusion Model)模块来改进PANet并以此对高低特征层进行深度融合,获取更加丰富的特征信息来提高检测能力;再次,采用Complete-IoU Loss来拟合更加准确的检测框位置,减少方向误判的同时提高了检测效率;最后,引入Image-Multitasking数据增强方法来强化目标图像任务性,提高了网络的泛化能力和鲁棒性.在RDD2020数据集上进行模型对比,实验表明,改进后的GhostNet-YOLOX网络的mAP达到84.05%,高于现有的YOLOX-s(即66.26%),模型参数量缩小至14.53 MB,小于YOLOX-s(即34.21 MB),同时实际检测视频的帧数达到了26 p·s^(-1),提高了5.88 p·s^(-1),检测实时性显著提高. 展开更多
关键词 路面病害检测 YOLOX GhostNet 注意力机制 深度融合模型 深度可分离卷积
下载PDF
多输入Stacking模型融合滚动轴承故障诊断
10
作者 白健 郝润芳 +3 位作者 程永强 闫文恒 徐博仁 郭立旺 《组合机床与自动化加工技术》 北大核心 2024年第5期131-135,140,共6页
针对现有单输入模型抗噪声能力不强、泛化能力不足的问题,提出了一种基于多输入Stacking模型融合的滚动轴承故障诊断方法。该方法对滚动轴承的原始振动信号进行预处理,分别对原始信号进行经验模态分解、变分模态分解和多分辨率分析,将3... 针对现有单输入模型抗噪声能力不强、泛化能力不足的问题,提出了一种基于多输入Stacking模型融合的滚动轴承故障诊断方法。该方法对滚动轴承的原始振动信号进行预处理,分别对原始信号进行经验模态分解、变分模态分解和多分辨率分析,将3种预处理后的信号输入到改进的卷积神经网络和改进的双输入卷积神经网络中进行训练及测试;各模型通过Stacking方法进行融合,以实现滚动轴承各种类型故障的诊断。结果表明,多输入Stacking模型融合方法的诊断性能优于传统的深度学习模型,在信噪比为5 dB的条件下达到了98.9%的诊断准确率。该模型的故障诊断性能稳定,具有很好的鲁棒性和泛化能力。 展开更多
关键词 故障诊断 模型融合 深度学习 滚动轴承
下载PDF
基于高低频特征分解的深度多模态医学图像融合网络 被引量:2
11
作者 王欣雨 刘慧 +2 位作者 朱积成 盛玉瑞 张彩明 《图学学报》 CSCD 北大核心 2024年第1期65-77,共13页
多模态医学图像融合旨在利用跨模态图像的相关性和信息互补性,以增强医学图像在临床应用中的可读性和适用性。然而,现有手工设计的模型无法有效地提取关键目标特征,从而导致融合图像模糊、纹理细节丢失等问题。为此,提出了一种新的基于... 多模态医学图像融合旨在利用跨模态图像的相关性和信息互补性,以增强医学图像在临床应用中的可读性和适用性。然而,现有手工设计的模型无法有效地提取关键目标特征,从而导致融合图像模糊、纹理细节丢失等问题。为此,提出了一种新的基于高低频特征分解的深度多模态医学图像融合网络,将通道注意力和空间注意力机制引入融合过程,在保持全局结构的基础上保留了局部纹理细节信息,实现了更加细致的融合。首先,通过预训练模型VGG-19提取两种模态图像的高频特征,并通过下采样提取其低频特征,形成高低频中间特征图。其次,在特征融合模块嵌入残差注意力网络,依次从通道和空间维度推断注意力图,并将其用来指导输入特征图的自适应特征优化过程。最后,重构模块形成高质量特征表示并输出融合图像。实验结果表明,该算法在Harvard公开数据集和自建腹部数据集峰值信噪比提升8.29%,结构相似性提升85.07%,相关系数提升65.67%,特征互信息提升46.76%,视觉保真度提升80.89%。 展开更多
关键词 多模态医学图像融合 预训练模型 深度学习 高低频特征提取 残差注意力网络
下载PDF
基于多级注意力机制融合的电能质量扰动点分类及时间定位方法研究 被引量:2
12
作者 刘宇龙 崔宪阳 +1 位作者 袁丁 金涛 《中国电机工程学报》 EI CSCD 北大核心 2024年第11期4298-4310,I0010,共14页
随着新能源渗透率的不断提高,电网所受电能质量扰动(power quality disturbances,PQD)变得更加复杂,传统方法难以准确识别扰动类型并定位扰动时间。因此,该文提出一种基于多级注意力机制融合的PQD点分类及时间定位方法。该方法以卷积神... 随着新能源渗透率的不断提高,电网所受电能质量扰动(power quality disturbances,PQD)变得更加复杂,传统方法难以准确识别扰动类型并定位扰动时间。因此,该文提出一种基于多级注意力机制融合的PQD点分类及时间定位方法。该方法以卷积神经网络为基础建立分类模型,在预处理和模型内部分别嵌入局部特征注意力机制(local feature attention mechanism,LFAM)和双尺度注意力机制(dual-scale attention mechanism,DSAM)。其中,LFAM根据幅值包络线追踪信号的幅值变化,以加权方式增强信号波形的局部特征;DSAM则从通道和神经元两个尺度协助模型学习各维度特征的重要性。最后,模型以多类别-多输出的形式对每个采样点进行分类,并完成扰动时间定位。为了验证所提方法的有效性,该文建立含63种PQD类型的仿真数据库对模型进行测试。在30 dB白噪声环境下,该模型平均分类准确率为99.10%,时间定位误差均为毫秒级,具有更强的泛化性能和鲁棒性。同时,基于交流电源搭建硬件平台来测试模型,其平均准确率为99.03%,进一步验证了所提方法的可靠性。 展开更多
关键词 电能质量扰动 点分类 时间定位 深度学习 注意力机制 融合模型
下载PDF
融合部首特征和BERT的汽车生产设备故障领域命名实体识别 被引量:1
13
作者 倪骥 王宇嘉 赵博 《小型微型计算机系统》 CSCD 北大核心 2024年第6期1370-1375,共6页
针对汽车生产设备故障领域命名实体识别过程中存在内在语义信息缺失,传统字向量抽取特征单一的问题,提出一种融合部首特征和BERT的汽车生产设备故障领域命名实体识别模型.首先创建汽车生产设备故障领域拆字字典,实现部首特征提取,融合B... 针对汽车生产设备故障领域命名实体识别过程中存在内在语义信息缺失,传统字向量抽取特征单一的问题,提出一种融合部首特征和BERT的汽车生产设备故障领域命名实体识别模型.首先创建汽车生产设备故障领域拆字字典,实现部首特征提取,融合BERT预训练模型生成的动态字向量从而得到联合字向量;然后将联合字向量输入到双向长短期记忆(bidirectional long-short term memory,BiLSTM)进行双向编码,获得长序列语义特征;最后通过条件随机场(conditional random field,CRF)进行序列解码,学习标签之间的依赖关系,得到全局最优序列.将该方法在真实汽车生产设备故障领域数据集上进行实验,得到的精确率、召回率、F1值分别为88.4%、90.2%、89.3%. 展开更多
关键词 命名实体识别 特征融合 预训练模型 部首特征 深度学习
下载PDF
多维特征学习与模型融合的地理命名实体识别
14
作者 马浩然 王金华 《测绘通报》 CSCD 北大核心 2024年第9期129-134,共6页
地理命名实体识别是地理信息抽取的核心任务,而地理信息抽取支撑着地理信息系统的构建。但目前的地理命名实体识别研究面临两大核心挑战:一是地理领域文本的标注数据稀缺,导致传统依赖大量标注数据的通用模型难以全面捕捉并识别地理文... 地理命名实体识别是地理信息抽取的核心任务,而地理信息抽取支撑着地理信息系统的构建。但目前的地理命名实体识别研究面临两大核心挑战:一是地理领域文本的标注数据稀缺,导致传统依赖大量标注数据的通用模型难以全面捕捉并识别地理文本中所有潜在的命名实体;二是地理数据的标签密度较为稀疏,模型在区分不同地理命名实体时往往无法区分其边界,进而无法精准定位。针对上述问题,本文提出了一种面向地理领域文本特征的命名实体识别算法AM_NER。首先,利用Albert进行词向量训练,该模型是面向小样本的轻量级预训练模型,能够更为全面地学习地理领域的语义信息;然后,设计了名为M_NER的神经元结构,该神经元基于模型融合思想,利用多个模型从不同维度对语义特征进行学习,进而准确识别出命名实体的边界。相较于此前的研究,AM_NER在地理领域数据集中的各项指标提升了2.05%~2.67%。 展开更多
关键词 地理命名实体识别 深度学习 特征学习 模型融合
下载PDF
基于多尺度特征融合重建学习的深度伪造人脸检测算法
15
作者 许楷文 周翊超 +2 位作者 谷文权 陈晨 胡晰远 《信息网络安全》 CSCD 北大核心 2024年第8期1173-1183,共11页
随着深度伪造技术的快速发展,针对深度伪造人脸的检测已经成为计算机视觉领域的研究热点。虽然现有的基于噪声、局部纹理或频率特征的检测方法能够在特定场景中表现出良好的检测效果,但这些方法缺乏对人脸细粒度表征特征的深入挖掘,限... 随着深度伪造技术的快速发展,针对深度伪造人脸的检测已经成为计算机视觉领域的研究热点。虽然现有的基于噪声、局部纹理或频率特征的检测方法能够在特定场景中表现出良好的检测效果,但这些方法缺乏对人脸细粒度表征特征的深入挖掘,限制了其泛化能力。为了解决上述问题,文章提出了一种新型的基于多尺度特征融合重建的分类网络模型MSFFR,该网络模型从重建学习的角度学习挖掘人脸细粒度内容和梯度表征特征信息,并采用多尺度特征融合的方式实现伪造人脸的检测,通过融合这两种信息来识别伪造面孔。文章提出的模型包含3个创新模块,设计了双分支特征提取模块,用于揭示真实人脸与伪造人脸之间的分布差异;提出了细粒度内容和梯度特征融合模块,用于探索挖掘人脸细粒度内容特征与梯度特征之间的相关性;引入了基于重建视差的双向注意力模块,有效地指导模型对融合后的特征进行分类。在大规模基准数据集上进行的广泛实验表明,与现有技术相比,文章提出的方法在检测性能方面具有显著提高,尤其是在泛化能力方面表现出色。 展开更多
关键词 深伪检测 多尺度特征融合 重建学习 深度生成模型
下载PDF
采用混合融合方式的改进MV3D目标检测模型研究
16
作者 沙俊良 曹景胜 +2 位作者 董翼宁 袁增千 李刚 《现代电子技术》 北大核心 2024年第19期175-180,共6页
针对3D目标检测精度低、在复杂工况下检测效果差的问题,利用图像和点云数据作为输入,引入深度补全增加点云前视图特征,并对MV3D目标检测模型进行改进,提出混合融合方式,将全局信息较多的图片特征拼接到融合完成后的点云特征中,最后再进... 针对3D目标检测精度低、在复杂工况下检测效果差的问题,利用图像和点云数据作为输入,引入深度补全增加点云前视图特征,并对MV3D目标检测模型进行改进,提出混合融合方式,将全局信息较多的图片特征拼接到融合完成后的点云特征中,最后再进行融合。文中所提出的混合融合方案兼顾了深度融合的特征又增加了全局的特征信息,利用DETR模块对原模型的非极大值抑制操作进行优化,使得模型轻量化。最后在KITTI数据集上对文中模型进行了实验分析,结果表明,所提出的模型可以实现复杂工况下的3D目标检测,且在精度上与原模型相比,在三种不同检测难度的工况下平均提升了7.19%。 展开更多
关键词 3D目标检测 MV3D 模型改进 深度补全 混合融合 DETR
下载PDF
多视图专家组区域建议预测的视觉跟踪 被引量:1
17
作者 单彬 丁昕苗 +1 位作者 王铭淏 郭文 《计算机工程与设计》 北大核心 2024年第2期459-466,共8页
为解决大多数最新的目标跟踪器都面临着判别特征表示缺乏多样性、目标定位过于模糊以及正样本的数量要求问题,提出一种基于多视图的顶层特征的区域建议网络的跟踪预测学习算法。融合多种视图的特征表示方式,利用丰富多样的语义信息,有... 为解决大多数最新的目标跟踪器都面临着判别特征表示缺乏多样性、目标定位过于模糊以及正样本的数量要求问题,提出一种基于多视图的顶层特征的区域建议网络的跟踪预测学习算法。融合多种视图的特征表示方式,利用丰富多样的语义信息,有效解决判别特征过于单一的问题。在扩展的边界框上构建多个支持向量机模型并加入区域建议网络模块,精确优化边界框,预测最优的目标位置,缓解目标定位过于模糊和正样本的数量有限的问题。通过大量视频基准序列对方法的综合评价,其结果表明,提出方法融合了轻量化的深度学习模型和多视图专家组的优点,使跟踪性能有了显著提升。 展开更多
关键词 区域建议预测 特征判别机制 多专家组模型 多视图模型 特征融合 视觉跟踪 深度学习
下载PDF
基于扩散模型的印花图案生成方法设计
18
作者 张佳伟 李华军 +1 位作者 王秀丽 朱威 《计算机测量与控制》 2024年第10期243-249,共7页
印花图案的设计是服装生产领域非常关键的一环,但目前人工设计的印花图案存在内容相似化、设计效率低下的问题,因此设计并实现了一种基于扩散模型的印花图案生成方法;采用深度学习技术提取、扩充现有印花图案数据集,并从颜色和类别维度... 印花图案的设计是服装生产领域非常关键的一环,但目前人工设计的印花图案存在内容相似化、设计效率低下的问题,因此设计并实现了一种基于扩散模型的印花图案生成方法;采用深度学习技术提取、扩充现有印花图案数据集,并从颜色和类别维度生成印花图案的文本描述,完成印花图案数据集制作;使用已制作的数据集微调扩散模型,并对图像特征空间进行平铺处理,使得生成的印花图案在边界过渡处满足纺织行业四方连续的要求。对局部扩散特性进行了分析,结合文本引导,实现细节可变的图文生图效果;实验结果表明,所设计的印花图案生成方法具备生成高质量印花图案的能力,并且其特征空间平铺方法使得印花图案边界过渡处较为自然。 展开更多
关键词 印花图案 深度学习 多模态融合 扩散模型 图像生成
下载PDF
基于RoBERTa-BiGRU-CRF的交通事故处置流程文本信息抽取
19
作者 陈娇娜 张静 +1 位作者 靳引利 王鹏 《交通运输研究》 2024年第3期20-28,共9页
为改善现有交通事故应急信息识别中处置流程抽取不足的问题,以提高应急处置知识抽取的准确率,针对交通事故文本信息自然语言描述的复杂性,提出了一种基于预训练模型和混合深度学习网络的交通事故处置流程抽取方法。首先,从事故属性、处... 为改善现有交通事故应急信息识别中处置流程抽取不足的问题,以提高应急处置知识抽取的准确率,针对交通事故文本信息自然语言描述的复杂性,提出了一种基于预训练模型和混合深度学习网络的交通事故处置流程抽取方法。首先,从事故属性、处置机构、处置措施、处置效果和任务预判5个方面定义交通事故处置流程实体,并采用BIO标注实体类型。然后,将RoBERTa预训练模型生成的词向量作为输入,采用BiGRU模型进行特征提取,通过CRF模型进行条件约束来获得最终实体类型,并对RoBERTa-BiGRU-CRF组合模型的交通事故处置流程抽取结果进行时序融合,利用图数据库对抽取结果进行知识存储和可视化展示。最后,以陕西省高速公路交通事故文本信息为样本数据集,分别比较了不同预训练模型和深度学习网络的模型性能,利用消融实验论证了RoBERTa-BiGRU-CRF模型的有效性,并通过某起交通事故进行了实例验证。结果显示,RoBERTa-BiGRU-CRF组合模型的抽取效果最佳,F1值为99.77%。研究表明,所提方法能有效从文本信息中抽取交通事故应急处置流程关键要素,实现了应急处置流程抽取结果的可视化呈现,可为应急处置决策提供参考。 展开更多
关键词 交通安全 交通事故 实体抽取 预训练模型 深度学习 时序融合
下载PDF
基于MSHAM-UNet的岩心孔洞图像分割方法
20
作者 汪南洋 沈疆海 《科学技术与工程》 北大核心 2024年第24期10362-10369,共8页
岩心图像的孔洞分割对于石油勘探有着重要意义。当前基于深度学习的孔洞分割方法存在着孔洞边缘分割不连续、分割精度低和参数量大等问题,为解决上述问题,提出一种基于UNet网络的改进模型MSHAM-UNet。首先,针对UNet模型对不同尺度特征... 岩心图像的孔洞分割对于石油勘探有着重要意义。当前基于深度学习的孔洞分割方法存在着孔洞边缘分割不连续、分割精度低和参数量大等问题,为解决上述问题,提出一种基于UNet网络的改进模型MSHAM-UNet。首先,针对UNet模型对不同尺度特征图的跳级连接带来的语义信息丢失问题,设计一种结合HAM(hybrid attention module)的多尺度融合注意力模块(multi-scale hybrid fusion attention module, MSHAM),该模块对带有空间信息的浅层特征图和含有语义信息的深层特征图进行注意力特征融合,增强网络聚合不同尺度信息的能力。其次,使用GP-bneck模块替换部分普通卷积,在降低模型参数量和加深网络的同时,增强网络特征提取能力。实验结果表明,MSHAM-UNet网络在岩心孔洞数据集上的F1分数(F1-score)、交并比(intersection over union, IoU)和平均交并比(mean intersection over union, MIoU)分别达到了87.35%、77.27%和90.21%,相较于原始模型提高了5.29%%、4.02%和4.84%,对比主流的语义分割模型也有较高提升,为岩心孔隙研究提供了新的思路。 展开更多
关键词 岩心孔洞图像 深度学习 UNet模型 注意力机制 特征融合
下载PDF
上一页 1 2 10 下一页 到第
使用帮助 返回顶部