期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
5
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于增强视觉Transformer的哈希食品图像检索
1
作者
曹品丹
闵巍庆
+4 位作者
宋佳骏
盛国瑞
杨延村
王丽丽
蒋树强
《食品科学》
EI
CAS
CSCD
北大核心
2024年第10期1-8,共8页
作为食品计算的一个主要任务,食品图像检索近年来受到了广泛的关注。然而,食品图像检索面临着两个主要的挑战。首先,食品图像具有细粒度的特点,这意味着不同食品类别之间的视觉差异可能很小,这些差异只能在图像的局部区域中观察到。其次...
作为食品计算的一个主要任务,食品图像检索近年来受到了广泛的关注。然而,食品图像检索面临着两个主要的挑战。首先,食品图像具有细粒度的特点,这意味着不同食品类别之间的视觉差异可能很小,这些差异只能在图像的局部区域中观察到。其次,食品图像包含丰富的语义信息,如食材、烹饪方式等,这些信息的提取和利用对于提高检索性能至关重要。为解决这些问题,本实验基于预训练的视觉Transformer(Vision Transformer,ViT)模型提出了一种增强ViT的哈希网络(enhanced ViT hash network,EVHNet)。针对食品图像的细粒度特点,EVHNet中设计了一个基于卷积结构的局部特征增强模块,使网络能够学习到更具有代表性的特征。为更好地利用食品图像的语义信息,EVHNet中还设计了一个聚合语义特征模块,根据类令牌特征来聚合食品图像中的语义信息。本实验提出的EVHNet模型在贪婪哈希、中心相似量化和深度极化网络3种流行的哈希图像检索框架下进行评估,并与AlexNet,ResNet50、ViT-B_32和ViT-B_164种主流网络模型进行比较,在Food-101、Vireo Food-172、UEC Food-2563个食品数据集上的实验结果表明,EVHNet模型在检索精度上的综合性能优于其他模型。
展开更多
关键词
食品图像检索
食品计算
哈希检索
visiontransformer
网络
深度哈希学习
下载PDF
职称材料
基于时空特征自适应融合网络的流量分类方法
2
作者
杨宇
唐东明
+1 位作者
李驹光
肖宇峰
《电子测量技术》
北大核心
2024年第3期166-174,共9页
针对当前网络流量瞬时涌现导致网络安全事故骤增、网络管理负担加重等问题,基于深度学习技术提出了ResNet和一维VisionTransformer并行的网络结构对网络流量进行识别并分类。其中ResNet可以提取到流量数据在空间上深层次的特征,能够保...
针对当前网络流量瞬时涌现导致网络安全事故骤增、网络管理负担加重等问题,基于深度学习技术提出了ResNet和一维VisionTransformer并行的网络结构对网络流量进行识别并分类。其中ResNet可以提取到流量数据在空间上深层次的特征,能够保证流量识别的准确率;一维VisionTransformer可以提取到更具代表性的时序特征。利用注意力机制将两种特征进行自适应融合得到更全面的特征表示,以提高网络识别流量的能力。在ISCX VPNnonVPN数据集上进行实验表明:所提方法在流量的应用程序分类实验中的准确率达到了99.5%,相较于单独的ResNet和一维VisionTransformer以及经典的一维CNN和CNN+长短时记忆网络分别提高了0.9%、3.6%、6.6%和3.3%。在USTC-TFC2016数据集上,所提方法在能够轻松识别流量是否为恶意流量的基础上,实现了对13种应用程序的分类,且平均分类准确率达到了98.92%,证明了其具有识别恶意流量并完成细粒度分类任务的能力。
展开更多
关键词
流量分类
ResNet
visiontransformer
多头注意力机制
特征融合
下载PDF
职称材料
基于多模态信息融合的深度伪造检测
3
作者
王栋
李达
+2 位作者
杨珂
郭庆雷
王合建
《电力信息与通信技术》
2023年第8期29-35,共7页
深度伪造技术的快速发展和应用给国家和社会安全、个人信息数据、企业安全等造成了潜在威胁。从电网企业的实际业务场景出发,针对现有深度伪造检测方法的泛化能力不足问题,文章提出一种基于多模态信息融合的深度伪造检测方法,为保护电...
深度伪造技术的快速发展和应用给国家和社会安全、个人信息数据、企业安全等造成了潜在威胁。从电网企业的实际业务场景出发,针对现有深度伪造检测方法的泛化能力不足问题,文章提出一种基于多模态信息融合的深度伪造检测方法,为保护电网企业合法权益提供支撑。提出的方法在基准人脸伪造数据集FaceForensics++(FF++)进行验证评估,结果表明该方法在人脸伪造检测方面性能优良、鲁棒性好,同时多模态信息融合使得模型泛化性得到了很好的提升。
展开更多
关键词
多模态信息融合
visiontransformer
模型
深度伪造
下载PDF
职称材料
基于对抗域适应网络的土壤水分智能识别算法
4
作者
孙德鑫
《南方农机》
2023年第20期53-57,共5页
【目的】使用传统卷积神经网络测量土壤含水率的识别准确率低、泛化性能差。为了满足重大工程扰动下的含水率测量需要,需提出一种适用于不同土壤类型且不受深度制约的探测方法。【方法】笔者搭建了室内实验平台,采集了延安、兰州和蓝田...
【目的】使用传统卷积神经网络测量土壤含水率的识别准确率低、泛化性能差。为了满足重大工程扰动下的含水率测量需要,需提出一种适用于不同土壤类型且不受深度制约的探测方法。【方法】笔者搭建了室内实验平台,采集了延安、兰州和蓝田三个地区间隔等级为2%的8类不同土壤水分下的图像,构造了用于神经网络训练和测试的数据集。然后,基于对抗域适应算法(CDAN),比较了ResNet、MobileNetV2、Xception和ViT四种网络,选取识别准确率最高的模型作为其特征提取器,构建基于对抗域适应的土壤含水率识别模型,对比分析含水率识别模型在不同迁移任务上的识别效果。【结果】域适应模型CDAN的测试准确率明显高于MobileNetV2、Xception和ViT等模型,对不同地区土壤含水率的测试准确率均达到68%以上,最高识别准确率为84.3%。【结论】使用域适应方法具有良好的泛化能力和识别精度,能够为开发土壤地质信息探测机器人的视觉系统提供算法支持。然而,目前的土壤含水率识别算法仅适用于实验室条件下所搭建的土壤含水率数据集,若想实现实际的工程应用,则需要进一步完善土壤含水率图像数据集,使室内搭建的算法实现室外的原状土壤含水率识别。
展开更多
关键词
土壤水分
智能识别
visiontransformer
迁移学习
下载PDF
职称材料
人群计数研究综述
被引量:
6
5
作者
卢振坤
刘胜
+2 位作者
钟乐
刘绍航
张甜
《计算机工程与应用》
CSCD
北大核心
2022年第11期33-46,共14页
人群计数广泛应用在公共安防、视频监控和智慧城市建设等领域,对控制特定场所人数、指挥公共交通、防止疫情蔓延、保障社会稳定具有重要积极意义。传统的计数方法精度不高、场景受限,随着深度学习的发展,传统方法逐渐被卷积神经网络(con...
人群计数广泛应用在公共安防、视频监控和智慧城市建设等领域,对控制特定场所人数、指挥公共交通、防止疫情蔓延、保障社会稳定具有重要积极意义。传统的计数方法精度不高、场景受限,随着深度学习的发展,传统方法逐渐被卷积神经网络(convolutional neural network,CNN)方法代替。介绍了人群计数的研究背景、现状和发展趋势,叙述了两种传统方法;从计数精度、网络结构、评价指标和数据集等方面重点分析了CNN方法,发现CNN技术可以有效解决多尺度和跨场景等问题;阐述了基于Vision Transformer(ViT)序列的弱监督计数方法并且对比各类方法。对未来人群计数的研究前景做出展望。
展开更多
关键词
人群计数
卷积神经网络
visiontransformer
(ViT)序列
密度估计
下载PDF
职称材料
题名
基于增强视觉Transformer的哈希食品图像检索
1
作者
曹品丹
闵巍庆
宋佳骏
盛国瑞
杨延村
王丽丽
蒋树强
机构
鲁东大学信息与电气工程学院
中国科学院计算技术研究所
中国人民大学农业与农村发展学院
出处
《食品科学》
EI
CAS
CSCD
北大核心
2024年第10期1-8,共8页
基金
国家自然科学基金青年科学基金项目(61705098)
国家自然科学基金面上项目(61872170)
山东省自然科学基金项目(ZR2023MF031)。
文摘
作为食品计算的一个主要任务,食品图像检索近年来受到了广泛的关注。然而,食品图像检索面临着两个主要的挑战。首先,食品图像具有细粒度的特点,这意味着不同食品类别之间的视觉差异可能很小,这些差异只能在图像的局部区域中观察到。其次,食品图像包含丰富的语义信息,如食材、烹饪方式等,这些信息的提取和利用对于提高检索性能至关重要。为解决这些问题,本实验基于预训练的视觉Transformer(Vision Transformer,ViT)模型提出了一种增强ViT的哈希网络(enhanced ViT hash network,EVHNet)。针对食品图像的细粒度特点,EVHNet中设计了一个基于卷积结构的局部特征增强模块,使网络能够学习到更具有代表性的特征。为更好地利用食品图像的语义信息,EVHNet中还设计了一个聚合语义特征模块,根据类令牌特征来聚合食品图像中的语义信息。本实验提出的EVHNet模型在贪婪哈希、中心相似量化和深度极化网络3种流行的哈希图像检索框架下进行评估,并与AlexNet,ResNet50、ViT-B_32和ViT-B_164种主流网络模型进行比较,在Food-101、Vireo Food-172、UEC Food-2563个食品数据集上的实验结果表明,EVHNet模型在检索精度上的综合性能优于其他模型。
关键词
食品图像检索
食品计算
哈希检索
visiontransformer
网络
深度哈希学习
Keywords
food image retrieval
food computing
hash retrieval
Vision Transformer network
deep hash learning
分类号
S126 [农业科学—农业基础科学]
下载PDF
职称材料
题名
基于时空特征自适应融合网络的流量分类方法
2
作者
杨宇
唐东明
李驹光
肖宇峰
机构
西南科技大学信息工程学院
出处
《电子测量技术》
北大核心
2024年第3期166-174,共9页
基金
国家自然科学基金(12175187)项目资助。
文摘
针对当前网络流量瞬时涌现导致网络安全事故骤增、网络管理负担加重等问题,基于深度学习技术提出了ResNet和一维VisionTransformer并行的网络结构对网络流量进行识别并分类。其中ResNet可以提取到流量数据在空间上深层次的特征,能够保证流量识别的准确率;一维VisionTransformer可以提取到更具代表性的时序特征。利用注意力机制将两种特征进行自适应融合得到更全面的特征表示,以提高网络识别流量的能力。在ISCX VPNnonVPN数据集上进行实验表明:所提方法在流量的应用程序分类实验中的准确率达到了99.5%,相较于单独的ResNet和一维VisionTransformer以及经典的一维CNN和CNN+长短时记忆网络分别提高了0.9%、3.6%、6.6%和3.3%。在USTC-TFC2016数据集上,所提方法在能够轻松识别流量是否为恶意流量的基础上,实现了对13种应用程序的分类,且平均分类准确率达到了98.92%,证明了其具有识别恶意流量并完成细粒度分类任务的能力。
关键词
流量分类
ResNet
visiontransformer
多头注意力机制
特征融合
Keywords
traffic classification
ResNet
vision Transformer
multi-head attention mechanism
feature fusion
分类号
TP393 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于多模态信息融合的深度伪造检测
3
作者
王栋
李达
杨珂
郭庆雷
王合建
机构
国网数字科技控股有限公司
国网区块链科技(北京)有限公司
国家电网有限公司区块链技术实验室
出处
《电力信息与通信技术》
2023年第8期29-35,共7页
基金
国网数科控股公司科技项目“电力生产运行数据深度伪造排查、数据取证、鉴定与溯源技术研究”(1200/2022-72001B)。
文摘
深度伪造技术的快速发展和应用给国家和社会安全、个人信息数据、企业安全等造成了潜在威胁。从电网企业的实际业务场景出发,针对现有深度伪造检测方法的泛化能力不足问题,文章提出一种基于多模态信息融合的深度伪造检测方法,为保护电网企业合法权益提供支撑。提出的方法在基准人脸伪造数据集FaceForensics++(FF++)进行验证评估,结果表明该方法在人脸伪造检测方面性能优良、鲁棒性好,同时多模态信息融合使得模型泛化性得到了很好的提升。
关键词
多模态信息融合
visiontransformer
模型
深度伪造
Keywords
multimodal information fusion
visiontransformer
model
Deepfake
分类号
TP391.4 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于对抗域适应网络的土壤水分智能识别算法
4
作者
孙德鑫
机构
长安大学工程机械学院
出处
《南方农机》
2023年第20期53-57,共5页
文摘
【目的】使用传统卷积神经网络测量土壤含水率的识别准确率低、泛化性能差。为了满足重大工程扰动下的含水率测量需要,需提出一种适用于不同土壤类型且不受深度制约的探测方法。【方法】笔者搭建了室内实验平台,采集了延安、兰州和蓝田三个地区间隔等级为2%的8类不同土壤水分下的图像,构造了用于神经网络训练和测试的数据集。然后,基于对抗域适应算法(CDAN),比较了ResNet、MobileNetV2、Xception和ViT四种网络,选取识别准确率最高的模型作为其特征提取器,构建基于对抗域适应的土壤含水率识别模型,对比分析含水率识别模型在不同迁移任务上的识别效果。【结果】域适应模型CDAN的测试准确率明显高于MobileNetV2、Xception和ViT等模型,对不同地区土壤含水率的测试准确率均达到68%以上,最高识别准确率为84.3%。【结论】使用域适应方法具有良好的泛化能力和识别精度,能够为开发土壤地质信息探测机器人的视觉系统提供算法支持。然而,目前的土壤含水率识别算法仅适用于实验室条件下所搭建的土壤含水率数据集,若想实现实际的工程应用,则需要进一步完善土壤含水率图像数据集,使室内搭建的算法实现室外的原状土壤含水率识别。
关键词
土壤水分
智能识别
visiontransformer
迁移学习
Keywords
soil moisture
intelligent recognition
Vision Transformer
transfer learning
分类号
S152.7 [农业科学—土壤学]
下载PDF
职称材料
题名
人群计数研究综述
被引量:
6
5
作者
卢振坤
刘胜
钟乐
刘绍航
张甜
机构
广西民族大学电子信息学院
出处
《计算机工程与应用》
CSCD
北大核心
2022年第11期33-46,共14页
基金
国家自然科学基金(61561008)
广西自然科学基金(2018GXNSFAA294019)
+1 种基金
广西研究生教育创新计划项目(YCSW2021158)
广西民族大学相思湖青年学者创新团队(2018RSCXSHQN03)。
文摘
人群计数广泛应用在公共安防、视频监控和智慧城市建设等领域,对控制特定场所人数、指挥公共交通、防止疫情蔓延、保障社会稳定具有重要积极意义。传统的计数方法精度不高、场景受限,随着深度学习的发展,传统方法逐渐被卷积神经网络(convolutional neural network,CNN)方法代替。介绍了人群计数的研究背景、现状和发展趋势,叙述了两种传统方法;从计数精度、网络结构、评价指标和数据集等方面重点分析了CNN方法,发现CNN技术可以有效解决多尺度和跨场景等问题;阐述了基于Vision Transformer(ViT)序列的弱监督计数方法并且对比各类方法。对未来人群计数的研究前景做出展望。
关键词
人群计数
卷积神经网络
visiontransformer
(ViT)序列
密度估计
Keywords
crowd counting
convolutional neural network(CNN)
Vision Transformer(ViT)sequence
density estimation
分类号
TP3-05 [自动化与计算机技术—计算机科学与技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于增强视觉Transformer的哈希食品图像检索
曹品丹
闵巍庆
宋佳骏
盛国瑞
杨延村
王丽丽
蒋树强
《食品科学》
EI
CAS
CSCD
北大核心
2024
0
下载PDF
职称材料
2
基于时空特征自适应融合网络的流量分类方法
杨宇
唐东明
李驹光
肖宇峰
《电子测量技术》
北大核心
2024
0
下载PDF
职称材料
3
基于多模态信息融合的深度伪造检测
王栋
李达
杨珂
郭庆雷
王合建
《电力信息与通信技术》
2023
0
下载PDF
职称材料
4
基于对抗域适应网络的土壤水分智能识别算法
孙德鑫
《南方农机》
2023
0
下载PDF
职称材料
5
人群计数研究综述
卢振坤
刘胜
钟乐
刘绍航
张甜
《计算机工程与应用》
CSCD
北大核心
2022
6
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部