期刊文献+
共找到13篇文章
< 1 >
每页显示 20 50 100
PPNet:基于预先预测的降雨短时预测模型
1
作者 宋毅 张晗奕 +2 位作者 孙丰 张敬林 白琮 《电子与信息学报》 EI CAS CSCD 北大核心 2024年第2期492-502,共11页
降雨短时预测一直以来都是气象预测问题中的热点问题。传统的预测方法基于数值天气预测模型展开预报,但近些年利用深度学习展开基于雷达回波图的降雨短时预测方法受到了广大研究者的关注。其中,时序预测网络存在不能并行计算导致耗时过... 降雨短时预测一直以来都是气象预测问题中的热点问题。传统的预测方法基于数值天气预测模型展开预报,但近些年利用深度学习展开基于雷达回波图的降雨短时预测方法受到了广大研究者的关注。其中,时序预测网络存在不能并行计算导致耗时过长的问题且存在梯度爆炸问题。全卷积网络可以解决上述两个问题,但是却不具备时序信息提取的能力。因此,该文以泰勒冻结假设为理论依据,提出一个基于预先预测辅助推断结构的2维全卷积网络(PPNet)。网络先行提取粗粒度时序信息与空间信息,然后利用全卷积结构细化特征粒度,有效缓解2维卷积网络不能提取时序信息的缺陷。此外,该文还提供一种时序特征约束器对预先预测特征进行时间维度的特征约束,使预测特征更倾向于真实特征。消融实验证明所提预先预测辅助推断结构和时序特征约束器具有优秀的时序特征能力,可以提升网络对时序信息的敏感度。与目前最好的降雨预测算法或视频预测算法相比,该文网络均取得较好结果,特别在暴雨指标上达到最优。 展开更多
关键词 降雨短时预测 全卷积 预先预测 泰勒冻结 特征约束
下载PDF
面向大规模图像分类的深度卷积神经网络优化 被引量:63
2
作者 白琮 黄玲 +2 位作者 陈佳楠 潘翔 陈胜勇 《软件学报》 EI CSCD 北大核心 2018年第4期1029-1038,共10页
在图像分类任务中,为了获得更高的分类精度,需要对图像提取不同层次的特征信息.深度学习被越来越多地应用于大规模图像分类任务中.提出了一种基于深度卷积神经网络的、可应用于大规模图像分类的深度学习框架.该框架在经典的深度卷积神... 在图像分类任务中,为了获得更高的分类精度,需要对图像提取不同层次的特征信息.深度学习被越来越多地应用于大规模图像分类任务中.提出了一种基于深度卷积神经网络的、可应用于大规模图像分类的深度学习框架.该框架在经典的深度卷积神经网络AlexNet基础上,分别从网络框架和网络内部结构两个方面对网络进行了优化和改进,进一步提升了网络的特征表达能力.同时,通过在全连接层引入隐层,使得网络能够同时具备学习图像特征和二值哈希的功能,从而使该框架具有处理大规模图像数据的能力.通过在3个标准数据库中的一系列比对实验,分析了不同优化方法在不同情况下的作用,并证明了所提优化方法的有效性. 展开更多
关键词 图像分类 哈希编码 深度卷积神经网络 激活函数 池化
下载PDF
一种基于滑动差分的车辆边缘检测新方法 被引量:1
3
作者 白琮 寇超 陈泉林 《电子测量技术》 2008年第11期16-20,共5页
在基于视频的交通监控系统中,车辆的快速、有效提取是车辆检测中的一个重要环节。在彩色图像中,当车辆出现在道路上时,因为车辆与道路相比颜色上有较大的差异,所以在车辆的边缘像素点上会发生颜色的突变。本文以此为依据,结合车辆的几... 在基于视频的交通监控系统中,车辆的快速、有效提取是车辆检测中的一个重要环节。在彩色图像中,当车辆出现在道路上时,因为车辆与道路相比颜色上有较大的差异,所以在车辆的边缘像素点上会发生颜色的突变。本文以此为依据,结合车辆的几何信息,提出了一种新的车辆提取算法。此方法通过对彩色图像进行逐行扫描的方式,利用滑动差分滤波器,确定每行的车辆边缘像素点,进而将车辆从图像中提取出来。实验证明,该方法能简单有效地提取车辆。 展开更多
关键词 RGB色彩空间 滑动差分 车辆边缘 车辆提取
下载PDF
组加权约束的核稀疏表示分类算法 被引量:4
4
作者 郑建炜 杨平 +1 位作者 王万良 白琮 《计算机研究与发展》 EI CSCD 北大核心 2016年第11期2567-2582,共16页
提出了一种称为核加权组稀疏表示分类器(kernel weighted group sparse representation classifier,KWGSC)的新型模式分类算法.通过在核特征空间而非原输入空间引入组稀疏性和保局性,KWGSC能够获得更有效的鉴别性重构系数用于分类表示.... 提出了一种称为核加权组稀疏表示分类器(kernel weighted group sparse representation classifier,KWGSC)的新型模式分类算法.通过在核特征空间而非原输入空间引入组稀疏性和保局性,KWGSC能够获得更有效的鉴别性重构系数用于分类表示.为获得最优重构系数,提出了一种新的迭代更新策略进行模型求解并给出了相应的收敛性证明以及复杂度分析.对比现存表示型分类算法,KWGSC具有的优势包括:1)通过隐含映射变换,巧妙地规避了经典线性表示算法所固有的规范化问题;2)通过联合引入距离加权约束和重构冗余约束,精确地推导出查询样本的目标类别标签;3)引入l2,p正则项调整协作机制中的稀疏性,获得更佳的分类性能.人造数值实验表明:经典线性表示型算法在非范数归一化条件下无法找到正确的重构样本,而KWGSC却未受影响.实际的公共数据库验证了所提分类算法具有鲁棒的鉴别力,其综合性能明显优于现存算法. 展开更多
关键词 稀疏表示技术 保局性 组稀疏正则项 核技术 范数归一化问题
下载PDF
张量环因子非凸秩约束的高光谱图像超解析 被引量:8
5
作者 郑建炜 周鑫杰 +2 位作者 徐宏辉 秦梦洁 白琮 《光子学报》 EI CAS CSCD 北大核心 2022年第2期203-217,共15页
针对高光谱图像超解析问题,提出了一种联合子空间表示、非局部相似性和张量环因子非凸秩约束的超谱-多谱融合模型。首先,基于高光谱图像的全局谱低秩特性,利用原始低空间分辨率高光谱谱域信息将其降维至子空间表示;随后,针对视觉对像在... 针对高光谱图像超解析问题,提出了一种联合子空间表示、非局部相似性和张量环因子非凸秩约束的超谱-多谱融合模型。首先,基于高光谱图像的全局谱低秩特性,利用原始低空间分辨率高光谱谱域信息将其降维至子空间表示;随后,针对视觉对像在非局部维度上的强相关性,利用多光谱图像的空间冗余信息将降维后子空间图分成多个相似patch组,并对其施加张量环分解挖掘低秩信息。其中,对分解因子添加基于t-SVD的张量核范数约束,并利用非凸log函数逼近本质秩函数,代替传统凸张量核范数约束,在保持其光谱-空间结构的基础上,避免凸函数过度惩罚较大奇异值所导致的有偏解问题。最后,建立完整的融合模型,并采用交替方向乘子法进行变量优化求解。通过多组实验进行验证,结果表明所提模型提高了视觉质量,与现有最新的融合模型相比,该方法在定量评价的数值结果上也有明显优势。新模型充分考虑了高光谱图像的全局谱低秩性,并结合了非局部相似先验与张量环分解的非凸张量因子秩,能够有效实现高光谱图像的超分辨率重构。 展开更多
关键词 高光谱图像 超分辨率重构 张量环 张量核范数 交替方向乘子法
下载PDF
面向留学生的数字媒体类课程全英文教学方法探索 被引量:6
6
作者 郝鹏翼 方珊珊 +1 位作者 白琮 雷艳静 《计算机教育》 2018年第3期105-108,共4页
针对留学生基础偏弱、数字媒体类课程实践性较强等问题,分析目前面向留学生的数字媒体类课程全英文教学中的矛盾,基于3年的教学实践,探讨以任务驱动为主的启发式教学方法。
关键词 全英文教学 数字图像处理 任务驱动
下载PDF
面向细粒度草图检索的对抗训练三元组网络 被引量:2
7
作者 陈健 白琮 +2 位作者 马青 郝鹏翼 陈胜勇 《软件学报》 EI CSCD 北大核心 2020年第7期1933-1942,共10页
将草图作为检索示例用于图像检索称为基于草图的图像检索,简称草图检索.其中,细粒度检索问题或类内检索问题是2014年被研究者提出并快速成为广受关注的研究方向.目前研究者通常用三元组网络来解决类内检索问题,且取得了不错的效果.但是... 将草图作为检索示例用于图像检索称为基于草图的图像检索,简称草图检索.其中,细粒度检索问题或类内检索问题是2014年被研究者提出并快速成为广受关注的研究方向.目前研究者通常用三元组网络来解决类内检索问题,且取得了不错的效果.但是三元组网络的训练非常困难,很多情况下很难收敛甚至不收敛,且存在着容易过拟合的风险.借鉴循环生成对抗训练的思想,设计了SketchCycleGAN帮助提高三元组网络训练过程的效率,以对抗训练的方式使其参与到三元组网络的训练过程中,通过充分挖掘数据集自身信息的方式取代了利用其他数据集进行预训练的过程,在简化训练步骤的基础上取得了更好的检索性能.通过在常用的细粒度草图检索数据集上的一系列对比实验,证明了所提方法的有效性和优越性. 展开更多
关键词 基于草图的图像检索 细粒度检索 三元组网络 对抗训练
下载PDF
基于对抗投影学习的跨模态哈希检索 被引量:4
8
作者 曾超 白琮 +1 位作者 马青 陈胜勇 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2021年第6期904-912,共9页
跨模态哈希检索以其较高的检索效率和较低的存储成本,在跨模态检索领域受到了广泛的关注.现有的跨模态哈希大多直接从多模态数据中学习哈希码,不能充分利用数据的语义信息,因此无法保证数据低维特征在模态间的分布一致性,解决这个问题... 跨模态哈希检索以其较高的检索效率和较低的存储成本,在跨模态检索领域受到了广泛的关注.现有的跨模态哈希大多直接从多模态数据中学习哈希码,不能充分利用数据的语义信息,因此无法保证数据低维特征在模态间的分布一致性,解决这个问题的关键之一是要准确地度量多模态数据之间的相似度.为此,提出一种基于对抗投影学习的哈希(adversarial projection learning based Hashing for cross-modal retrieval,APLH)方法用于跨模态检索.利用对抗训练学习来自不同模态的低维特征,并保证低维特征在模态间的分布一致性.在此基础上,利用跨模态投影匹配约束(cross-modal projection matching,CMPM),最小化特征投影匹配分布和标签投影匹配分布之间的KL(Kullback-Leibler)散度,利用标签信息使数据低维特征之间的相似度结构与语义空间中的相似度结构趋于一致.此外,在哈希码学习阶段,引入加权余弦三元组损失进一步利用数据的语义信息;且为减小哈希码的量化损失,使用离散优化的方法优化哈希函数.在3个跨模态数据集MIRFlickr25K,NUS-WIDE,Wikipedia上,以不同码位计算mAP,且所提方法的mAP值均优于其他算法,验证了其在跨模态哈希检索上的优越性、鲁棒性以及CMPM的有效性. 展开更多
关键词 跨模态检索 映射学习 对抗学习 离散哈希
下载PDF
基于对抗和迁移学习的灾害天气卫星云图分类 被引量:3
9
作者 张敏靖 白琮 +1 位作者 张敬林 郑建炜 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2021年第3期585-595,共11页
针对卫星云图中的灾害天气数据存在严重不平衡问题,提出一个结合生成对抗学习(GAN)和迁移学习(TL)的卷积神经网络(CNN)框架以解决上述问题进而提高基于卫星云图的灾害天气分类精度。该框架主要包含基于GAN的数据均衡化模块和基于迁移学... 针对卫星云图中的灾害天气数据存在严重不平衡问题,提出一个结合生成对抗学习(GAN)和迁移学习(TL)的卷积神经网络(CNN)框架以解决上述问题进而提高基于卫星云图的灾害天气分类精度。该框架主要包含基于GAN的数据均衡化模块和基于迁移学习的CNN分类模块。上述2个模块分别从数据和算法层面解决数据的类间不平衡问题,分别得到一个相对均衡的数据集和一个可在不同类别数据上提取相对均衡特征的分类模型,最终实现对卫星云图的分类,提高其中灾害天气的卫星云图类别分类准确率。与此同时所提方法在自建的大规模卫星云图数据上进行了测试,消融性和综合实验结果证明了所提数据均衡方法和迁移学习方法是有效的,且所提框架模型对各个灾害天气类别的分类精度都有显著提升。 展开更多
关键词 灾害天气 卫星影像 图片分类 生成对抗网络 类间不平衡
下载PDF
改进反向投影的Camshift人脸跟踪算法 被引量:2
10
作者 寇超 白琮 陈泉林 《计算机仿真》 CSCD 北大核心 2009年第6期228-231,253,共5页
对人脸进行检测与跟踪是诸如人机交互、视频监控等众多应用的基础。在众多方法当中,连续自适应均值偏移(Con-tinuously Adaptive Mean Shift,简称Camshift)算法在兼具良好跟踪性能的同时做到了较低的计算成本。然而在经典Camshift算法中... 对人脸进行检测与跟踪是诸如人机交互、视频监控等众多应用的基础。在众多方法当中,连续自适应均值偏移(Con-tinuously Adaptive Mean Shift,简称Camshift)算法在兼具良好跟踪性能的同时做到了较低的计算成本。然而在经典Camshift算法中,反映像素类肤色概率的"反向投影图"会受到初始搜索框内背景像素的影响,是几乎所有基于经典Camshift的算法中普遍存在的一个问题。针对反向投影图的原理进行分析,并采用人脸检测结果作为替代方案,从而对传统Camshift算法进行改进。同时,对YCrCb色彩空间中的人脸检测进行多时段分析,并借此自动确定初始跟踪区域,较传统Camshift算法具有更好的效果。 展开更多
关键词 人脸跟踪 连续自适应均值偏移算法 反向投影图 肤色检测
下载PDF
基于条件生成对抗网络的图像描述生成方法 被引量:14
11
作者 黄远 白琮 +2 位作者 李宏凯 张敬林 陈胜勇 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2020年第6期911-918,共8页
图像描述,即利用电脑自动描述图像的语义内容一直是计算机视觉领域的一项重要研究任务.尽管使用卷积神经网络(convolutional neural networks, CNN)和长短期记忆网络(long short-term memory, LSTM)的组合框架在生成图像描述方面解决了... 图像描述,即利用电脑自动描述图像的语义内容一直是计算机视觉领域的一项重要研究任务.尽管使用卷积神经网络(convolutional neural networks, CNN)和长短期记忆网络(long short-term memory, LSTM)的组合框架在生成图像描述方面解决了梯度消失和梯度爆炸问题,但是基于LSTM的模型依赖序列化的生成描述,无法在训练时并行处理,且容易在生成描述时遗忘先前的信息.为解决这些问题,提出将条件生成对抗网络(conditionalgenerativeadversarial network, CGAN)引入到描述生成模型训练中,即采用CNN来生成图像描述.通过对抗训练来生成句子描述,并结合注意力机制提升描述的质量.在MSCOCO数据集上进行测试,实验结果表明,与基于CNN的其他方法相比,文中方法在语义丰富程度指标CIDEr上取得了2%的提升,在准确性指标BLEU上有1%左右的性能提升;同时,其在部分指标,尤其是语义指标上超过了基于LSTM模型的图像描述方法的性能;证明该方法生成的图像描述更接近图像的真实描述,并且语义内容更加丰富. 展开更多
关键词 图像描述 卷积神经网络 生成对抗网络 注意力机制
下载PDF
结合多层特征及空间信息蒸馏的医学影像分割
12
作者 郑宇祥 郝鹏翼 +1 位作者 吴冬恩 白琮 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2022年第8期1409-1417,共9页
U-Net在医学影像分割领域是目前应用最广泛的分割模型,其“编码-解码”结构也成为了构建医学影像分割模型最常用的结构。尽管U-Net在许多领域实现了非常高的分割准确度,但是存在着计算复杂度高、推理速度慢、运行消耗内存大等问题,导致... U-Net在医学影像分割领域是目前应用最广泛的分割模型,其“编码-解码”结构也成为了构建医学影像分割模型最常用的结构。尽管U-Net在许多领域实现了非常高的分割准确度,但是存在着计算复杂度高、推理速度慢、运行消耗内存大等问题,导致其难以在移动应用平台部署。为解决这一问题,提出了一种结合多层特征及空间信息蒸馏的医学影像分割方法TinyUnet。该方法使用轻量化的U-Net作为学生网络。考虑到小模型没有足够的学习能力,通过选择合适的蒸馏位置,对多层教师特征图进行蒸馏;同时加强教师网络深层特征图的边缘,并构建边缘关键点图结构,采用图卷积网络对学生网络进行空间信息蒸馏,从而补充重要的边缘信息和空间信息。实验表明:在3个医学影像数据集上,TinyUnet能够达到U-Net 98.3%~99.7%的分割准确度,但是将U-Net的参数量平均降低了99.6%,运算速度提高了约110倍;同时,与其他轻量化医学影像分割模型相比,TinyUnet不仅具有较高的分割准确度,而且占用内存更少,运行速度更快。 展开更多
关键词 医学影像分割 特征蒸馏 深度学习 图神经网络 空间信息
下载PDF
结合多通道注意力的糖尿病性视网膜病变分级 被引量:7
13
作者 顾婷菲 郝鹏翼 +1 位作者 白琮 柳宁 《中国图象图形学报》 CSCD 北大核心 2021年第7期1726-1736,共11页
目的糖尿病性视网膜病变(diabetic retinopathy,DR)是一种常见的致盲性视网膜疾病,需要患者在早期就能够被诊断并接受治疗,否则将会造成永久性的视力丧失。能否检测到视网膜图像中的微小病变如微血管瘤,是糖尿病性视网膜病变分级的关键... 目的糖尿病性视网膜病变(diabetic retinopathy,DR)是一种常见的致盲性视网膜疾病,需要患者在早期就能够被诊断并接受治疗,否则将会造成永久性的视力丧失。能否检测到视网膜图像中的微小病变如微血管瘤,是糖尿病性视网膜病变分级的关键。然而这些病变过于细小导致使用一般方法难以正确地辨别。为了解决这一问题,本文提出了一种基于多通道注意力选择机制的细粒度分级方法(fine-grained grading method based on multichannel attention selection,FGMAS)用于糖尿病性视网膜病变的分级。方法该方法结合了细粒度分类方法和多通道注意力选择机制,通过获取局部特征提升分级的准确度。此外考虑到每一层通道特征信息量与分类置信度的关系,本文引入了排序损失以优化每一层通道的信息量,用于获取更加具有信息量的局部区域。结果使用两个公开的视网膜数据集(Kaggle和Messidor)来评估提出的细粒度分级方法和多通道注意力选择机制的有效性。实验结果表明:FGMAS在Kaggle数据集上进行的五级分类任务中相较于现有方法,在平均准确度(average of classification accuracy,ACA)上取得了3.4%~10.4%的提升。尤其是对于病变点最小的1级病变,准确率提升了11%~18.9%。此外,本文使用FGMAS在Messidor数据集上进行二分类任务。在推荐转诊/不推荐转诊分类上FGMAS得到的准确度(accuracy,Acc)为0.912,比现有方法提升了0.1%~1.9%,同时AUC(area under the curve)为0.962,比现有方法提升了0.5%~9.9%;在正常/不正常分类上FGMAS得到的准确度为0.909,比现有方法提升了2.9%~8.8%,AUC为0.950,比现有方法提升了0.4%~8.9%。实验结果表明,本文方法在五分类和二分类上均优于现有方法。结论本文所提细粒度分级模型,综合了细粒度提取局部区域的思路以及多通道注意力选择机制,可以获得较为准确的分级结果。 展开更多
关键词 糖尿病性视网膜病变(DR) 病变分级 细粒度分级 深度学习 多通道注意力选择机制 局部特征提取
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部