期刊文献+
共找到22篇文章
< 1 2 >
每页显示 20 50 100
融合比例先验和损失感知的目标检测模型的正负样本分配算法
1
作者 庄旭君 左华红 韩屏 《计算机应用研究》 CSCD 北大核心 2023年第10期3194-3200,共7页
针对目标检测模型在训练过程中正负样本分配时没有考虑真实框的长宽比、对物体不同分布的适应能力差等不足,提出了比例先验和损失感知的分配算法RLA。RLA不改变原有检测模型的结构,首先根据真实框的长宽比选择等比例的中心区域,然后计... 针对目标检测模型在训练过程中正负样本分配时没有考虑真实框的长宽比、对物体不同分布的适应能力差等不足,提出了比例先验和损失感知的分配算法RLA。RLA不改变原有检测模型的结构,首先根据真实框的长宽比选择等比例的中心区域,然后计算锚点综合损失,考虑真实框内物体的实际分布,最后通过动态损失阈值的方式区分正负样本。该算法解决了基于IoU分配时适应性差、难以选出最佳正样本等问题,对偏心物体和长宽比悬殊物体的样本分配更加合理。与已有的样本分配算法对比,该算法在MS COCO数据集上的表现更优,比基线FCOS的AP提升1.66%;在模型结构相同时,比ATSS和PAA算法的AP分别提升了0.76%和0.24%,证明了RLA算法的有效性。 展开更多
关键词 目标检测 正负样本 长宽比 损失感知 自适应
下载PDF
基于正负样本和Bi-LSTM的文本相似度匹配模型 被引量:8
2
作者 周艳平 朱小虎 《计算机系统应用》 2021年第4期175-180,共6页
相似度匹配是自然语言处理领域一个重要分支,也是问答系统抽取答案的重要途径之一.本文提出了一种基于正负样本和Bi-LSTM的文本相似度匹配模型,该模型首先为了提升问题和正确答案之间的相似度,构建正负样本问答对用于模型训练;其次为了... 相似度匹配是自然语言处理领域一个重要分支,也是问答系统抽取答案的重要途径之一.本文提出了一种基于正负样本和Bi-LSTM的文本相似度匹配模型,该模型首先为了提升问题和正确答案之间的相似度,构建正负样本问答对用于模型训练;其次为了解决分词错误引起的实验误差,采用双层嵌入词向量方法进行预训练;再次为了解决注意力机制导致的特征向量向后偏移的问题,在特征提取之前,采取内部注意力机制方法;然后为了保留重要的时序特性,采用Bi-LSTM神经网络进行数据训练;最后为了能在语义层次上计算相似度,提出一种包含语义信息的相似度计算函数.将本文提出的文本相似度匹配模型在公共数据集DuReader上进行了仿真实验,并和其他模型进行对比分析,实验结果表明,提出的模型不仅准确率高且鲁棒性好,top-1准确率达到78.34%. 展开更多
关键词 问答系统 相似度匹配 正负样本 Bi-LSTM
下载PDF
基于注意力与密集重参数化的目标检测算法
3
作者 陈志旺 雷春明 +2 位作者 吕昌昊 王婷 彭勇 《高技术通讯》 CAS 北大核心 2024年第3期233-247,共15页
针对目标检测任务中背景复杂、目标尺寸差异大等因素导致目标检测结果较差的问题,本文提出基于注意力和密集重参数化的目标检测算法。首先,基于CSP-DarkNet提出高效的特征提取网络,主要包括密集重参数化模块和CASA模块2个设计。前者利... 针对目标检测任务中背景复杂、目标尺寸差异大等因素导致目标检测结果较差的问题,本文提出基于注意力和密集重参数化的目标检测算法。首先,基于CSP-DarkNet提出高效的特征提取网络,主要包括密集重参数化模块和CASA模块2个设计。前者利用密集连接保留浅层特征,又通过重参数化结构降低网络复杂度;后者CASA模块用于获取需要的目标信息。其次,特征融合在特征金字塔(FPN)和路径聚合网络(PAN)的基础上,引入内容感知特征重组(CARAFE)进行上采样,有效解决了邻近插值法等未能捕捉丰富语义信息的问题;提出更高效的C3-G模块,获取丰富的梯度信息,增强模型表达能力和感知能力;同时,引入深度可分离卷积提升运算效率。最后,检测输出采用在更大范围上跨领域正负样本匹配策略扩充正样本数量,提升检测效果。该算法在MS COCO和PASCAL VOC数据集上的mAP@0.5分别达到了57.5%和83.0%,充分说明了本文算法的先进性。 展开更多
关键词 目标检测 重参数化 注意力机制 特征融合 上采样 正负样本匹配
下载PDF
结合图对比学习的多图神经网络会话推荐方法
4
作者 卢敏 原子婷 《计算机科学》 CSCD 北大核心 2024年第5期54-61,共8页
会话推荐根据匿名用户短期内的交互数据预测下一个交互物品。针对会话中物品少、物品长尾分布等特性,现有基于图对比学习的会话推荐模型提出对会话内物品采用随机裁剪、扰动等方式构造正负样本。然而,上述随机退出策略进一步缩减较短会... 会话推荐根据匿名用户短期内的交互数据预测下一个交互物品。针对会话中物品少、物品长尾分布等特性,现有基于图对比学习的会话推荐模型提出对会话内物品采用随机裁剪、扰动等方式构造正负样本。然而,上述随机退出策略进一步缩减较短会话中的可用物品,使得会话更加稀疏,引起会话兴趣学习偏差。为此,提出了结合图对比学习的多图神经网络会话推荐方法。其核心思想是:在物品局部图、物品全局图等上提取融入物品局部和全局的高阶邻域物品表示,并生成物品级的会话表示,然后设计会话-会话图并学习会话级的会话表示,最后递归利用不同级别会话兴趣生成正负样本对,通过对比学习机制增强会话兴趣区分性。与退出策略相比,所提模型保留了完整的会话信息,实现了真正的数据扩充。在两个基准数据集上进行了大量实验,结果表明,该算法的推荐性能远优于主流基线方法。 展开更多
关键词 会话推荐 图对比学习 图神经网络 会话兴趣 正负样本
下载PDF
基于EfficientNet的无锚框目标检测模型
5
作者 卜子渝 杨哲 刘纯平 《计算机技术与发展》 2024年第1期37-43,共7页
目标检测是计算机视觉的热门研究方向之一,包含分类和定位两个任务。针对单阶段目标检测模型普遍存在的两个问题:训练时正负样本的不均衡以及锚框的设置需要人工干预,提出一种基于EfficientNet的无锚框目标检测模型(Anchor-free Efficie... 目标检测是计算机视觉的热门研究方向之一,包含分类和定位两个任务。针对单阶段目标检测模型普遍存在的两个问题:训练时正负样本的不均衡以及锚框的设置需要人工干预,提出一种基于EfficientNet的无锚框目标检测模型(Anchor-free Efficientnet-based Object Detector,AEOD)。AEOD先筛选出落在目标框中的特征点,再根据特征点所作的预测计算代价矩阵,在训练时基于代价矩阵为目标动态分配正负样本,从而达到平衡二者数量的目的。此模型通过特征图中的特征点直接预测目标的位置和形状,不仅省去了人工设置锚框的环节,还提高了可检出目标的数量。此外,可缩放的EfficientNet进一步提高了模型的泛化能力,使之可以接收多尺度的输入。在PASCAL VOC07+12数据集中,AEOD最高可以获得91.3%的平均精度(mAP),检测速度达到32.1 FPS,较其他主流的目标检测模型有显著提升。 展开更多
关键词 深度学习 计算机视觉 目标检测 正负样本分配算法 无锚框
下载PDF
基于SSD的不平衡样本车辆检测与识别 被引量:1
6
作者 马浩良 谢林柏 《计算机技术与发展》 2019年第12期135-140,共6页
为了实现在复杂环境,车辆样本不平衡情况下的实时车辆检测与识别,基于SSD算法搭建了车辆检测与识别的框架。针对车辆数据存在车型难易样本不均衡以及SSD方法存在的正负样本不平衡问题,在SSD引入改进的损失函数来挖掘难易样本,通过提高... 为了实现在复杂环境,车辆样本不平衡情况下的实时车辆检测与识别,基于SSD算法搭建了车辆检测与识别的框架。针对车辆数据存在车型难易样本不均衡以及SSD方法存在的正负样本不平衡问题,在SSD引入改进的损失函数来挖掘难易样本,通过提高难样本的学习比例来更好地识别样本较少的车辆类型。引入SSD级联的网络结构,在第一级SSD挖掘正负样本,在第二级SSD根据第一级SSD的指导过滤掉大量的负样本。构建了拥有7480幅图像,包含4种车辆类型的数据集对该方法进行验证。实验结果表明,基于改进SSD的方法提高了少样本车辆类型的准确率,使整体检测精度取得了90.0%的准确率。针对不均衡样本的车辆数据集有较好的通用性,适用于车辆检测与识别任务。 展开更多
关键词 车辆检测与识别 SSD 样本不平衡 难易样本挖掘 正负样本挖掘
下载PDF
基于改进U-Net模型的路面裂缝智能识别 被引量:1
7
作者 王二浩 《信息技术与信息化》 2023年第7期208-212,共5页
针对路面细小裂缝难以提取及样本不平衡问题,提出了一种基于改进U-Net模型的路面裂缝识别方法,以实现路面裂缝的精准识别。在下采样的过程中用残差块代替了原本网络的卷积块,减小网络复杂度以及改善网络过拟合现象,降低网络发生梯度爆... 针对路面细小裂缝难以提取及样本不平衡问题,提出了一种基于改进U-Net模型的路面裂缝识别方法,以实现路面裂缝的精准识别。在下采样的过程中用残差块代替了原本网络的卷积块,减小网络复杂度以及改善网络过拟合现象,降低网络发生梯度爆炸的概率;在编码器和解码器过渡阶段,引入空洞空间金字塔池化(atrous spatial pyramid pooling, ASPP)网络结构,增加网络的感受野,获取丰富的上下文信息;在编码器和解码器连接过程中,使用Attention Gate代替原来的直接相加操作,提取图像的低级特征,减少细节信息的损失;针对正负样本不平衡问题,提出了将交叉熵损失函数和Focal损失函数相结合的混合损失函数。实验结果表明,该网络模型具有较好的泛化能力,平均交并比(mean intersection over union,)评价指标达到81.24%。与传统算法相比,有效地提高了识别的准确度,减少了特征细节信息的损失,提高了对路面裂缝的检测能力。 展开更多
关键词 图像处理 图像识别 机器视觉 U-Net 正负样本不平衡
下载PDF
基于改进VGG16模型的人脸情绪识别预测研究 被引量:1
8
作者 岳洋 《电脑与信息技术》 2023年第3期6-8,共3页
人脸情绪识别是人类沟通交流中的重要一部分,所以正确识别人脸情绪可以保证高质量的沟通效果。文章提出改进的VGG16模型作用于人脸情绪识别的预测研究。改进模型引入正负例样本均衡化来解决数据集分布不均衡的现象,从而优化局部最小值... 人脸情绪识别是人类沟通交流中的重要一部分,所以正确识别人脸情绪可以保证高质量的沟通效果。文章提出改进的VGG16模型作用于人脸情绪识别的预测研究。改进模型引入正负例样本均衡化来解决数据集分布不均衡的现象,从而优化局部最小值和过拟合现象;为了提高模型训练的泛化能力,引入局部归一化对图像数据集进行处理;利用交叉验证机制提高模型训练的精确度,且修改VGG16模型第一个全连接层为全卷积层以适应任意大小的输入样本。最后采用IM-VGG16、VGG16和ResNet18模型分别对数据集进行6分类识别。实验表明,与ResNet18和VGG16模型相比,IM-VGG16模型具有更高的情绪识别准确度,其最终的识别准确度为89.92%。 展开更多
关键词 情绪识别 VGG16 局部归一化 正负样本均衡化 Oulu-CASIA数据集
下载PDF
基于交叉验证技术的KNN方法在降水预报中的试验 被引量:26
9
作者 曾晓青 邵明轩 +1 位作者 王式功 刘还珠 《应用气象学报》 CSCD 北大核心 2008年第4期471-478,共8页
利用2003—2005年4—9月国家气象中心T213的数值预报产品,通过动力诊断,从大量数值预报因子中提取不同层次、不同时效与降水关系较好的多个因子,使用K最邻近域(KNN)方法,制作不同代表站点的晴雨预报和大于或等于10 mm的降水预报试验。... 利用2003—2005年4—9月国家气象中心T213的数值预报产品,通过动力诊断,从大量数值预报因子中提取不同层次、不同时效与降水关系较好的多个因子,使用K最邻近域(KNN)方法,制作不同代表站点的晴雨预报和大于或等于10 mm的降水预报试验。在搜索K邻近域的过程中,考虑天气事件出现的概率不同,而分别求取有天气事件的正样本K+值和无天气事件的负样本K-值,使该方法选择的最邻近域中的K值取得更为合理。利用交叉验证的方法,对历史资料依次选取部分样本作为预报测试集,通过预测结果的检验评分,选取获得最大准确率和最大概括率的K+和K-作为最佳邻近域的组合。确定了最优K值后,反算历史样本,通过比较,得到某站出现降水天气事件的预报判别值,在一定程度上减少了预报的空报率。经过对2006年4—9月的预报试验,改进后的KNN方法使24,48 h的晴雨预报和大于或等于10 mm降水预报的TS评分大多数高于未改进前的,也高于T213模式本身的降水预报和MOS方法动力统计释用的降水预报,特别是克服了模式降水预报和MOS方法预报中空报率较高的现象,达到了较好的预报效果。 展开更多
关键词 K邻近域 正负样本 交叉验证 降水预报
下载PDF
改进的单类协同过滤推荐方法 被引量:4
10
作者 王鹏 景丽萍 《计算机科学与探索》 CSCD 2014年第10期1231-1238,共8页
在使用矩阵分解方法解决单类协同过滤问题时,数据的稀疏性以及负样本的缺乏会导致分解特征提取不明确,训练结果区分度低等诸多弊端。针对此问题提出了一种综合考虑物品相似度以及用户活跃度的正负样本选择算法,根据物品相似度向原始数... 在使用矩阵分解方法解决单类协同过滤问题时,数据的稀疏性以及负样本的缺乏会导致分解特征提取不明确,训练结果区分度低等诸多弊端。针对此问题提出了一种综合考虑物品相似度以及用户活跃度的正负样本选择算法,根据物品相似度向原始数据中添加一定正样本,同时根据用户活跃度向每个用户添加不同数量的负样本,从而减小了稀疏性和缺少负样本对使用矩阵分解方法解决单类协同过滤问题的影响。实验结果表明,该算法能够提高正负样本添加的准确性,减少矩阵稀疏性对单类协同过滤问题的影响,从而提高推荐的准确性。 展开更多
关键词 矩阵分解 单类协同过滤 稀疏性 正负样本
下载PDF
基于级联特征的随机森林运动目标跟踪算法 被引量:3
11
作者 陆兵 顾苏杭 《计算机技术与发展》 2019年第5期86-91,共6页
在运动目标检测与跟踪的过程中,实际环境下的目标旋转、目标遮挡以及光照变化等因素时常出现,而目标检测与跟踪的性能对这些复杂环境因素极为敏感,甚至易导致目标跟踪丢失。为了提高复杂环境下运动目标跟踪的鲁棒性和稳定性,提出一种基... 在运动目标检测与跟踪的过程中,实际环境下的目标旋转、目标遮挡以及光照变化等因素时常出现,而目标检测与跟踪的性能对这些复杂环境因素极为敏感,甚至易导致目标跟踪丢失。为了提高复杂环境下运动目标跟踪的鲁棒性和稳定性,提出一种基于级联特征的随机森林运动目标跟踪算法。该算法首先在保留目标关键信息的ASIFT特征中级联目标轮廓信息作为正样本,训练正样本生成随机森林分类后续序列图像特征;在此基础上将CamShift算法确定的目标搜索窗口中的非目标特征作为负样本,训练负样本并更新随机森林以改善特征分类性能;最后通过对正负样本特征加权计算目标搜索窗口质心以改善跟踪性能。实验结果表明,该算法能够在光照突变、遮挡以及目标旋转等复杂环境下有效地实现运动目标跟踪。 展开更多
关键词 复杂环境 级联特征 轮廓 随机森林 正负样本
下载PDF
基于改进 U-Net 网络的混凝土表面裂缝分割 被引量:3
12
作者 甘霖 谢爱荣 +2 位作者 燕阳 王威 熊仕勇 《重庆邮电大学学报(自然科学版)》 CSCD 北大核心 2021年第4期645-652,共8页
如何快速、高效、准确地像素级分割混凝土表面裂缝是当前研究的热点问题之一。在混凝土表面裂缝图像中裂缝面积远远小于正常路面面积,造成现有方法在这种正负样本分布不均问题中无法有效学习裂缝特征,最终分割效果较差。提出了一种将Fo... 如何快速、高效、准确地像素级分割混凝土表面裂缝是当前研究的热点问题之一。在混凝土表面裂缝图像中裂缝面积远远小于正常路面面积,造成现有方法在这种正负样本分布不均问题中无法有效学习裂缝特征,最终分割效果较差。提出了一种将Focal损失与活动轮廓模型相结合的新损失函数,针对裂缝面积较小且连续分布的特点,通过Focal损失加强模型在训练过程中对裂缝的敏感程度;使用活动轮廓模型保证分割结果在形态上与真实结果保持一致。同时在模型卷积块中添加批标准化层,提升激活效果,抑制模型训练过程中梯度震荡的产生。为了将本模型部署于车载检测器等嵌入式环境,在保证分割精度的同时对模型进行剪枝与量化,以实现压缩模型大小。试验结果表明,提出的方法能够有效学习裂缝特征,并能精确、高效地识别出混凝土图像中的裂缝。 展开更多
关键词 裂缝分割 卷积神经网络 批标准化 正负样本不均衡
下载PDF
基于改进SSD的机动车检测方法
13
作者 马浩良 谢林柏 《计算机与数字工程》 2020年第10期2405-2410,共6页
论文基于SSD搭建了机动车检测框架。应用聚类方法对机动车数据集进行数据挖掘以得到更符合车辆尺寸的先验包围框。针对机动车数据集的正负样本不平衡问题,论文引入级联SSD的网络结构。第一级SSD挖掘正负样本,第二级SSD根据第一级SSD预... 论文基于SSD搭建了机动车检测框架。应用聚类方法对机动车数据集进行数据挖掘以得到更符合车辆尺寸的先验包围框。针对机动车数据集的正负样本不平衡问题,论文引入级联SSD的网络结构。第一级SSD挖掘正负样本,第二级SSD根据第一级SSD预处理的指导来过滤掉大量的负样本。同时在级联SSD之间加入融合特征层,以提高特征提取能力。为了验证该方法,论文在DETRAC数据集上评估了改进的SSD网络,取得了69.96%的检测精度,比SSD提高了13.07%。从实验结果可以看出该方法具有较好的通用性,适用于机动车检测任务。 展开更多
关键词 机动车检测 SSD 聚类 正负样本不平衡 正负样本挖掘 DETRAC
下载PDF
一种基于流量的webshell通信检测方案 被引量:2
14
作者 周恒磊 《中国金融电脑》 2020年第6期60-64,共5页
随着互联网技术飞速发展,服务器安全问题日益严峻,威胁到银行业务运行与资金安全,检测服务器漏洞和后门、保证业务安全成为当务之急。webshell是通过web网页入侵服务器的脚本攻击工具,是一个asp或php木马后门,攻击者在入侵了一个网站后... 随着互联网技术飞速发展,服务器安全问题日益严峻,威胁到银行业务运行与资金安全,检测服务器漏洞和后门、保证业务安全成为当务之急。webshell是通过web网页入侵服务器的脚本攻击工具,是一个asp或php木马后门,攻击者在入侵了一个网站后,将这些后门文件放置在网站web目录中,与正常网页文件混在一起。目前检测webshell大多基于规则匹配代码内容,这样会存在大量误报和漏报,且对未知类型webshell变种无能为力。近年来,机器学习技术也得到webshell检测研究者青睐,但机器学习模型训练严重依赖样本的好坏,优质webshell正负样本很难采集到,模型特征难以设计和提取,导致现有模型很难做到准确有效。 展开更多
关键词 服务器安全 机器学习技术 规则匹配 网页文件 模型特征 正负样本 现有模型 银行业务
下载PDF
改进型FCOS目标检测算法 被引量:1
15
作者 陈金令 程茂凯 徐紫涵 《计算机科学》 CSCD 北大核心 2022年第S02期467-472,共6页
针对经典无锚框目标检测算法FCOS(Fully Constitutional One-Stage Object Detection)难以充分提取目标特征,位置与内容信息结合能力不足,正负样本区分不充分导致性能减弱等问题,提出了一种改进型FCOS目标检测算法。该方法首先在ResNet5... 针对经典无锚框目标检测算法FCOS(Fully Constitutional One-Stage Object Detection)难以充分提取目标特征,位置与内容信息结合能力不足,正负样本区分不充分导致性能减弱等问题,提出了一种改进型FCOS目标检测算法。该方法首先在ResNet50特征提取网络中加入可变形卷积模块与全局注意力模块,提高特征信息捕获能力;然后,将FPN特征金字塔与深层链路层相结合,构成多尺度特征融合模块,提升特征提取效果。最后,加入自适应划分正负样本模块,增强检验框的准确性以达到提高回归精度的效果,从而提升检测结果。为了测试算法的检测效果,分别使用了COCO数据集与VOC数据集进行实验。与原FCOS算法相比,所提算法在两个数据集上的平均精度分别提高了2.3%和1.8%,其中,对COCO数据集中的小目标检测的效果有明显提升。 展开更多
关键词 目标检测 可变形卷积 全局注意力 多尺度特征 特征金字塔 正负样本
下载PDF
基于TLD改进的目标跟踪算法 被引量:1
16
作者 张丽果 吴勇 张霞 《西安邮电大学学报》 2019年第2期72-77,共6页
为了提高跟踪学习检测算法的实时性和准确性,提出一种改进的目标跟踪算法。基于跟踪学习检测算法结构,将加速稳健特征作为输入,通过跟踪器和检测器生成正负样本集;利用正负样本集对支持向量机进行训练,得出权值和偏置对目标进行分类;综... 为了提高跟踪学习检测算法的实时性和准确性,提出一种改进的目标跟踪算法。基于跟踪学习检测算法结构,将加速稳健特征作为输入,通过跟踪器和检测器生成正负样本集;利用正负样本集对支持向量机进行训练,得出权值和偏置对目标进行分类;综合模块将跟踪结果与检测结果相结合,确定目标位置,并输出最终的目标图像。实验结果表明,改进算法处理速度为47帧/s,准确率可达94.0%。与跟踪学习检测算法相比,改进算法在实时性和准确性上均有所提升。 展开更多
关键词 目标跟踪 正负样本 支持向量机
下载PDF
基于注意力机制的行人属性识别
17
作者 吴杰 王怡涵 +1 位作者 侯米娜 全晓鹏 《电子世界》 2020年第2期26-28,共3页
行人属性识别是“AI+安防”战略的重要任务,在视频监控场景起着重要作用,基于此,本文提出了基于注意力机制(Attention Mechanism)的行人属性识别方法。本文主要采用残差网络进行模型设计,为了增加模型对特征的提取效果,在模型中加入了... 行人属性识别是“AI+安防”战略的重要任务,在视频监控场景起着重要作用,基于此,本文提出了基于注意力机制(Attention Mechanism)的行人属性识别方法。本文主要采用残差网络进行模型设计,为了增加模型对特征的提取效果,在模型中加入了注意力机制,并针对多标签分类的正负样本分类不平衡问题,对损失函数进行了改写。实验结果表明,该算法能够提高模型在属性识别方面的准确率。引言:行人属性识别的目的是在给定人物图像时挖掘目标人物的属性,与HOG、LBP等低级特征不同,行人属性可以看作是高级语义信息,对视角和场景变化等具有更高的鲁棒性。 展开更多
关键词 注意力机制 行人属性识别 多标签分类 正负样本 分类不平衡 损失函数 残差网络 监控场景
下载PDF
基于感受野增强和改进型损失函数的文本检测 被引量:3
18
作者 方承志 张子渊 李晨曦 《微电子学与计算机》 2021年第4期11-16,共6页
针对目前主流文本检测算法对多方向文本检测效果显著,但对曲线文本检测不佳的问题,提出一种基于感受野增强和改进型损失函数的文本检测算法,适用于曲线及任意方向文本.该算法基于TextSnake网络改进,加入ASPP网络增大感受野以获得在深层... 针对目前主流文本检测算法对多方向文本检测效果显著,但对曲线文本检测不佳的问题,提出一种基于感受野增强和改进型损失函数的文本检测算法,适用于曲线及任意方向文本.该算法基于TextSnake网络改进,加入ASPP网络增大感受野以获得在深层网络中更高层次的语义信息,并逐层进行特征融合提高对复杂背景下的文本检测精度;同时针对数据正负例样本不平衡问题在损失函数部分采用加权的Focal Loss,提高检测过程中难检测像素点的损失.该算法在Total-Text和ICDAR2015数据集上测试,实验结果表明该算法在准确率和F值上均有较好的表现. 展开更多
关键词 文本检测 感受野 ASPP网络 Focal Loss 正负样本不平衡
下载PDF
融合ViT与对比学习的面部表情识别
19
作者 崔鑫宇 何翀 +1 位作者 赵宏珂 王美丽 《中国图象图形学报》 CSCD 北大核心 2024年第1期123-133,共11页
目的面部表情识别是计算机视觉领域中的重要任务之一,而真实环境下面部表情识别的准确度较低。针对面部表情识别中存在的遮挡、姿态变化和光照变化等问题导致识别准确度较低的问题,提出一种基于自监督对比学习的面部表情识别方法,可以... 目的面部表情识别是计算机视觉领域中的重要任务之一,而真实环境下面部表情识别的准确度较低。针对面部表情识别中存在的遮挡、姿态变化和光照变化等问题导致识别准确度较低的问题,提出一种基于自监督对比学习的面部表情识别方法,可以提高遮挡等变化条件下面部表情识别的准确度。方法该方法包含对比学习预训练和模型微调两个阶段。在对比学习预训练阶段,改进对比学习的数据增强方式及正负样本对对比次数,选取基于Transformer的视觉Transformer(vision Transformer,ViT)网络作为骨干网络,并在ImageNet数据集上训练模型,提高模型的特征提取能力。模型微调阶段,采用训练好的预训练模型,用面部表情识别目标数据集微调模型获得识别结果。结果实验在4类数据集上与13种方法进行了比较,在RAF-DB(real-world affective faces database)数据集中,相比于Face2Exp(combating data biases for facial expression recognition)模型,识别准确度提高了0.48%;在FERPlus(facial expression recognition plus)数据集中,相比于KTN(knowledgeable teacher network)模型,识别准确度提高了0.35%;在AffectNet-8数据集中,相比于SCN(self-cure network)模型,识别准确度提高了0.40%;在AffectNet-7数据集中,相比于DACL(deep attentive center loss)模型,识别准确度略低0.26%,表明了本文方法的有效性。结论本文所提出的人脸表情识别模型,综合了对比学习模型和ViT模型的优点,提高了面部表情识别模型在遮挡等条件下的鲁棒性,使面部表情识别结果更加准确。 展开更多
关键词 表情识别 对比学习 自监督学习 TRANSFORMER 正负样本
原文传递
基于粗到细的多尺度单幅图像去雾方法
20
作者 王德文 陈威 苏攀 《智能系统学报》 2024年第5期1102-1110,共9页
为了解决现有图像去雾算法易出现细节纹理丢失、颜色失真或对非均匀浓雾处理不彻底的问题,提出一种基于粗到细的多尺度单幅图像去雾方法。首先,主干网络使用残差特征注意力模块对有雾图像进行特征提取;其次,将不同尺度的输入图像进行卷... 为了解决现有图像去雾算法易出现细节纹理丢失、颜色失真或对非均匀浓雾处理不彻底的问题,提出一种基于粗到细的多尺度单幅图像去雾方法。首先,主干网络使用残差特征注意力模块对有雾图像进行特征提取;其次,将不同尺度的输入图像进行卷积预处理,通过多尺度特征融合模块将预处理的浅层特征与主干网络融合;再次,将不同粒度的非对称特征进行有效融合;最后,将浅层信息与深层信息自适应混合输出,通过对比正则损失构建正负样本信息,使得去雾图像更接近无雾图像。实验结果表明,与已有代表性的去雾方法相比,提出的方法能对合成数据集与真实数据集进行有效去雾,在细节保留与色彩还原上优于对比方法。 展开更多
关键词 图像去雾 粗到细 多尺度特征融合 残差特征注意力 非对称特征融合 自适应混合 对比正则 正负样本
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部