期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
改进FCENet的自然场景文本检测算法
1
作者 周燕 廖俊玮 +2 位作者 刘翔宇 周月霞 曾凡智 《计算机工程与应用》 CSCD 北大核心 2024年第3期228-236,共9页
针对自然场景文本检测中由于背景复杂、尺度多变、形状弯曲等造成的检测难题,提出了一种改进FCENet(Fourier contour embedding network)的场景文本检测算法。该算法基于FCENet并引入了多尺度残差特征增强模块和多尺度注意力特征融合模... 针对自然场景文本检测中由于背景复杂、尺度多变、形状弯曲等造成的检测难题,提出了一种改进FCENet(Fourier contour embedding network)的场景文本检测算法。该算法基于FCENet并引入了多尺度残差特征增强模块和多尺度注意力特征融合模块。多尺度残差特征增强模块作为骨干网络顶层的残差分支,增强了特征金字塔结构自上而下的高层语义信息流动,提高了文本像素分类能力,有效减少误检现象。多尺度注意力特征融合模块使不同语义和尺度的特征能够更好地融合,结合自底向上的特征融合网络,有效避免文本过度分割并提高了弯曲文本的检测能力。实验结果表明,该方法在弯曲文本数据集CTW1500和Total-Text上的综合指标F值分别达到了86.2%和86.5%,相比原算法FCENet分别提升了1.1和0.7个百分点。 展开更多
关键词 自然场景文本检测 特征融合 特征增强 注意力机制 FCENet
下载PDF
基于增强多层次特征融合的自然场景文本检测
2
作者 周燕 韦勤彬 +3 位作者 廖俊玮 曾凡智 刘翔宇 周月霞 《佛山科学技术学院学报(自然科学版)》 CAS 2024年第3期1-13,共13页
针对自然场景图像中未聚焦小文本、复杂背景文本以及宽间距弯曲文本等造成的检测难题,提出了一种基于增强多层次特征融合的自然场景文本检测方法,该方法包括局部注意力特征增强(Local Attention Feature Enhanced,LAFE)模块和多层次增... 针对自然场景图像中未聚焦小文本、复杂背景文本以及宽间距弯曲文本等造成的检测难题,提出了一种基于增强多层次特征融合的自然场景文本检测方法,该方法包括局部注意力特征增强(Local Attention Feature Enhanced,LAFE)模块和多层次增强特征融合(Multi-level Enhanced Feature Fused,MEFF)模块。LAFE模块通过堆叠空洞卷积扩大网络感受野,结合通道与空间注意力来增强像素点分类能力;MEFF模块作为多层次增强特征连接分支,引入可变形卷积来增强特征图之间的信息融合。实验结果表明,所提方法在常用文本数据集上取得了较好的性能,其中,在ICDAR2015、Total-Text数据集上的综合指标F分别达到了88.1%和86.5%,相比原方法分别提升了0.8%和1.8%。 展开更多
关键词 自然场景文本检测 注意力机制 像素点分类 空洞卷积 特征融合
下载PDF
自然场景文本检测与端到端识别:深度学习方法 被引量:7
3
作者 周燕 韦勤彬 +4 位作者 廖俊玮 曾凡智 冯文婕 刘翔宇 周月霞 《计算机科学与探索》 CSCD 北大核心 2023年第3期577-594,共18页
自然场景图像中丰富的文本内容对场景理解有着重要意义,但自然场景文本往往具有极端横纵比、字体风格多变、背景及形状复杂等特点,而传统的文本检测与端到端识别方法存在着模型设计复杂、效率低、适用性不强且耗费成本高等缺点。随着深... 自然场景图像中丰富的文本内容对场景理解有着重要意义,但自然场景文本往往具有极端横纵比、字体风格多变、背景及形状复杂等特点,而传统的文本检测与端到端识别方法存在着模型设计复杂、效率低、适用性不强且耗费成本高等缺点。随着深度学习技术在图像领域的迅速发展,自然场景文本检测与端到端识别方法取得了突破性的进展,其性能和效率得到了显著提高。针对自然场景文本检测与端到端识别方法,梳理了近年来相关的研究工作。首先,根据文本框生成方式的不同,主要从回归候选框和像素分割两个角度来划分自然场景文本检测方法的基本思想,并对各类代表性的方法进行了详细叙述;其次,从端到端识别速度与解耦检测和识别任务的角度对端到端识别方法的技术发展路线进行了归纳总结;然后,介绍了常用的公开文本数据集,并在公开的文本数据集上对各类方法进行了性能对比;最后,对自然场景文本检测与端到端识别的主流研究方向进行了讨论,并阐述了其面临的挑战和未来的发展趋势。 展开更多
关键词 深度学习 自然场景 文本检测 端到端识别
下载PDF
面向智慧教育的知识追踪模型研究综述 被引量:12
4
作者 曾凡智 许露倩 +2 位作者 周燕 周月霞 廖俊玮 《计算机科学与探索》 CSCD 北大核心 2022年第8期1742-1763,共22页
知识追踪(KT)作为智慧教育领域的重点研究方向之一,利用智能辅导系统(ITS)提供的大量学习轨迹信息对学生进行建模,自动衡量学生的知识水平,为其提供个性化的学习方案,达到人工智能辅助教育的目的。全面回顾了面向智慧教育的知识追踪模... 知识追踪(KT)作为智慧教育领域的重点研究方向之一,利用智能辅导系统(ITS)提供的大量学习轨迹信息对学生进行建模,自动衡量学生的知识水平,为其提供个性化的学习方案,达到人工智能辅助教育的目的。全面回顾了面向智慧教育的知识追踪模型研究进展,三类具有代表性的模型分别为基于贝叶斯的知识追踪、基于Logistic模型的知识追踪以及近年来迅速发展并且表现出更好性能的深度学习知识追踪。基于贝叶斯的知识追踪分为贝叶斯知识追踪(BKT)以及结合个性化、知识相关性、节点状态与现实问题扩展的BKT模型;基于Logistic模型的知识追踪分为项目反应理论(IRT)与因子分析模型两类;基于深度学习的知识追踪分为深度知识追踪(DKT)及其改进模型以及设计网络结构与引入注意力机制。介绍了目前可供研究者们使用的国际公开教育数据集与常用的模型评估指标,比较和分析了不同类型方法的性能、特点以及应用场景,并对当前研究所存在的问题以及未来发展方向进行探讨与展望。 展开更多
关键词 知识追踪(KT) 智慧教育 贝叶斯网络 LOGISTIC模型 深度学习
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部