-
题名融合通道注意力机制的非规则文本识别模型
- 1
-
-
作者
李正岩
李嵩爽
潘昱辰
邓悦
钱夔
-
机构
南京工程学院自动化学院
-
出处
《南京工程学院学报(自然科学版)》
2024年第2期7-13,共7页
-
基金
江苏省自然科学青年基金项目(BK20210931)
江苏省产学研合作项目(BY2021023)
南京工程学院大学生科技创新基金项目(TB202417016)。
-
文摘
针对自然场景下文本字体倾斜、背景复杂导致文本识别困难问题,本文提出一种融合通道注意力机制的非规则文本检测识别模型.首先,应用CRAFT算法与图像后处理技术以字符中心和相邻字符中心概率检测非规则文本区域,实现检测区域图像背景替换、倾斜文本旋转矫正以及文本行提取;然后构建融合通道注意力机制SENet的文本识别模型SE-CRNN,通过自适应学习通道权重与数据增强等手段实现复杂背景的文本识别.试验结果表明,该模型在文本倾斜和灰度不一致的情况下仍具有较高的文本识别精度,SE-CRNN模型在测试集上的识别准确率达到84.2%.
-
关键词
文本识别
图像处理
注意力机制
数据增强
-
Keywords
text detection
image post-processing
attention mechanism
data enhancement
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
-
-
题名基于ROS网桥的跨平台网络化人机交互系统设计
被引量:1
- 2
-
-
作者
徐浩
鞠文清
钱夔
潘昱辰
朱晟宇
李嵩爽
-
机构
南京工程学院自动化学院
-
出处
《测控技术》
2023年第12期18-23,共6页
-
基金
江苏省自然科学青年项目(BK20210931)
江苏省产学研合作项目(BY2021023)
+1 种基金
江苏省高等学校自然科学研究面上项目(20KJB510049)
大学生科技创新基金项目(TB202317002)。
-
文摘
针对传统机器人控制系统存在的跨平台开发和部署问题,提出了一种基于ROS(Robot Operating System,机器人操作系统)网桥的跨平台网络化人机交互系统。构建以Node.js框架为服务后端,Boot-strap框架和jQuery组件为交互前端的网络化控制系统架构,通过ROS网桥技术实现万维网(World Wide Web,WWW)端和机器人端的跨平台数据互通,并按需进行机器人控制服务化调用。实验结果表明,该控制系统能够实现机器人端环境感知、状态监视、远程控制等功能,支持个人电脑(Personal Com-puter,PC)端、移动端等泛平台人机交互,具有可模块化敏捷开发、移植扩展性强等优点。
-
关键词
移动机器人
机器人操作系统
人机交互
跨平台
服务化
-
Keywords
mobile robot
robot operating system
human-computer interaction
cross-platform
servitization
-
分类号
TP242.6
[自动化与计算机技术—检测技术与自动化装置]
-