改进字体自适应神经网络的图像字符编辑方法

Image character editing method based on improved font adaptive neural network

下载PDF

导出

摘要在当今国际化的社会,作为国际通用语言的英文字符及中文环境下的拼音字符出现在众多公共场合。当这些字符出现在图像中时,尤其在风格复杂的图像中时,难以直接对其进行编辑修改。针对上述问题,提出了一种改进文字生成网络(FANnet)的图像字符编辑方法。首先,利用基于直方图对比度(HC)的显著性检测算法改进自适应字符检测(CAD)模型,准确提取出用户所选择的图像字符;接着,根据FANnet,生成与源字符字体几乎一致的目标字符的二值图;然后,通过所提出的局部颜色分布(CDL)迁移模型,迁移源字符颜色至目标字符;最后,生成与源字符字体结构和颜色变化均高度一致的目标可编辑修改字符,从而达到字符编辑目的。实验结果表明,在MSRA-TD500、COCO-Text和ICDAR数据集上,所提方法的结构相似性(SSIM)、峰值信噪比(PSNR)和归一化均方根误差(NRMSE)平均值分别为0.7765、18.3211 dB和0.4358,相较于基于字体自适应神经网络的场景文本编辑器(STEFANN)算法分别提高了18.59%、14.02%和降低了2.97%,相较于多模态小样本字体迁移模型MC-GAN算法(输入1个字符时)分别提高了30.24%、23.92%和降低了4.68%;而且针对字体结构和颜色渐变分布比较复杂的实际场景图像字符,所提方法的编辑效果也较好。该方法可以应用于图像重利用、图像字符计算机自动纠错和图像文本信息重存储。 In current international society,as the international language,English characters appear in many public occasions,as well as the Chinese pinyin characters in Chinese environment.When these characters appear in the image,especially in the image with complex style,it is difficult to edit and modify them directly.In order to solve the problems,an image character editing method based on improved character generation network named Font Adaptive Neural network(FANnet)was proposed.Firstly,the salience detection algorithm based on Histogram Contrast(HC)was used to improve the Character Adaptive Detection(CAD)model to accurately extract the image characters selected by the user.Secondly,the binary image of the target character that was almost consistent with the font of the source character was generated by using FANnet.Then,the color of source characters were transferred to target characters effectively by the proposed Colors Distribute-based Local(CDL)transfer model based on color complexity discrimination.Finally,the target editable characters that were highly consistent with the font structure and color change of the source character were generated,so as to achieve the purpose of character editing.Experimental results show that,on MSRA-TD500,COCO-Text and ICDAR datasets,the average values of Structural SIMilarity(SSIM),Peak Signal-to-Noise Ratio(PSNR)and Normalized Root Mean Square Error(NRMSE)of the proposed method are 0.7765,18.3211 dB and 0.4358 respectively,which are increased by 18.59%,14.02%and decreased by 2.97%comparing with those of Scene Text Editor using Font Adaptive Neural Network(STEFANN)algorithm respectively,and increased by 30.24%,23.92%and decreased by 4.68%comparing with those of multi-modal few-shot font style transfer model named Multi-Content GAN(MC-GAN)algorithm(with 1 input character)respectively.For the image characters with complex font structure and color gradient distribution in real scene,the editing effect of the proposed method is also good.The proposed method can be applied to image reuse,image character computer automatic error correction and image text information restorage.

作者刘尚旺张新明张非 LIU Shangwang;ZHANG Xinming;ZHANG Fei(College of Computer and Information Engineering,Henan Normal University,Xinxiang Henan 453007,China;Engineering Lab of Intelligence Business and Internet of Things of Henan Province(Henan Normal University),Xinxiang Henan 453007,China)

机构地区河南师范大学计算机与信息工程学院智慧商务与物联网技术河南工程实验室(河南师范大学)

出处《计算机应用》 CSCD 北大核心 2022年第7期2227-2238,共12页 journal of Computer Applications

基金河南省科技攻关计划项目(192102210290) 河南省高等学校重点科研项目基础研究计划项目(21A520022)。

关键词字体自适应神经网络图像字符编辑直方图对比度显著性检测颜色迁移字体结构 Font Adaptive Neural network(FANnet) image character editing Histogram Contrast(HC) salience detection color transfer font structure

分类号 TP391.41 [自动化与计算机技术—计算机应用技术] TP183 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献2

1范一华,邓德祥,颜佳.基于色彩空间的最大稳定极值区域的自然场景文本检测[J].计算机应用,2018,38(1):264-269. 被引量：8
2张矿,朱远平.基于超像素融合的文本分割[J].计算机应用,2016,36(12):3418-3422. 被引量：2

二级参考文献4

1王春瑶,陈俊周,李炜.超像素分割算法研究综述[J].计算机应用研究,2014,31(1):6-12. 被引量：115
2Yingying ZHU,Cong YAO,Xiang BAI.Scene text detection and recognition： recent advances and future trends[J].Frontiers of Computer Science,2016,10(1):19-36. 被引量：21
3唐有宝,卜巍,邬向前.多层次MSER自然场景文本检测[J].浙江大学学报（工学版）,2016,50(6):1134-1140. 被引量：10
4张国和,黄凯,张斌,符欢欢,赵季中.最大稳定极值区域与笔画宽度变换的自然场景文本提取方法[J].西安交通大学学报,2017,51(1):135-140. 被引量：18

共引文献8

1刘宇,金伟正,范赐恩,邹炼.使用超像素分割与图割的网状遮挡物检测算法[J].计算机应用,2018,38(1):238-245. 被引量：1
2方承志,樊梦雅.基于改进型卷积神经网络和行特征的文本检测[J].微电子学与计算机,2019,36(8):77-82. 被引量：3
3白睿,徐友春,李永乐,李炯,谢枫.智能车道路场景数字字符识别技术[J].激光与光电子学进展,2019,56(19):203-211. 被引量：9
4陈超,张伟伟,徐军.一种基于三维视觉的移动机器人定位与建图方法[J].现代电子技术,2020,43(6):34-38. 被引量：5
5陈善雄,韩旭,林小渝,刘云,王明贵.基于MSER和CNN的彝文古籍文献的字符检测方法[J].华南理工大学学报（自然科学版）,2020,48(6):123-133. 被引量：4
6殷航,张智,王耀林.基于YOLOv3与MSER的自然场景中文文本检测研究与实现[J].计算机应用与软件,2021,38(10):168-172. 被引量：3
7庞宇,张焱杰,林金朝,蔡元奇.基于EAST改进的任意方向场景文本检测[J].重庆邮电大学学报（自然科学版）,2021,33(5):868-876. 被引量：1
8易尧华,梁正宇,胡越,卢利琼.基于级联CNN的自然场景文本检测[J].光学与光电技术,2019,17(2):26-33. 被引量：2

1杨林.媒体融合背景下新闻编辑的提升策略[J].传播力研究,2022,6(16):37-39.
2孙川永,彭友兵,刘志亮,郝赢玺,吴怡,东琦,郑永恒.梯度提升树算法在陕北风电场短期风电功率预测中的应用[J].电网与清洁能源,2022,38(4):124-128. 被引量：12
3刘海燕.跨文化意识在英语学习过程中的培养策略[J].英语画刊（高级）,2022(8):73-75.
4宋国英.初中英语写作教学的方法策略[J].成功密码（综合版）,2022(1):90-91.
5金哲昊.基于5G移动网络中边缘计算与计算迁移模型的研究[J].长江信息通信,2022,35(6):22-27. 被引量：3
6马孝琛,许鼎,张恒,刘鹏,马鹏程,冯睿,景在平,冯家烜.基因编辑在血管外科中的应用进展[J].血管与腔内血管外科杂志,2022,8(3):326-330.
7李昆鹏,张鹏程,上官宏,王燕玲,杨婕,桂志国.基于卷积神经网络的时频域CT重建算法[J].计算机应用,2022,42(4):1308-1316. 被引量：2
8周娟.初中英语学困生成因及转化策略研究[J].今天,2020(1):173-174.
9于晓丹.机械制图教学模库和网络系统的设计[J].辽宁工业大学学报（社会科学版）,2022,24(3):121-123. 被引量：1
10罗新兰,孙悦,刘利民,王立为,杨丽桃,高西宁.华北一作区马铃薯生长发育及产量对干旱胁迫响应的模拟研究——以武川县为例[J].干旱区地理,2022,45(3):867-878. 被引量：3

计算机应用

2022年第7期

浏览历史

内容加载中请稍等...

改进字体自适应神经网络的图像字符编辑方法

参考文献2

二级参考文献4

共引文献8

相关作者

相关机构

相关主题

浏览历史