期刊文献+
共找到112篇文章
< 1 2 6 >
每页显示 20 50 100
Efficient Text Extraction Algorithm Using Color Clustering for Language Translation in Mobile Phone 被引量:2
1
作者 Adrián Canedo-Rodríguez Jung Hyoun Kim +5 位作者 Soo-Hyung Kim John Kelly Jung Hee Kim Sun Yi Sai Kiran Veeramachaneni Yolanda Blanco-Fernández 《Journal of Signal and Information Processing》 2012年第2期228-237,共10页
Many Text Extraction methodologies have been proposed, but none of them are suitable to be part of a real system implemented on a device with low computational resources, either because their accuracy is insufficient,... Many Text Extraction methodologies have been proposed, but none of them are suitable to be part of a real system implemented on a device with low computational resources, either because their accuracy is insufficient, or because their performance is too slow. In this sense, we propose a Text Extraction algorithm for the context of language translation of scene text images with mobile phones, which is fast and accurate at the same time. The algorithm uses very efficient computations to calculate the Principal Color Components of a previously quantized image, and decides which ones are the main foreground-background colors, after which it extracts the text in the image. We have compared our algorithm with other algorithms using commercial OCR, achieving accuracy rates more than 12% higher, and performing two times faster. Also, our methodology is more robust against common degradations, such as uneven illumination, or blurring. Thus, we developed a very attractive system to accurately separate foreground and background from scene text images, working over low computational resources devices. 展开更多
关键词 text Extraction color QUANTIZATION text BINARIZATION LANGUAGE TRANSLATION
下载PDF
现代化背景下抽纸产品包装材质与工艺技术研究
2
作者 杨东兴 黄晓飞 《造纸科学与技术》 2024年第3期65-70,共6页
受众群体对抽纸包装的满意程度影响抽纸产品的销售量,为适应和满足受众群体对抽纸包装的审美需求,从而增大抽纸产品销售量,提出现代化背景下抽纸产品包装材质与工艺技术研究,分别从图形与文字、色彩与材质、形态与结构三方面着手,分析... 受众群体对抽纸包装的满意程度影响抽纸产品的销售量,为适应和满足受众群体对抽纸包装的审美需求,从而增大抽纸产品销售量,提出现代化背景下抽纸产品包装材质与工艺技术研究,分别从图形与文字、色彩与材质、形态与结构三方面着手,分析现代化背景下抽纸产品包装材质与工艺要素,根据包装技术内涵,确定具体的包装材质与包装工艺,实现对抽纸产品的创新包装。随机选择100名路人作为研究对象,从颜色、图形、材质三方面实施调查,根据调查结果可知,大多数受众群体更喜欢依照现代化标准所制造出的抽纸包装,对该类型抽纸产品的购买欲望更强。因此依照现代化背景下的抽纸产品包装材质与工艺技术能够制造出更满足受众群体审美需求的抽纸包装,增加抽纸产品销售量。 展开更多
关键词 现代化背景 抽纸产品 图形文字 色彩材质 形态结构 包装材质 包装工艺
下载PDF
文本视觉密度与界面色调对老年人数字健康教育的影响研究
3
作者 彭程 易敏哲 +1 位作者 吴群 于航勇 《图学学报》 CSCD 北大核心 2024年第3期613-623,共11页
数字健康教育以丰富的内容和灵活的教育方式在提升百姓健康素养方面做出了巨大贡献,但由于老年群体认知能力和视觉水平的衰退,在接受数字教育时常面临信息难以识别、理解困难等问题。因此,以数字健康教育平台阅读界面为研究对象,分析了... 数字健康教育以丰富的内容和灵活的教育方式在提升百姓健康素养方面做出了巨大贡献,但由于老年群体认知能力和视觉水平的衰退,在接受数字教育时常面临信息难以识别、理解困难等问题。因此,以数字健康教育平台阅读界面为研究对象,分析了界面视觉设计对老年群体阅读效果和认知负荷的影响。研究中的自变量为文本视觉密度和界面色调,因变量为阅读绩效。2×2双因子实验结果表明:①低文本密度下的阅读理解效果优于标准密度;②冷色调的阅读理解效果优于暖色调;③文本视觉密度与界面色调在阅读时间上存在显著的交互作用。冷色调在标准密度下的阅读用时更少,而暖色调在低密度下的阅读用时更少。研究从健康教育内容传播的视角进行界面设计分析,丰富了老年数字阅读体验数据,探讨了文本视觉密度和色调在界面中的效果与交叉关系,为提升老年人数字教育效能提供了具体设计建议。 展开更多
关键词 数字健康教育 老年人学习 界面视觉设计 文本视觉密度 界面色调
下载PDF
基于视觉隐喻的动态公益海报设计研究
4
作者 钱璟 《色彩》 2024年第4期45-47,共3页
公益海报是表达公益理念的一种载体,动态公益海报则是在新媒体信息技术的基础上对平面公益海报的发展,其设计的主要目的是有效地的向受众宣传公益事业。本研究以视觉隐喻为理论基础,旨在探究如何利用视觉隐喻的方式使动态公益海报的设... 公益海报是表达公益理念的一种载体,动态公益海报则是在新媒体信息技术的基础上对平面公益海报的发展,其设计的主要目的是有效地的向受众宣传公益事业。本研究以视觉隐喻为理论基础,旨在探究如何利用视觉隐喻的方式使动态公益海报的设计更具表达效果及影响力。本文首先结合案例对动态海报中视觉隐喻的物象、色彩、文字三个方面进行分析,明确了视觉隐喻在动态海报中的应用形式和应用价值,并在此基础上构建基于视觉隐喻的动态公益海报设计路径,以“拒绝动物表演”为主题进行动态公益海报设计实践,旨在为动态公益海报设计提供新的设计思路和方法。 展开更多
关键词 视觉隐喻 物象 色彩 文字 动态公益海报
下载PDF
颜色组合对数字文本易读性的影响:基于眼动追踪实验的证据
5
作者 黄昌映 《图书馆研究与工作》 2024年第3期33-42,共10页
图书馆以数字文本呈现其资源内容,但文本应以何种颜色呈现才更具易读性,较少有实验证据。基于此,文章对16种常见的背景/字符颜色组合进行编码,通过89名实验参与者的眼动追踪实验,考察了不同颜色组合所呈现的数字文本的瞳孔动力学变化,... 图书馆以数字文本呈现其资源内容,但文本应以何种颜色呈现才更具易读性,较少有实验证据。基于此,文章对16种常见的背景/字符颜色组合进行编码,通过89名实验参与者的眼动追踪实验,考察了不同颜色组合所呈现的数字文本的瞳孔动力学变化,进而分析对阅读易读性的影响。研究发现,对于正极性数字文本,即深色字符/浅色背景的颜色组合,白色背景上的蓝色和红色字符具有较好的易读性;而对于负极性数字文本,即浅色字符/深色背景颜色组合,蓝色和绿色背景上的白色字符具有较好的易读性。这为图书馆采取何种颜色组合以呈现其数字文本内容,提供了实验证据。 展开更多
关键词 颜色组合 数字文本 易读性 眼动追踪实验
下载PDF
视网膜周边视野人工成像研究 被引量:1
6
作者 林衍旎 李沿橙 +5 位作者 葛松 周天航 董问天 刘子源 党卫民 许胜勇 《生物化学与生物物理进展》 SCIE CSCD 北大核心 2023年第12期3000-3009,共10页
目的对于中心视力受损的人群,新型人工视觉系统可以将简化后的图像投射到视网膜上黄斑区以外的区域,从而帮助他们利用周边视觉感知信息。本文探究周边视野的感知特征,为植入式光学人工视觉系统的图形编码设计提供依据。方法设计了探索... 目的对于中心视力受损的人群,新型人工视觉系统可以将简化后的图像投射到视网膜上黄斑区以外的区域,从而帮助他们利用周边视觉感知信息。本文探究周边视野的感知特征,为植入式光学人工视觉系统的图形编码设计提供依据。方法设计了探索周边视野感知特征的实验环境,向被试施加符号、数字、汉字的图案刺激,并控制刺激的大小、颜色组合、偏离角度、运动情况。用图形化的方法分析感知能力与各变量的关系。结果周边视野的感知能力随偏离角度增大而下降,其趋势分为两个阶段,且受颜色组合、大小的影响明显。结论研究结果提供了感知识别率较高的变量组合,为人工视觉系统的光学投影、眼内光学植入装置、特殊通信彩色符号编码开发等“人机结合”新技术提供重要的实验依据。 展开更多
关键词 植入 黄斑 周边视觉 图像识别 符号 文本和颜色
下载PDF
视觉传达在平面设计中的实践运用策略 被引量:1
7
作者 陈奕竺 赵丽丽 《鞋类工艺与设计》 2023年第24期25-27,共3页
在当代经济发展的背景下,平面设计作为一种新兴的艺术形态,已逐渐显现其重要性。该领域的核心在于对现有图像进行创新性的艺术处理,进而更好地符合现代审美标准,并最大化其商业价值。平面设计不仅是将现代设计理念融入视觉设计、文化进... 在当代经济发展的背景下,平面设计作为一种新兴的艺术形态,已逐渐显现其重要性。该领域的核心在于对现有图像进行创新性的艺术处理,进而更好地符合现代审美标准,并最大化其商业价值。平面设计不仅是将现代设计理念融入视觉设计、文化进步和元素综合的过程,更是一种增强设计的针对性、实用性和科学性的实践。此外,它对于指导设计的发展和提升设计效果具有不可忽视的作用。本文从视觉传达的视角出发,探讨了平面设计在艺术审美上的提升。对平面设计师来说,理解和适应这一发展趋势,以及深入探索其潜力,是当前该领域面临的关键任务。 展开更多
关键词 视觉传达 平面设计 色彩运用 文本处理
下载PDF
基于典籍文本挖掘的明清时期色彩知识研究 被引量:2
8
作者 徐娟 刘东华 刘宇 《图书馆论坛》 北大核心 2023年第3期42-53,共12页
色彩作为承载中国传统思想观念、文化习俗、社会礼制的重要载体,是传统文化不可或缺的部分,全面探析明清时期色彩的演变发展、思想流变及其文化内涵,对弘扬传统色彩文化具有重要意义。文章以明清时期的4本典籍文本为语料,提出一种基于... 色彩作为承载中国传统思想观念、文化习俗、社会礼制的重要载体,是传统文化不可或缺的部分,全面探析明清时期色彩的演变发展、思想流变及其文化内涵,对弘扬传统色彩文化具有重要意义。文章以明清时期的4本典籍文本为语料,提出一种基于文本挖掘进行明清时期色彩知识探究的研究方法,通过实体标注、实体关系抽取、色彩演变分析、色彩与社会阶层关系探究,探索明清时期色彩的演变特征,在此基础上揭示其文化内涵。与传统方法相比,文章通过量化的方式更加清晰地展现了明清时期色彩的演变特征;通过分析文本内容,进一步发现明清时期色彩等级随着政治、经济、染色工艺的变化,呈现出动态变化的特点。分析结果得到历史学、艺术学相关研究资料的佐证,验证了方法的有效性。 展开更多
关键词 色彩知识 文本挖掘 实体标注 演变特征 文化内涵
下载PDF
基于特征点的电影字幕提取
9
作者 路鑫 杨硕 《沈阳化工大学学报》 CAS 2023年第2期178-185,共8页
电影字幕作为电影图像的解释文本,可以帮助观众更好地理解电影剧情.针对在复杂背景下提取字幕困难的问题,提出基于特征点、颜色等多特征融合的电影中英文字幕同时提取算法.该算法首先通过帧间差分算法进行运动目标检测,提取电影图像中... 电影字幕作为电影图像的解释文本,可以帮助观众更好地理解电影剧情.针对在复杂背景下提取字幕困难的问题,提出基于特征点、颜色等多特征融合的电影中英文字幕同时提取算法.该算法首先通过帧间差分算法进行运动目标检测,提取电影图像中的字幕帧;然后通过运用ORB特征点检测技术、启发式筛选、形态学处理等方法定位字幕,对准确定位的文本区域通过颜色聚类提取字幕文本,实现文本分割;最后通过OCR文字识别技术实现对字幕帧文本的识别.实验结果表明:该方法将处理帧数减少到与字幕条数相同,将字幕提取的准确率提高到95%,提高了字幕检测效率,验证了多特征融合技术的有效性. 展开更多
关键词 字幕定位 文本提取 颜色聚类 多特征融合
下载PDF
基于色彩心理学导向下的景观设计研究 被引量:1
10
作者 刘馨瑶 李晓君 《设计》 2023年第3期91-93,共3页
为加强景观设计发展,丰富色彩心理学在景观设计中应用的理论。文章分析了人类心理行为的变化、空间形态的转换、区域文化展现和创新发展的技术与方法。总结出通过坚持以人为本的设计原则、注重景观空间结构变化、将景观设计与文化结合... 为加强景观设计发展,丰富色彩心理学在景观设计中应用的理论。文章分析了人类心理行为的变化、空间形态的转换、区域文化展现和创新发展的技术与方法。总结出通过坚持以人为本的设计原则、注重景观空间结构变化、将景观设计与文化结合、加强创新的角度,提升景观设计的方法和策略。该方法可为我国景观设计发展提供思路和方向。 展开更多
关键词 色彩心理学 景观设计 以人文本 空间结构 文化
下载PDF
浅析艺术元素在UI界面设计中的应用
11
作者 马媖泽 《辽宁师专学报(自然科学版)》 2023年第3期71-73,共3页
为满足互联网时代人们日益增加的审美需求,探究如何通过引入艺术元素来提升UI界面设计的美观性和交互性.分析了UI界面设计所涉及的各类艺术元素,在此基础上具体指出了版式设计、文字应用、色彩搭配、动画风格等艺术元素融入UI界面设计... 为满足互联网时代人们日益增加的审美需求,探究如何通过引入艺术元素来提升UI界面设计的美观性和交互性.分析了UI界面设计所涉及的各类艺术元素,在此基础上具体指出了版式设计、文字应用、色彩搭配、动画风格等艺术元素融入UI界面设计的要领.将艺术元素应用于UI界面设计,使得人机交互过程更加舒适,提升了用户体验感. 展开更多
关键词 艺术元素 用户界面 版式设计 文字应用 色彩搭配 动画风格
下载PDF
低照度图像自适应颜色校正与对比度增强算法 被引量:10
12
作者 李庆忠 赵峂 牛炯 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2019年第12期2121-2128,共8页
光照变化会造成图像颜色失真和清晰度的下降,为了使计算机视觉系统具有颜色恒常感知功能,提出了一种基于极限学习机和杜鹃搜索算法的图像颜色校正与对比度增强算法.首先对于输入图像,提取该图像的17维特征向量,并利用训练好的极限学习... 光照变化会造成图像颜色失真和清晰度的下降,为了使计算机视觉系统具有颜色恒常感知功能,提出了一种基于极限学习机和杜鹃搜索算法的图像颜色校正与对比度增强算法.首先对于输入图像,提取该图像的17维特征向量,并利用训练好的极限学习机神经网络自适应地选择适合该图像的最佳颜色恒常算法,并进行相应的颜色校正;然后,针对图像的亮度分量,利用杜鹃搜索算法自动确定亮度增强函数的最优参数,并进行相应的对比度增强.基于Funt数据集的实验结果表明,文中算法不仅能有效地完成图像颜色校正,还能自适应地提高图像的信息量和对比度,获得图像颜色和对比度的综合最佳视觉质量. 展开更多
关键词 颜色校正 极限学习机 对比度增强 杜鹃搜索算法 颜色恒常算法
下载PDF
青年人与老年人网页颜色偏爱研究 被引量:5
13
作者 李宏汀 王平飞 《心理科学》 CSSCI CSCD 北大核心 2012年第4期848-851,共4页
前人研究表明:年龄影响颜色偏爱,抽象色块颜色偏爱不同于具体产品颜色偏爱。因此本研究在抽象颜色偏爱实验基础上通过没计高保真网页研究青年人、老年人的网页颜色偏爱(包括主题色及其与文本色的搭配)。结果表明:(1)年龄、性别不会影响... 前人研究表明:年龄影响颜色偏爱,抽象色块颜色偏爱不同于具体产品颜色偏爱。因此本研究在抽象颜色偏爱实验基础上通过没计高保真网页研究青年人、老年人的网页颜色偏爱(包括主题色及其与文本色的搭配)。结果表明:(1)年龄、性别不会影响网页颜色偏爱。(2)浅蓝色、蓝色比较适合作为网页主题色。(3)网页主题采用不同颜色时,被试对文本色偏爱表现出较高的规律性,黑色、蓝色更适合作为网页文本色。 展开更多
关键词 颜色偏好 对偶比较法 主题色 文本色
下载PDF
教学课件文字与背景色彩搭配眼动实验研究 被引量:8
14
作者 孙庆兰 田水承 孙立群 《技术与创新管理》 2017年第3期274-278,共5页
教学课件的制作水平对教学效果有一定影响,和谐的文字及背景色彩搭配有利于吸引学生注意力,促进教学信息的传达,有效发挥其辅助引导作用。论文以某高校学生为被试对象,选用多媒体课件中最常使用的白色(255,255,255)、淡蓝色(220,250,252... 教学课件的制作水平对教学效果有一定影响,和谐的文字及背景色彩搭配有利于吸引学生注意力,促进教学信息的传达,有效发挥其辅助引导作用。论文以某高校学生为被试对象,选用多媒体课件中最常使用的白色(255,255,255)、淡蓝色(220,250,252)、黑色(0,0,0)、红色(255,0,0)、深蓝色(0,0,255)等几种颜色进行文字及背景搭配实验,运用Tobii T60XL型眼动仪记录被试的注视次数、注视时间等数据,实验研究教学课件中不同颜色文字与背景的色彩搭配效果。研究结果显示:2种常见白色(255,255,255)和淡蓝色(220,250,252)背景中,深蓝色(0,0,255)字体不易引起视觉疲累,注视时间较长,可以多用;红色(255,0,0)字体注视次数多,认知加工负荷大,易引起视觉疲累,可用于提醒、重点内容标识;黑色(0,0,0)字体在白色背景下易引起注意,在淡蓝色背景下注视时间最短,不宜较多使用。 展开更多
关键词 文字 背景 色彩 眼动
下载PDF
基于文字RGB颜色变化的脆弱型文本数字水印技术 被引量:21
15
作者 唐承亮 肖海青 向华政 《计算机工程与应用》 CSCD 北大核心 2005年第36期6-8,共3页
给出了一种利用文本字体颜色的变化来进行文本认证的方案。通过提取文字的特征,结合用户密钥和哈希技术,该方案将文本信息和用户信息嵌入到待传输文本中。不需要额外传送文本特征值;接受端通过水印的提取以及特征提取等步骤,可以判断文... 给出了一种利用文本字体颜色的变化来进行文本认证的方案。通过提取文字的特征,结合用户密钥和哈希技术,该方案将文本信息和用户信息嵌入到待传输文本中。不需要额外传送文本特征值;接受端通过水印的提取以及特征提取等步骤,可以判断文本的完整性和文本的可信性。进一步的,可以定位文本篡改发生的位置。理论分析和实验结果都表明,对于通常的攻击,如果文字级联长度为m,则该方案检测和定位篡改的概率达到了1-1/(26)m。 展开更多
关键词 脆弱水印 篡改检测 篡改定位 文本认证 字体颜色
下载PDF
综合语义与颜色特征的图像检索技术研究 被引量:4
16
作者 袁薇 高淼 《微电子学与计算机》 CSCD 北大核心 2006年第1期36-39,44,共5页
针对多媒体搜索引擎系统中的图像检索技术,本文提出了应用图像的高层语义特征和底层颜色特征作为图像检索的综合指标,将图像文本和视觉信息融合起来,给出了一种综合语义和颜色特征的图像检索系统的体系架构,以填补多媒体底层特征和高层... 针对多媒体搜索引擎系统中的图像检索技术,本文提出了应用图像的高层语义特征和底层颜色特征作为图像检索的综合指标,将图像文本和视觉信息融合起来,给出了一种综合语义和颜色特征的图像检索系统的体系架构,以填补多媒体底层特征和高层语义之间的差异,并在此基础上提出了相关算法,使图像检索能够满足用户的需求,提高图像检索的效率和精度。 展开更多
关键词 多媒体 搜索引擎 图像检索 语义 颜色特征
下载PDF
基于梯度与粗糙度的视频文本检测与定位 被引量:9
17
作者 袁海东 马华东 黄晓冬 《电子学报》 EI CAS CSCD 北大核心 2008年第8期1660-1664,F0003,共6页
本文提出一种视频文本检测和定位的新方法.利用差分图像像素行(列)的粗糙度特征和自适应阈值,实现对文本的快速检测.为进一步实现对文本的精确检测与定位,引入彩色梯度的方向信息,仅计算视频画面中少量关键特征点的梯度幅值,能够有效抑... 本文提出一种视频文本检测和定位的新方法.利用差分图像像素行(列)的粗糙度特征和自适应阈值,实现对文本的快速检测.为进一步实现对文本的精确检测与定位,引入彩色梯度的方向信息,仅计算视频画面中少量关键特征点的梯度幅值,能够有效抑制图像复杂背景的干扰,同时显著提高了算法的效率.本方法对不同的视频画面质量、不同复杂程度的背景以及不同外观的文本是鲁棒的.通过对各类视频节目的大量实验验证了本文方法的有效性. 展开更多
关键词 视频文本检测 定位 彩色图像梯度 粗糙度
下载PDF
一种针对汉字特点的场景图像中文文本定位算法 被引量:5
18
作者 张伟伟 汤光明 +1 位作者 孙怡峰 苏伟 《信息工程大学学报》 2014年第6期729-736,共8页
针对场景图像中的中文文本定位问题,提出一种基于汉字特点的中文文本定位算法。算法首先对图像提取MSER(最大稳定极值区域),然后通过剪枝策略对存在嵌套关系的MSER进行取舍,得到候选笔画区域;计算候选区域的笔画宽度,作为闭操作的结构... 针对场景图像中的中文文本定位问题,提出一种基于汉字特点的中文文本定位算法。算法首先对图像提取MSER(最大稳定极值区域),然后通过剪枝策略对存在嵌套关系的MSER进行取舍,得到候选笔画区域;计算候选区域的笔画宽度,作为闭操作的结构元参数并对图像进行动态闭操作,以消除同一汉字笔画之间的间隙,得到候选汉字区域;利用结构和角点规则过滤掉非汉字区域,并用颜色规则聚类得到候选文本区域;最后基于图像文本大都横向或纵向排列的规律,通过分析各组连通区的分布情况,对候选文本区域进行确定。在测试数据集上的实验表明,算法对于汉字与背景色差明显、汉字成行或成列排列等场景文本具有定位稳定性和准确性。 展开更多
关键词 闭操作 文本定位 颜色聚类
下载PDF
基于颜色聚类和多帧融合的视频文字识别方法 被引量:22
19
作者 易剑 彭宇新 肖建国 《软件学报》 EI CSCD 北大核心 2011年第12期2919-2933,共15页
提出一种基于颜色聚类和多帧融合的视频文字识别方法,首先,在视频文字检测模块,综合考虑了文字区域的两个显著特征:一致的颜色和密集的边缘,利用近邻传播聚类算法,根据图像中边缘颜色的复杂程度,自适应地把彩色边缘分解到若干边缘子图中... 提出一种基于颜色聚类和多帧融合的视频文字识别方法,首先,在视频文字检测模块,综合考虑了文字区域的两个显著特征:一致的颜色和密集的边缘,利用近邻传播聚类算法,根据图像中边缘颜色的复杂程度,自适应地把彩色边缘分解到若干边缘子图中去,使得在各个子图中检测文字区域更为准确.其次,在视频文字增强模块,基于文字笔画强度图过滤掉模糊的文字区域,并综合平均融合和最小值融合的优点,对在不同视频帧中检测到的、包含相同内容的文字区域进行融合,能够得到背景更为平滑、笔画更为清晰的文字区域图像.最后,在视频文字提取模块,通过自适应地选取具有较高文字对比度的颜色分量进行二值化,能够取得比现有方法更好的二值化结果;另一方面,基于图像中背景与文字的颜色差异,利用颜色聚类的方法去除噪声,能够有效地提高文字识别率.实验结果表明,该方法能够比现有方法取得更好的文字识别结果. 展开更多
关键词 视频文字识别 基于颜色的聚类 多帧融合 视频检索 噪声去除
下载PDF
基于自适应色彩聚类和上下文信息的自然场景文本检测 被引量:2
20
作者 邹北骥 郭建京 +2 位作者 朱承璋 杨文君 徐子雯 《电子学报》 EI CAS CSCD 北大核心 2018年第6期1436-1444,共9页
自然场景文本检测是图像内容分析和理解的重要前提.本文提出一种基于自适应色彩聚类和上下文信息分析的方法,用于检测自然场景图像文本.首先,将层次聚类和参数自学习策略结合,设计一种自适应色彩聚类方法,提取图像中的候选字符.该自适... 自然场景文本检测是图像内容分析和理解的重要前提.本文提出一种基于自适应色彩聚类和上下文信息分析的方法,用于检测自然场景图像文本.首先,将层次聚类和参数自学习策略结合,设计一种自适应色彩聚类方法,提取图像中的候选字符.该自适应色彩聚类方法能针对不同图像自动学习权重阈值,有较好的字符召回率.然后,利用文本中字符成行出现的性质,设计一种基于上下文信息的字符验证策略,既能保证较高字符召回率,也能有效移除非文本字符.最后,合并字符构建文本行,并通过后处理得到文本检测结果.在ICDAR2013公共数据集上的实验结果表明:本文分别获得74.17%的召回率,83.40%的准确率和78.52%的F得分.与其他文本检测方法相比,本文获得了较好的文本检测性能,说明本文方法的优越性. 展开更多
关键词 自然场景文本检测 自适应色彩聚类 上下文信息 自学习策略
下载PDF
上一页 1 2 6 下一页 到第
使用帮助 返回顶部