期刊文献+
共找到20篇文章
< 1 >
每页显示 20 50 100
非结构化表格文档数据抽取与组织模型研究 被引量:12
1
作者 张元鸣 陈苗 +2 位作者 陆佳炜 徐俊 肖刚 《浙江工业大学学报》 CAS 北大核心 2016年第5期487-494,共8页
针对现有文档数据抽取方法无法抽取多值属性且灵活性不高的问题,提出了一种面向非结构化表格文档的数据抽取方法与组织模型.在分析文档结构特征和数据流特征的基础上,定义了数据流生成基本规则,给出了一个基于规则的数据抽取流程,包括... 针对现有文档数据抽取方法无法抽取多值属性且灵活性不高的问题,提出了一种面向非结构化表格文档的数据抽取方法与组织模型.在分析文档结构特征和数据流特征的基础上,定义了数据流生成基本规则,给出了一个基于规则的数据抽取流程,包括逻辑结构抽取、文档预处理、数据抽取和数据组织等主要步骤,设计实现了单值区域与多值区域数据抽取算法;从文档中抽取的数据被组织成适合于MapReduce分析的结构化数据模型,该模型能够为大数据分析提供模型支持.实验结果表明:该抽取方法具有较高的准确率与召回率,数据组织模型也能够有效地支持大数据分析. 展开更多
关键词 非结构化表格文档 数据抽取 结构化数据模型 数据分析
下载PDF
接触式图像传感器应用于表格文档信息处理 被引量:4
2
作者 刘建胜 汪同庆 +2 位作者 王贵新 居琰 彭健 《传感器技术》 CSCD 北大核心 2002年第5期51-54,共4页
表格文档在日常生活中运用十分广泛 ,它应用于人口普查、银行票据、各类报表等领域 ,对这类文档进行计算机自动处理具有重要的现实意义。表格文档信息处理系统主要由文档原始图像获取、文档结构提取和填写信息识别等部分组成。在分析了... 表格文档在日常生活中运用十分广泛 ,它应用于人口普查、银行票据、各类报表等领域 ,对这类文档进行计算机自动处理具有重要的现实意义。表格文档信息处理系统主要由文档原始图像获取、文档结构提取和填写信息识别等部分组成。在分析了国内外表格文档信息自动录入系统的优缺点后 ,采用一种基于接触式图像传感器 (CIS)摄取表格文档的原始图像信号 ,利用硬件获得了高质量的图像信号。采用光学字符识别 (OCR)技术对填写的表格文档信息进行识别。该表格文档信息处理系统具有对表格文档的纸张和填写的要求低和识别准确度高的特点。 展开更多
关键词 接触式图像传感器 表格文档 信息处理
下载PDF
基于ARX编程开发的轧机表格文档CAD系统 被引量:1
3
作者 张利 王中杰 +2 位作者 宋叔尼 王国栋 刘相华 《机电工程》 CAS 1999年第1期1-2,共2页
通过对VisualC++5.0及其在AutoCAD中应用的研究,提出了在AutoCAD环境中实现汉化的图纸表格CAD作业的可行性,并结合东北大学国家重点实验室自行开发的四辊厚板可逆轧机CAD系统,利用当前较流行的Au... 通过对VisualC++5.0及其在AutoCAD中应用的研究,提出了在AutoCAD环境中实现汉化的图纸表格CAD作业的可行性,并结合东北大学国家重点实验室自行开发的四辊厚板可逆轧机CAD系统,利用当前较流行的AutoCADR14绘图系统和ARX编程,实现了在微机环境中的图纸表格CAD作业。 展开更多
关键词 轧机 表格文档 CAD系统 ARX编程 中厚板轧机
下载PDF
军械保障阵地设施表格文档信息标准化
4
作者 盖炳良 唐金国 孙媛 《四川兵工学报》 CAS 2011年第9期98-101,共4页
军械保障阵地设施文档涉及大量表格信息,将表格信息结构化,能提高信息检索与再利用的效率。面向军械保障实际应用,借鉴相关标准,提出了设施表格文档信息的通用模型和信息结构模型。通过信息描述模型和表示方法确立了设施表格文档信息标... 军械保障阵地设施文档涉及大量表格信息,将表格信息结构化,能提高信息检索与再利用的效率。面向军械保障实际应用,借鉴相关标准,提出了设施表格文档信息的通用模型和信息结构模型。通过信息描述模型和表示方法确立了设施表格文档信息标准化方法。 展开更多
关键词 阵地设施 表格文档 信息标准化 通用模型
下载PDF
表格文档自动识别的研究与实现
5
作者 邓为 《商场现代化》 北大核心 2005年第1S期115-115,共1页
表格识别是模式识别的一个分支领域,所以它具有模式识别的一些基本特征。本文描述的表格识别系统是建立在模式识别系统、图像处理系统、文字识别系统、条码识别系统之上的一个综合系统,它着重将这些不同领域技术有机地结合在一起,使计... 表格识别是模式识别的一个分支领域,所以它具有模式识别的一些基本特征。本文描述的表格识别系统是建立在模式识别系统、图像处理系统、文字识别系统、条码识别系统之上的一个综合系统,它着重将这些不同领域技术有机地结合在一起,使计算机能够自动高效地处理表格信息。 展开更多
关键词 表格文档 自动识别
下载PDF
表格型文档自动识别系统及其应用 被引量:2
6
作者 张艳 郁生阳 +2 位作者 张重阳 娄震 杨静宇 《系统仿真学报》 CAS CSCD 北大核心 2009年第10期2916-2920,共5页
随着文档影像系统的广泛应用,文档图像自动处理已成为当前的一个研究热点。对表格型文档自动识别系统中的若干关键技术进行了研究。首先,在版面分析中,提出了基于框线检测的文档分类方法;其次,根据表格型文档图像的特点,介绍了相应的识... 随着文档影像系统的广泛应用,文档图像自动处理已成为当前的一个研究热点。对表格型文档自动识别系统中的若干关键技术进行了研究。首先,在版面分析中,提出了基于框线检测的文档分类方法;其次,根据表格型文档图像的特点,介绍了相应的识别域提取、框线去除以及手写字符串分割方法;最后,在手写数字识别部分,设计了一种基于形状上下文特征和梯度特征的组合识别方法。最后将该系统应用于银行票据小写金额识别,通过真实表格型票据进行仿真实验,证明了系统的有效性,系统识别率达到了实用的水平。 展开更多
关键词 表格文档 框线检测 框线去除 文档图像分析 手写数字识别
下载PDF
Word文档表格信息入库方法研究
7
作者 姜法明 张瑜伟 《现代测绘》 2011年第2期61-61,64,共2页
在全国第二次土地调查的过程中,部份地区协议书、地调表的制作是采用Word文档,其成果资料整洁美观,保存安全性高。通过专用工具开发,文档信息可以自动连接图形文件和数据库,减少了出错环节,保证了调查信息和数据库的一致性,提高了工作... 在全国第二次土地调查的过程中,部份地区协议书、地调表的制作是采用Word文档,其成果资料整洁美观,保存安全性高。通过专用工具开发,文档信息可以自动连接图形文件和数据库,减少了出错环节,保证了调查信息和数据库的一致性,提高了工作效率。 展开更多
关键词 农村宅基地调查 工具开发 文档表格信息入库
下载PDF
基于最优坐标系的表格版面分析
8
作者 吕亚军 陈继荣 《计算机仿真》 CSCD 2007年第4期211-215,共5页
表格文档在日常生活中运用十分广泛,对这类文档进行计算机自动处理能提高文档处理速度和准确度,具有重要的现实意义。表格文档版面结构提取是文档信息处理自动化的核心。由于表格文档图像包含印刷体和手写体字符、图像、污损、噪声和一... 表格文档在日常生活中运用十分广泛,对这类文档进行计算机自动处理能提高文档处理速度和准确度,具有重要的现实意义。表格文档版面结构提取是文档信息处理自动化的核心。由于表格文档图像包含印刷体和手写体字符、图像、污损、噪声和一定的倾斜,在其影响下,正确的提取文档的版面结构是比较困难的。在总结国内外表格文档版面结构提取方法的基础上,提出了一种基于最优坐标系的版面结构提取方法,该方法与其它方法相比具有很强的抗干扰能力和文档版面定义灵活方便的特点。 展开更多
关键词 版面分析 表格文档处理 最优坐标系 表格识别
下载PDF
表格型票据图像手写体特殊符号的混合检测算法 被引量:1
9
作者 宋晓宁 刘梓 +2 位作者 於东军 杨静宇 陈天雨 《南京理工大学学报》 EI CAS CSCD 北大核心 2012年第6期909-914,共6页
为了解决表格型票据图像定位区域中手写体勾符号的判定问题,该文提出一种混合检测算法并应用在表格型票据图像处理中。提出基于稀疏表示的形态学链码跟踪算法从而准确标记票据的外围轮廓。提出一种最优轴投影测度算法,完成外围轮廓角点... 为了解决表格型票据图像定位区域中手写体勾符号的判定问题,该文提出一种混合检测算法并应用在表格型票据图像处理中。提出基于稀疏表示的形态学链码跟踪算法从而准确标记票据的外围轮廓。提出一种最优轴投影测度算法,完成外围轮廓角点坐标检测并对其进行倾角修正。根据标准模板库中的框线特征进行模板匹配,确定特殊字符所在的定位区域,利用空间卷积算法获得勾符号的判断标准。该文算法对表格型票据图像处理具有通用性,并能有效降低大规模多种类票据内容的定位与识别难度。实际银行支票图像测试证明了算法的有效性和鲁棒性。 展开更多
关键词 票据图像处理 表格文档 手写体 特殊符号 目标检测 稀疏表示
下载PDF
一种基于“标文通”电子表格的服务及其应用
10
作者 高晓光 李宁 吴来云 《北京信息科技大学学报(自然科学版)》 2010年第S2期138-142,共5页
对于B/S模式的应用,在.NET平台上实现了一个基于"标文通"电子表格文档的在线投票系统。与传统的前台Web浏览器浏览HTML网页、后台数据库存储数据的模式不同,这里采用了前台Web界面+办公软件插件,后台Web Service接口+"... 对于B/S模式的应用,在.NET平台上实现了一个基于"标文通"电子表格文档的在线投票系统。与传统的前台Web浏览器浏览HTML网页、后台数据库存储数据的模式不同,这里采用了前台Web界面+办公软件插件,后台Web Service接口+"标文通"电子表格文档的模式,既借助办公软件的表现能力简化了前台用户数据视图的设计,又有效实现了平台无关性以及办公软件无关性。 展开更多
关键词 标文通 电子表格文档 投票系统 WEB SERVICE
下载PDF
Excel表格打印也有大学问
11
作者 独上西楼 《电脑知识与技术(经验技巧)》 2010年第6期40-41,共2页
在我们使用EXCEL打印表格文档的过程中,很多朋友习惯于用增加行数或列数的方法,以保证打印的表格处于打印纸中央或是适应调整纸型后的变化。其实无需那么麻烦,只要你掌握了下面几个小技巧,EXCEL表格打印将会变得很轻松。
关键词 表格打印 EXCEL EXCEL 大学 表格文档 打印纸 列数 行数
下载PDF
Word2007中快速完成大量表格数据汇总
12
《计算机与网络》 2010年第20期23-23,共1页
汇集表格文件 回收的技术人员登记表都是一个文件一张表的情况,也就是说上百人就得有上百个表格文档。我们得先把所有表格汇集到同一文件中才好汇总,这可以通过Word的插入文件功能实现。
关键词 表格文件 数据汇总 技术人员 表格文档 WORD
下载PDF
Word文档网格你用了吗
13
作者 王昌红 《电脑知识与技术(经验技巧)》 2014年第9期35-35,共1页
大家在排版和打印文档时,会碰到段落设置不听话的时候;打印多行表格文档时,预览没有问题,可打印时出现跳行等现象(见图1)。其实这跟Word的文档网格设置有关。下面以Word 2013为例看看文档网格的应用吧!
关键词 WORD文档 网格设置 打印文档 表格文档 预览
下载PDF
基于DSP的版面分析和OCR识别的原理及实现 被引量:5
14
作者 刘建胜 汪同庆 +1 位作者 王贵新 居琰 《仪器仪表学报》 EI CAS CSCD 北大核心 2003年第6期577-580,共4页
随着光学字符识别 (OCR)技术广泛应用于人口普查、银行票据、各类报表等表格文档自动处理中 ,大大提高了表格文档的处理效率和精度 ,节省了人力物力和财力。 OCR识别系统通常采用扫描仪获取表格文档的原始图像 ,由计算机进行版面分析和... 随着光学字符识别 (OCR)技术广泛应用于人口普查、银行票据、各类报表等表格文档自动处理中 ,大大提高了表格文档的处理效率和精度 ,节省了人力物力和财力。 OCR识别系统通常采用扫描仪获取表格文档的原始图像 ,由计算机进行版面分析和字符识别。这里提出了基于 DSP的 OCR识别仪 ,采用接触式图像传感器摄取文档的原始图像 ,数字信号处理器(DSP)实现版面分析和字符识别。将识别结果输入到计算机中进行后处理。这样一台计算机可以联结多台识别仪 ,大大降低了 OCR识别系统的成本 。 展开更多
关键词 光学字符识别 DSP 版面分析 OCR 表格文档自动处理
下载PDF
一种移动式“标文通”浏览器的设计与实现
15
作者 李杨 李宁 张烨 《北京信息科技大学学报(自然科学版)》 2010年第S2期150-155,160,共7页
采用JavaME和XML技术,提取"标文通"格式文档内容,在手机上实现对文字处理文档的浏览。讨论了"标文通"手机浏览器的设计和实现,包括开发背景,设计原理和模块结构。使手机等移动设备上读取"标文通"格式的... 采用JavaME和XML技术,提取"标文通"格式文档内容,在手机上实现对文字处理文档的浏览。讨论了"标文通"手机浏览器的设计和实现,包括开发背景,设计原理和模块结构。使手机等移动设备上读取"标文通"格式的文档成为可能,对于"标文通"格式文档的应用有一定的意义。 展开更多
关键词 标文通 电子表格文档 投票系统 WEB SERVICE
下载PDF
基于游程元的纸印品图像的直线特征提取
16
作者 于秋则 苏建忠 +2 位作者 田金文 柳健 王新赛 《红外与激光工程》 EI CSCD 北大核心 2002年第4期305-309,共5页
针对纸印品中直线特征提取这一问题 ,给出游程元、中心游程元、最大邻域搜索区域等定义 ,并在此基础上提出了一种基于游程元提取与归并的直线特征提取算法 ,给出了基于此算法的横格纸与方格纸中直线特征提取实验结果并对此算法的复杂性... 针对纸印品中直线特征提取这一问题 ,给出游程元、中心游程元、最大邻域搜索区域等定义 ,并在此基础上提出了一种基于游程元提取与归并的直线特征提取算法 ,给出了基于此算法的横格纸与方格纸中直线特征提取实验结果并对此算法的复杂性进行了分析。实验结果与算法分析表明 ,方法比基于Hough变换算法简单 ,实验效果理想 ,适用于文档表格等的直线特征提取。 展开更多
关键词 纸印品图像 直线特征提取 游程元 中心游程元 最大邻域搜索区域 游程元提取 游程元归并 文档表格
下载PDF
CAD在土木工程设计方面的应用研究
17
作者 李红洲 《沿海企业与科技》 2011年第12期73-75,72,共4页
CAD的相关学习教材多且往往过于宽泛,文章将从工程设计方面去掌握CAD绘图技术,拥有明确清晰绘图思路,快速提高绘图速度,使用CAD绘起图来得心应手。
关键词 快捷命令 对象选择 常规命令组合 文档表格 学习思路
下载PDF
CAD软件的快速学习与常用绘图技巧 被引量:1
18
作者 刘修军 《产业与科技论坛》 2012年第22期81-82,共2页
CAD在通信工程方面的应用有很多,不仅应用于通信线路工程,也可以应用于通信管道工程和通信设备工程。CAD相关学习的软件、教材以及教程多且往往过于宽泛,文章将从工程实际应用方面出发,掌握CAD基础绘图快捷命令,弄懂绘图中的常见问题,... CAD在通信工程方面的应用有很多,不仅应用于通信线路工程,也可以应用于通信管道工程和通信设备工程。CAD相关学习的软件、教材以及教程多且往往过于宽泛,文章将从工程实际应用方面出发,掌握CAD基础绘图快捷命令,弄懂绘图中的常见问题,拥有明确清晰绘图思路,快速提高绘图速度,熟练应用常见绘图技巧。 展开更多
关键词 绘图技巧 快捷命令 对象选择 常规命令组合 文档表格 学习心得
下载PDF
更换Office中的用户信息
19
作者 Sunboy 《电脑校园》 2005年第2期26-26,共1页
初次安装Office,系统会提示输入用户信息,以后保存的文档表格等资料就会全部使用这个用户信息,若你是电脑的新主人,使用的资料还是以前的用户信息,就不太合理了。其实只需更改一下用户信息就行,这里以WordXP为例说明,打开“工具... 初次安装Office,系统会提示输入用户信息,以后保存的文档表格等资料就会全部使用这个用户信息,若你是电脑的新主人,使用的资料还是以前的用户信息,就不太合理了。其实只需更改一下用户信息就行,这里以WordXP为例说明,打开“工具”菜单选择“选项”,找到“用户信息”栏,在这里就可以更改用户信息了。 展开更多
关键词 OFFICE 办公软件 文档表格 用户信息 电脑
下载PDF
没有“身份”的实习生谁来保护?
20
作者 张建(整理) 《风流一代》 2023年第16期36-37,共2页
共享文档表格里,罗列着某APP几百条帖子。王丽(化名)依次点击进入,写下不同评论:“支持、感动!”“太可恶!”不到半个小时,她就点评了20多条。自3月开学以来,这是大三学生王丽每天要做的“功课”。作为一家互联网企业的远程运营实习生,... 共享文档表格里,罗列着某APP几百条帖子。王丽(化名)依次点击进入,写下不同评论:“支持、感动!”“太可恶!”不到半个小时,她就点评了20多条。自3月开学以来,这是大三学生王丽每天要做的“功课”。作为一家互联网企业的远程运营实习生,她需要把这项工作干满4个月,才能获得实习证明。 展开更多
关键词 互联网企业 王丽 实习生 共享 文档表格
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部