期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于C#正则表达式的农业文献管理系统的研究与应用 被引量:1
1
作者 杨波 张立娜 《安徽农业科学》 CAS 2012年第5期2988-2990,共3页
利用PDFBOX和正则表达式批量提取已下载到本地的PDF格式农业文献的元数据,建立农业文献信息关系型数据库,根据需要建立农业文献管理系统,提高农业文献利用效率和科研效率。在C#环境下,对PDFBOX进行封装,利用数据流的写入功能将PDF格式... 利用PDFBOX和正则表达式批量提取已下载到本地的PDF格式农业文献的元数据,建立农业文献信息关系型数据库,根据需要建立农业文献管理系统,提高农业文献利用效率和科研效率。在C#环境下,对PDFBOX进行封装,利用数据流的写入功能将PDF格式的农业文献的二进制内容以简体中文输出,再利用正则表达式设计规则模型批量提取相关元数据。 展开更多
关键词 PDF pdfbox 正则表达式 元数据 提取
下载PDF
基于JavaWeb的PDF安全编辑系统的设计与实现 被引量:1
2
作者 胡荣磊 左珮良 蒋华 《北京电子科技学院学报》 2015年第2期68-73,共6页
iText与PDFBox是用于处理PDF文档的开源工具包,本文采用JavaWeb技术中倡导的MVC开发模式,设计了PDF安全编辑系统,同时结合该类工具包实现了包含创建、加密、读取文本内容、添加水印等在内的PDF文档的安全编辑功能,并支持批量操作。对此... iText与PDFBox是用于处理PDF文档的开源工具包,本文采用JavaWeb技术中倡导的MVC开发模式,设计了PDF安全编辑系统,同时结合该类工具包实现了包含创建、加密、读取文本内容、添加水印等在内的PDF文档的安全编辑功能,并支持批量操作。对此项目的功能进行测试表明,该编辑系统运行稳定,并对所操作的PDF文档对象具有较高的安全保护作用,项目易于移植和部署,具有一定的应用价值。 展开更多
关键词 ITEXT pdfbox JavaWeb 安全编辑 批量操作
下载PDF
针对PDF的多文件信息抽取的研究与实现 被引量:1
3
作者 文家朝 杨鸿章 《凯里学院学报》 2016年第3期95-97,共3页
在日常的学习和工作中,PDF文件和WORD文档一样,是一种文件格式.PDF文件有自己的优点,例如不易被误改,但它也有一些不方便的缺点,例如查找文档的信息没有WORD文档方便,特别是在需要查找多个PDF文档是否包含一些用户感兴趣的信息的情况,... 在日常的学习和工作中,PDF文件和WORD文档一样,是一种文件格式.PDF文件有自己的优点,例如不易被误改,但它也有一些不方便的缺点,例如查找文档的信息没有WORD文档方便,特别是在需要查找多个PDF文档是否包含一些用户感兴趣的信息的情况,这就涉及到PDF文件的信息抽取问题.本文阐述了一种使用Java开源工具PDFBox处理相关信息抽取的PDF多文件信息抽取的有效方法. 展开更多
关键词 PDF 信息抽取 开源工具 pdfbox
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部