期刊文献+

基于XML的PDF文档内容与结构的表示的实现 被引量:7

Realization on Representation of the Contents and Structure of PDF Documents based on XML
下载PDF
导出
摘要 在对网络信息资源进行检索、过滤、提取的过程中,对于文档格式的转换是进行信息处理的必然途径。将PDF文档转换为XML文档,在对分析PDF文档的内容和结构方面具有重要意义。论文介绍了从PDF文档向XML文档转换的设计和实现原理。 Document transformation among different document format is a necessary approach to information retrieval,filtering and extraction.XML Document has been an open standard in the exchange of data in different types and fields in the web.Transformation from PDF to XML is necessary for analysing the contents and structure of PDF documents.This paper discusses design and realization of the document transformation from PDF to XML.
出处 《计算机工程与应用》 CSCD 北大核心 2004年第14期120-122,共3页 Computer Engineering and Applications
关键词 PDF XML 文档转换 PDF,XML ,document transformation
  • 相关文献

参考文献5

  • 1Adobe Systems Incorporatod. PDF Reference third edition,Adobe Portable Document Format Version 1.4
  • 2Extensible Markup Language (XML) 1.0.Second Edition, http://www.w3 .org/TR/REC-xml, 2000-10
  • 3Norbert Fuhr. XML Information Retrieval and Information Extraction.http://ls6-www.informatik.uni-dortmund.de/bib/fulltext/ir/Fuhr: 02a.pdr,2002
  • 4Danny Sullivan et al. Fifth Annual Search Engine Meeting Report[R].Boston, MA, http://websearch.about.com/internet/websearch/library/blsem.htm, 1999-04
  • 5ElliotteRustyHarold著 杜大鹏 李善茂 傅烨译.XML实用大全[M].中国水利水电出版社,2000..

共引文献1

同被引文献38

引证文献7

二级引证文献11

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部