摘要
数字图书馆的建设面临着资源整理、查找、存储等一系列问题,传统的文档存储形式不利于信息的再利用、web发布等。提出了将中文文本数据转换为可扩展标记语言(XML)文档的一种方法,通过解析一个文件类型表示(DTD),利用DTD中给定的元素名称、属性等从文本数据中找到相应元素的内容,从而形成一个特定DTD下的XML文档。
At present, there is still difficult in building digit library, because there isn't a good way to store traditional resource, to find useful information, to save all kind of text file, to publish on the web etc. This paper presents a way to transform the text file to XML files . It can be complete by two steps; at first parse the given DTD , second find the content of the elements that defined in DTD.
出处
《燕山大学学报》
CAS
2002年第2期184-188,共5页
Journal of Yanshan University
关键词
文本文件
可扩展标记语言
文档类型定义
数据字典
text file, extensible markup language, document type definition, data dictionary.