期刊文献+
共找到427篇文章
< 1 2 22 >
每页显示 20 50 100
标准电子文件转XML校验方法
1
作者 王海虹 杨萌 +2 位作者 张劲松 谭笑 罗小强 《中国标准化》 2024年第16期50-58,共9页
本研究关注于标准电子文件转换为XML格式的校验方法,目的是确保转换过程中内容的准确性和一致性。涉及455个国家标准、企业标准和行业标准的PDF文件,转换为Word后再编程为机器可读的XML格式。研究应对转换中出现的内容错乱、标签错误等... 本研究关注于标准电子文件转换为XML格式的校验方法,目的是确保转换过程中内容的准确性和一致性。涉及455个国家标准、企业标准和行业标准的PDF文件,转换为Word后再编程为机器可读的XML格式。研究应对转换中出现的内容错乱、标签错误等问题,强调校验的重要性。采用IntelliJ IDEA、Notepad++和Acrobat Adobe等工具,在初验、复验和终验三个阶段执行校验。通过建立严格的校验标准和检查表,本研究将XML内容错误率控制在万分之五以下,有效支持标准文件的数字化转型。 展开更多
关键词 标准行业 标准电子文件转换 xml格式校验 机器可读标准
下载PDF
一种基于多叉树的HTML到XML的转换方法 被引量:4
2
作者 张文斌 陈恩红 王进 《小型微型计算机系统》 CSCD 北大核心 2003年第4期713-715,共3页
当前的Web信息大多数都是HTML格式的,由于HTML文件中没有严格的结构性,故很难能用一种有效的 方法来检索或提取隐藏其中的数据.针对HTML的这种缺陷,本文提出了基于多叉树的HTML到XML转换方法,把 对HTML的信息检索问题转化为对XML的检索... 当前的Web信息大多数都是HTML格式的,由于HTML文件中没有严格的结构性,故很难能用一种有效的 方法来检索或提取隐藏其中的数据.针对HTML的这种缺陷,本文提出了基于多叉树的HTML到XML转换方法,把 对HTML的信息检索问题转化为对XML的检索问题,以便简化下一步的检索问题. 展开更多
关键词 多叉树 html语言 xml语言 信息检索 Web Internet
下载PDF
一种基于内容的HTML到XML转换策略 被引量:9
3
作者 李青山 陈平 《计算机工程与应用》 CSCD 北大核心 2001年第9期30-32,共3页
互联网应用系统中传统HTML内容数据的重用及其与Web中标准XML格式数据的互交换非常重要。通过对HTML结构和语法特点的分析,文章定义了一种分离HTML格式信息与表达有效语义的内容数据的标记规则,建立了该标记规则到... 互联网应用系统中传统HTML内容数据的重用及其与Web中标准XML格式数据的互交换非常重要。通过对HTML结构和语法特点的分析,文章定义了一种分离HTML格式信息与表达有效语义的内容数据的标记规则,建立了该标记规则到XML模式的一种影射,从而实现了一种从HTML内容到XML结构数据的转换策略。最后,在网页在线维护系统WOMS中应用该策略实现网站管理者对网页的在线维护。 展开更多
关键词 互联网 应用程序 html xml 数据转换
下载PDF
基于对称性的HTML到XML的转换方法 被引量:2
4
作者 魏志华 黄孝伦 +1 位作者 刘亮 史林霞 《武汉理工大学学报(信息与管理工程版)》 CAS 2007年第7期45-48,共4页
作为构造、存储、发送信息的方式,XML的出现在很大程度上解决了一些HTML所不能解决的问题。用XML作为数据变换的中介,给系统的实现带来极大的灵活性。HTML到XML的转换可以方便实现网上数据的交换。所提出的基于对称性的转换方法,可以高... 作为构造、存储、发送信息的方式,XML的出现在很大程度上解决了一些HTML所不能解决的问题。用XML作为数据变换的中介,给系统的实现带来极大的灵活性。HTML到XML的转换可以方便实现网上数据的交换。所提出的基于对称性的转换方法,可以高效方便地实现HTML到XML的转换,简化HTML中的信息抽取问题。 展开更多
关键词 html xml 对称性
下载PDF
XML与HTML在Web环境中的应用分析 被引量:10
5
作者 林清 董占球 《计算机应用》 CSCD 北大核心 2001年第z1期67-68,71,共3页
传统网页编程语言HTML已经越来越无法满足人们的各种需求 ,文中分析了HTML的局限性 ,从XML标准的产生背景出发 ,阐述了XML的特点及其优越性 。
关键词 xml WWW html Web 互连网:标记语言
下载PDF
SGML、HTML与XML的比较 被引量:10
6
作者 徐永川 《情报科学》 CSSCI 北大核心 2004年第1期100-103,共4页
本文分别介绍 3种标记语言 :标准通用标记语言 (SGML)、超文本标记语言和可扩展标记语言(XML) ,并对其作简单的比较。
关键词 SGML 标准通用标记语言 html 超文本标记语言 xml 可扩展标记语言
下载PDF
HTML向XML转换的研究 被引量:8
7
作者 黄晓斌 《现代图书情报技术》 CSSCI 北大核心 2003年第1期18-21,共4页
分析 HTML和 XML的特点、论述了 HTML向 XML转换的必要性、介绍了转换的有关原理。
关键词 特点 智能代理 html xml 转换 网络信息组织
下载PDF
HTML到XML转换研究 被引量:2
8
作者 钱程 阳小兰 《计算机与现代化》 2011年第8期39-41,共3页
网络上的许多信息都是由HTML编写的,但HTML语言本身具有不足,使得其不能处理网络上的许多需求,而XML可以弥补很多HTML的不足,因此网络应用的传统数据和XML标记数据的转换变得日趋重要。本文对从HTML到XML的转换技术进行研究,并用Java语... 网络上的许多信息都是由HTML编写的,但HTML语言本身具有不足,使得其不能处理网络上的许多需求,而XML可以弥补很多HTML的不足,因此网络应用的传统数据和XML标记数据的转换变得日趋重要。本文对从HTML到XML的转换技术进行研究,并用Java语言实现该转换系统。 展开更多
关键词 html xml 解析器 信息抽取 JAXB
下载PDF
HTML表格向XML的智能转换 被引量:3
9
作者 贾长云 程永上 《计算机工程》 CAS CSCD 北大核心 2009年第14期32-34,共3页
XML已经成为处理与管理信息的标准格式,而HTML表格被广泛应用于Web。为了充分利用与管理HTML表格信息,需要将HTML表格转换成XML。提出一种有效的处理方法,该方法包含2个部分,即表格识别与结构转换。表格识别通过检查格式、语法及语义的... XML已经成为处理与管理信息的标准格式,而HTML表格被广泛应用于Web。为了充分利用与管理HTML表格信息,需要将HTML表格转换成XML。提出一种有效的处理方法,该方法包含2个部分,即表格识别与结构转换。表格识别通过检查格式、语法及语义的特征将表格提取出来并分割成值域与属性域,使用预设的表格模板分析属性域与值域间的层次结构并将其转换成XML格式。通过300多个表格的实验表明,所提出的方法要优于传统方法,结果的准确率达86.7%。 展开更多
关键词 html表格 结构分析 规范化 信息提取 可扩展标记语言
下载PDF
HTML到XML转换技术的研究与实现 被引量:1
10
作者 陈艳梅 张斌 《现代图书情报技术》 CSSCI 北大核心 2003年第5期66-67,90,共3页
网络上大多数的信息都是用 HTML写的 ,这种语言不能处理网络上的很多需求 ,因为它只是一种用于浏览信息的语言 ,不能表达数据本身 ,网络还没有形成一个良好的结构化文档的存贮 ,而只是一个可变的 HTML页的聚集 ,我们迫切希望来自网络资... 网络上大多数的信息都是用 HTML写的 ,这种语言不能处理网络上的很多需求 ,因为它只是一种用于浏览信息的语言 ,不能表达数据本身 ,网络还没有形成一个良好的结构化文档的存贮 ,而只是一个可变的 HTML页的聚集 ,我们迫切希望来自网络资源的信息以一种结构化的方式来存贮。XML和它的各种扩展功能如数据模型、查询语言等是实现结构化方式的一种 ,是一种元语言 ,可以弥补很多 HTML的不足。未来的网页会使用具有很好结构化的 XML语言 ,但是现在这一阶段是过渡阶段 ,必须思考一种方法来实现 HTML到 XML的转换 ,以更好地利用网络资源。本文提出了一种实现 HTML到 XML转换的方法。 展开更多
关键词 html 超文本标记语言 xml 可扩展性标记语言 网络信息 信息描述 语言格式 转换技术
下载PDF
SGML、HTML、XML的比较 被引量:2
11
作者 袁琳 李秉严 《四川图书馆学报》 2001年第3期34-36,共3页
随着信息网络的飞速发展 ,相继产生了SGML、HTML和XML三种标记语言 ,了解和掌握它们之间的联系和区别 ,有利于利用通用方式和元标识语言对电子文献的结构进行正确标记 ,实现对各类文献结构和内容的系统化标准化描述 ,从而建立起通用数... 随着信息网络的飞速发展 ,相继产生了SGML、HTML和XML三种标记语言 ,了解和掌握它们之间的联系和区别 ,有利于利用通用方式和元标识语言对电子文献的结构进行正确标记 ,实现对各类文献结构和内容的系统化标准化描述 ,从而建立起通用数字化文献。本文对三种标记语言SGML、HTML和XML的相同点和不同点进行了比较 ,指出XML是目前最易掌握和功能最强的标记语言。 展开更多
关键词 比较研究 SGML html xml 标记语言
下载PDF
试析常用于数字图书馆中数据交换与处理的三种数据格式的标识语言(SGML、HTML、XML)的异同性 被引量:5
12
作者 林甫 《现代情报》 2002年第9期118-119,共2页
分析与比较应用于数字图书馆中数据交换与处理的三种数据格式的标识语言的异同性。
关键词 数字图书馆 标识语言 SGML html xml 数据交换 数据处理 数据格式
下载PDF
WebQL:一种XML和HTML查询语言
13
作者 路燕 张彪 +1 位作者 段起阳 施伯乐 《小型微型计算机系统》 CSCD 北大核心 2003年第8期1491-1494,共4页
本文提出了一种 Web查询语言 Web QL,能同时处理 XML 和 HTML 文档资源 ,实现了结构化查询 ,提高了查询的准确度和速度 ,并给出了用 VC++实现的 Web
关键词 内容查询 结构化查询 xml html
下载PDF
置标语言以及SGML、HTML和XML的关系 被引量:1
14
作者 王汉元 《情报杂志》 CSSCI 北大核心 2005年第3期67-68,共2页
从介绍置标语言入手 ,对SGML、HTML和XML分别进行简述并比较分析。
关键词 SGML 置标语言 html xml 比较分析
下载PDF
一种基于多叉树的HTML到XML的转换方法
15
作者 张文斌 陈恩红 王进 《小型微型计算机系统》 CSCD 北大核心 2003年第9期1617-1620,共4页
当前的 Web信息大多数都是 HTML格式的 ,由于 HTML文件中没有严格的结构性 ,故很难能用一种有效的方法来检索或提取隐藏其中的数据 .针对 HTML的这种缺陷 ,本文提出了基于多叉树的 HTML到 XML转换方法 ,把对 HTML 的信息检索问题转化为... 当前的 Web信息大多数都是 HTML格式的 ,由于 HTML文件中没有严格的结构性 ,故很难能用一种有效的方法来检索或提取隐藏其中的数据 .针对 HTML的这种缺陷 ,本文提出了基于多叉树的 HTML到 XML转换方法 ,把对 HTML 的信息检索问题转化为对 XML 的检索问题 。 展开更多
关键词 html xml 多叉树 信息检索
下载PDF
超越HTML的WWW语言——可扩展置标语言XML 被引量:3
16
作者 伍海桑 李星 《电信技术》 1999年第10期41-45,共5页
XML 是1997 年由W3C 开发的一种置标语言。分析了W W W 和HTML 的关系,探讨了XML 与SGML 和HTML 的区别,回顾了XML 的产生过程,介绍了XML 的特点,并对XML 的发展趋势进行了展望。
关键词 html xml 可扩展性 置标 置标语言
下载PDF
比较分析XML与HTML 被引量:3
17
作者 曹风华 《电脑与信息技术》 2011年第4期69-71,共3页
XML(eXtensible Markup Language)是一种可扩展的元置标语言,XML技术的出现,给互联网带来了无限的商机。可以说,XML已经渗透到Internet的各个角落。文章分别介绍了两种标记语言:超文本标记语言(HTML)和可扩展标记语言(XML),并对其作简... XML(eXtensible Markup Language)是一种可扩展的元置标语言,XML技术的出现,给互联网带来了无限的商机。可以说,XML已经渗透到Internet的各个角落。文章分别介绍了两种标记语言:超文本标记语言(HTML)和可扩展标记语言(XML),并对其作简单的比较分析。 展开更多
关键词 xml 标记语言 html
下载PDF
XSLT在XML向HTML转换中的作用 被引量:2
18
作者 曹风华 《现代计算机》 2010年第3期102-104,共3页
XML是一种显示数据的标记语言,它能使数据通过网络无障碍地进行传输,并显示在用户的浏览器上。XML实现了数据与表示的分离,需要通过样式表来显示XML数据。介绍XSLT的特性及功能,通过示例,介绍通过XSLT如何将一个XML文档转换为HTML文档... XML是一种显示数据的标记语言,它能使数据通过网络无障碍地进行传输,并显示在用户的浏览器上。XML实现了数据与表示的分离,需要通过样式表来显示XML数据。介绍XSLT的特性及功能,通过示例,介绍通过XSLT如何将一个XML文档转换为HTML文档的方法,并说明该方法的用途。 展开更多
关键词 XSLT xml 转换 html
下载PDF
XML与HTML整合 被引量:1
19
作者 陈银凤 《现代计算机》 2011年第13期49-51,共3页
XML与HTML都是重要的网络标识语言,但各自具有优缺点,XML侧重于数据的描述,HTML侧重于数据的显示,若将两者整合则可以取长补短。主要介绍如何使用数据岛技术来实现XML与HTML的整合。
关键词 xml html 整合 数据岛
下载PDF
WEB页标记语言XML超越HTML的技术变革
20
作者 张冬梅 《情报杂志》 CSSCI 北大核心 2001年第10期58-59,共2页
叙述了XML的由来、XML文档的样式、XML文档的显示及XML文档的应用;认为XML是能够摒弃 HTML语言的缺陷,成为未来Web书写工具的标记语言,并且必将推动Web不断发展。
关键词 xml html SGML 标识语言 Web 信息检索 应用软件开发 电子商务
下载PDF
上一页 1 2 22 下一页 到第
使用帮助 返回顶部