期刊文献+
共找到29篇文章
< 1 2 >
每页显示 20 50 100
XML与Web数据集成及技术实现 被引量:15
1
作者 周彦晖 邹显春 张为群 《西南师范大学学报(自然科学版)》 CAS CSCD 北大核心 2001年第3期255-259,共5页
由于HTML缺乏规范的数据表达能力 ,基于Web的数据集成往往很困难 .要使存在于Web上的数量巨大的数据易于共享、处理 ,利用XML (eXtensibleMarkupLanguage)技术可以很好地实现 .现有的XML技术包括XML解析器、文档对象模型、XSL等都可以... 由于HTML缺乏规范的数据表达能力 ,基于Web的数据集成往往很困难 .要使存在于Web上的数量巨大的数据易于共享、处理 ,利用XML (eXtensibleMarkupLanguage)技术可以很好地实现 .现有的XML技术包括XML解析器、文档对象模型、XSL等都可以很好地应用到各种平台下的Web应用程序中 。 展开更多
关键词 数据集成 可扩展标注语言 万维网 文档对象模型
下载PDF
GML数据的Web可视化设计与实现 被引量:6
2
作者 张爱国 邬群勇 王钦敏 《测绘科学》 CSCD 北大核心 2007年第1期140-141,共2页
GML是GIS领域的通用交流语言,然而目前的浏览器并不支持GML,因此GML的Web可视化仍是GML应用需要解决的问题。为此,本论文提出了一种基于组件的可视化策略。该策略采用文档对象模型(DOM)进行GML模式文件和实例文件解析,按地理要素对GML... GML是GIS领域的通用交流语言,然而目前的浏览器并不支持GML,因此GML的Web可视化仍是GML应用需要解决的问题。为此,本论文提出了一种基于组件的可视化策略。该策略采用文档对象模型(DOM)进行GML模式文件和实例文件解析,按地理要素对GML进行数据分流/分层,然后分层可视化的办法,实现了GML数据的Web可视化。实践验证,该方法是切实可行的,且对于GML数据量较大时尤为有效。 展开更多
关键词 地理标记语言 组件 web可视化 文档对象模型
下载PDF
一种Deep Web查询结果的实体抽取方法 被引量:4
3
作者 赵海霞 李道申 +1 位作者 刘勇 赵嘉诚 《计算机工程与应用》 CSCD 2012年第36期160-163,共4页
Deep Web中蕴含着丰富的高质量的信息,通过Deep Web集成查询接口可以获取到包含这些信息的结果页面,因此,Deep Web查询结果页面的数据抽取成为Deep Web数据集成的关键。提出了将索引方法和编辑相似度相结合的方法,来完成Deep Web查询结... Deep Web中蕴含着丰富的高质量的信息,通过Deep Web集成查询接口可以获取到包含这些信息的结果页面,因此,Deep Web查询结果页面的数据抽取成为Deep Web数据集成的关键。提出了将索引方法和编辑相似度相结合的方法,来完成Deep Web查询结果页面的数据抽取工作。大量实验结果表明:该方法是可行的,并且能够提高Deep Web数据实体抽取的准确性和召回率。 展开更多
关键词 深度网 数据抽取 文件对象模型(DOM)树 索引 相似度
下载PDF
一种Web应用跨浏览器兼容性测试方法 被引量:5
4
作者 韦庆杰 刘淑坤 《计算机工程与应用》 CSCD 北大核心 2019年第5期55-59,共5页
随着Web应用的日益普及,及可执行此类应用程序的浏览器越来越多,版本也在不断更新,Web应用的跨浏览器不兼容(Cross Browser Incompatibilities,XBI)已成为Web应用开发者面临的严重问题。提出一种结合DOM(Document Object Model)结构分... 随着Web应用的日益普及,及可执行此类应用程序的浏览器越来越多,版本也在不断更新,Web应用的跨浏览器不兼容(Cross Browser Incompatibilities,XBI)已成为Web应用开发者面临的严重问题。提出一种结合DOM(Document Object Model)结构分析和页面元素(Screen Element)的计算机视觉分析方法,实现Web应用的跨浏览器兼容性测试XBCT(Cross-Browser Compatibility Testing),和现有的测试方法比较,实验结果表明了所提方法能够提高测试结果的准确性。 展开更多
关键词 跨浏览器兼容性 web应用 文档对象模型(DOM) 测试
下载PDF
基于Web的定向医药信息采集系统设计与实现 被引量:2
5
作者 邹元平 邢珂 +4 位作者 林宇 修春 梁进权 宓穗卿 王宁生 《医学信息学杂志》 CAS 2012年第5期23-27,共5页
为解决不同Web网络的定向信息采集问题,开发具有网页分析和自动信息采集功能的定向医药信息采集系统(MICS),具体介绍技术原理与开发过程,实践证明该系统能应用于海量医药信息的自动采集工作,满足大型数据库的建库要求。
关键词 医药信息采集 文档对象模型 网页分析 定向采集
下载PDF
基于B/S架构的Web网页结构检测应用研究 被引量:2
6
作者 陈圣俭 孙明涛 《现代电子技术》 2009年第2期135-138,共4页
随着互联网的普及,大型的跨国公司要求公司对内对外的所有网站都遵循统一的框架结构,因此为了判断网页结构是否符合标准,需要对网页结构进行检测。Web结构分析是指从Web文档中自动分析网页结构的过程,检测不符合标准的网页。依据W3C Mar... 随着互联网的普及,大型的跨国公司要求公司对内对外的所有网站都遵循统一的框架结构,因此为了判断网页结构是否符合标准,需要对网页结构进行检测。Web结构分析是指从Web文档中自动分析网页结构的过程,检测不符合标准的网页。依据W3C Markup Validation Service的设计理念,基于DOM结构树和正则表达式的操作,以分析Web网页结构为基础,提出了Web页面结构检测的设计思想。在解析Html和CSS代码的基础上,网页结构检测正确率达到80%以上。 展开更多
关键词 正则表达式 网页结构树 检测 文档对象模型 属性元素
下载PDF
基于SVG的OLAP系统Web客户端图形显示的设计与实现 被引量:1
7
作者 先晓兵 沈钧毅 《计算机应用与软件》 CSCD 北大核心 2007年第12期46-48,共3页
基于Web的数据信息发布逐步由文本发布转向多种形式的图形、图像化及其混合方式发展,探讨了Web环境下OLAP系统在客户端的一种新的信息实时发布模式,提出了在XML-Web Service分布式环境中,采用.NET+XML-SVG+JavaScript几种技术相结合的... 基于Web的数据信息发布逐步由文本发布转向多种形式的图形、图像化及其混合方式发展,探讨了Web环境下OLAP系统在客户端的一种新的信息实时发布模式,提出了在XML-Web Service分布式环境中,采用.NET+XML-SVG+JavaScript几种技术相结合的综合实施方案,实现了以图形方式的OLAP信息实时发布模式,并且提供了动态交互性能,完善了OLAP系统在该领域的一种解决方案。 展开更多
关键词 可变矢量图形 在线数据分析 文档对象模型 web服务
下载PDF
Deep Web接口的自动识别技术研究
8
作者 杨永红 高磊 +1 位作者 余航 徐欣辰 《计算机工程与应用》 CSCD 北大核心 2017年第7期109-114,共6页
获取Deep Web中信息的主要途径是通过在其提供的查询接口上提交查询来实现的,目前大部分的研究以表单内的<form></form>标签获得表单内容结构,判断是不是一个Deep Web查询接口。提出了接口块的概念,设计了一种基于页面信息... 获取Deep Web中信息的主要途径是通过在其提供的查询接口上提交查询来实现的,目前大部分的研究以表单内的<form></form>标签获得表单内容结构,判断是不是一个Deep Web查询接口。提出了接口块的概念,设计了一种基于页面信息和视觉信息的接口块定位方法,最后将判定接口块是不是Deep Web接口看作是一个模式识别的分类问题,通过抽取适当的表单结构特征,采用C4.5决策树和SVM相结合的分类算法来进行接口块的判定,得到页面中含有的Deep Web查询接口。采用UIUC的TEL-8数据集进行实验,结果表明,该方法的准确率达到了97.30%,具有良好的可行性和实用性。 展开更多
关键词 Deepweb接口 文档对象化模型树 接口块 多类分类
下载PDF
基于Web挖掘和文档对象模型树的XML网页分类方法
9
作者 马勇 郑翔 +1 位作者 鲜敏 黎远松 《微型电脑应用》 2016年第7期47-49,52,共4页
Web网页的自动分类有助于更好地对其内容进行组织和管理,针对XML网页的分类问题,提出了一种基于Web挖掘和文档对象模型(DOM)树的XML网页分类方法。首先,收集XML网页的文本信息。然后,对XML文本进行去冗余操作,并提取网页源代码。再后,利... Web网页的自动分类有助于更好地对其内容进行组织和管理,针对XML网页的分类问题,提出了一种基于Web挖掘和文档对象模型(DOM)树的XML网页分类方法。首先,收集XML网页的文本信息。然后,对XML文本进行去冗余操作,并提取网页源代码。再后,利用DOM树结构进行标签提取,创建知识库。最后,通过从测试网页中获取的标签与知识库进行匹配来分类网页。实验结果表明,提出的方法在各种XML网页下获得了97%的整体准确度。 展开更多
关键词 XML网页分类 web挖掘 文档对象模型树 标签匹配
下载PDF
基于XML的Web数据抽取方法的研究 被引量:2
10
作者 尚福华 孙丽 《黑龙江工程学院学报》 CAS 2004年第1期28-30,共3页
针对Web挖掘中Web数据的抽取问题,设计了一种基于XML的Web数据抽取方法。由于Web数据的最大特点是半结构化,所以采用XML(半结构化的数据模型)来解决传统的关系数据库不适合Web数据存储的问题,从而将XML的文档描述与关系数据库中的属性... 针对Web挖掘中Web数据的抽取问题,设计了一种基于XML的Web数据抽取方法。由于Web数据的最大特点是半结构化,所以采用XML(半结构化的数据模型)来解决传统的关系数据库不适合Web数据存储的问题,从而将XML的文档描述与关系数据库中的属性一一对应起来,实施精确地查询与模型抽取。由于Web数据的大量信息都与抽取无关,所以利用XSL过滤掉XML的无关数据,并进行实时抽取,最后将合并结果保存到XML文档中。实验结果表明,此方法可以很好地解决Web数据的抽取和存储问题。 展开更多
关键词 KDD KDW 半结构化 XML XSL DOM 数据抽取 web挖掘
下载PDF
基于文档对象模型与行块分布算法的网页信息抽取 被引量:9
11
作者 高庆宁 吴鹏 张晶晶 《情报理论与实践》 CSSCI 北大核心 2016年第4期133-137,共5页
[目的]网页所表达的主要信息通常隐藏在大量无关的结构和内容中,使用户不能迅速获取主题内容,限制了网页资源的可用性,使用信息抽取技术解决了这一问题。[方法]基于文档对象模型(DOM)的信息抽取技术能够简单准确地从网页中提取所需内容... [目的]网页所表达的主要信息通常隐藏在大量无关的结构和内容中,使用户不能迅速获取主题内容,限制了网页资源的可用性,使用信息抽取技术解决了这一问题。[方法]基于文档对象模型(DOM)的信息抽取技术能够简单准确地从网页中提取所需内容,但依靠网页本身结构;基于行块分布算法的技术摆脱网页结构的限制,克服限定数据源的缺点,但需要人工干预,文章结合DOM技术和行块分布算法以及正则表达式,实现网页信息采集与信息抽取。[结论]能够自动准确提取网页信息。[局限]对英文以及结构复杂的网页抽取效果不是很理想,抽取内容仅限于文字。 展开更多
关键词 文档对象模型 算法 网页 信息抽取
下载PDF
基于XML的网络化考试软件的编程技术 被引量:4
12
作者 丁振凡 郑晓芳 饶韧 《华东交通大学学报》 2002年第3期53-57,共5页
分析了基于XML的测试软件的实现方法 ,给出了试卷的XML表示 。
关键词 XML 网络化考试软件 编程技术 ASP 文档对象模型 实现方法
下载PDF
图书馆电子资源自主培训程序的设计与实现——以中国知网为例 被引量:1
13
作者 朱玉强 《图书馆理论与实践》 CSSCI 北大核心 2016年第5期18-21,70,共5页
设计并实现图书馆电子资源自主培训程序,解决培训讲座上座率低、效果差问题。使用Visual Basic6.0编程,自动操控网页文档对象。完成了"菜单导航"和"智能预测"模块,实现了数据库功能区介绍、数据库浏览及检索演示、... 设计并实现图书馆电子资源自主培训程序,解决培训讲座上座率低、效果差问题。使用Visual Basic6.0编程,自动操控网页文档对象。完成了"菜单导航"和"智能预测"模块,实现了数据库功能区介绍、数据库浏览及检索演示、文献利用演示等功能。但程序只能工作于Trident内核浏览器。结论:程序功能确切,为图书馆用户培训工作提供了新方法。 展开更多
关键词 网页文档对象 自主培训 电子资源
下载PDF
一种网络课件制作工具的实现方法 被引量:1
14
作者 孙清 《计算机工程与应用》 CSCD 北大核心 2002年第23期125-126,162,共3页
为了有效改善制作课件的手段,该文提出了将课件开发流程中的课件制作环节分为两步来做的方法,并据此开发了该课件制作工具。文章介绍了该系统及其各部分的实现方法,并着重讲述了系统中网络课件编辑器的结构和实现方法。
关键词 网络课件制作工具 文档对象模型 动态网页 课件开发流程 计算机网络
下载PDF
基于ActiveX控件与Office对象模型的技术文档管理系统 被引量:4
15
作者 李爱国 高沙 吴韵格 《计算机应用与软件》 CSCD 北大核心 2014年第12期148-151,共4页
针对传统的Web技术文档管理系统中版本控制难、修改缺乏可追踪性、系统响应时间长、用户体验差等问题,提出一种结合Active X控件与Office对象模型的技术文档管理系统开发方案。在系统结构分析、审批流程建模、系统功能构建的基础上,详... 针对传统的Web技术文档管理系统中版本控制难、修改缺乏可追踪性、系统响应时间长、用户体验差等问题,提出一种结合Active X控件与Office对象模型的技术文档管理系统开发方案。在系统结构分析、审批流程建模、系统功能构建的基础上,详细介绍系统实现中的两大关键技术:在线审批的版本控制及修改信息提取、文档自动受控生成。实际应用表明,该系统文档版本控制准确,文档修改过程的可查性强,系统响应速度快,用户体验效果好。 展开更多
关键词 ACTIVEX控件 Office对象模型 技术文档管理系统 web应用
下载PDF
基于文档对象模型的网页制作自动阅卷技术 被引量:2
16
作者 项洁 姜华强 《计算机时代》 2009年第8期71-73,共3页
从文档对象模型的角度对网页文档格式进行了研究,给出了基于文档对象获取的网页制作题自动阅卷方案,弥补了以往用文本匹配方式进行阅卷在知识点定位及取值过程中的不足。
关键词 文档对象 自动阅卷 MSHTML 对象模型 网页
下载PDF
数字化文献和语义网络的本体论意义
17
作者 王书方 《图书与情报》 CSSCI 2006年第4期57-59,87,共4页
文章讨论数字化文献的组织形式和语义网的本体论意义。在文献组织中讨论了元数据和对象的关系以及对象的本体认识,语义网讨论了实用分类系统以及语义网的智慧发展趋势,并以此为基础阐述了世界、数字对象以及语义网络三者之间的关系。
关键词 网络文献 元数据 数字对象 语义网络 本体论
下载PDF
基于隐马尔可夫模型的恶意网页检测方法
18
作者 王成 《软件导刊》 2012年第5期132-133,共2页
将网页内容以HTML文档对象模型看作是DOM元素序列,建立网页的隐马尔可夫模型。提出了一种基于隐马尔可夫模型的恶意网页检测方法,对恶意网页检测具有一定的参考价值。
关键词 恶意网页 文档对象模型 客户端蜜罐系统 隐马尔可夫模型
下载PDF
基于自组织映射的恶意网页检测方法研究
19
作者 王成 《软件导刊》 2012年第7期147-148,共2页
HTML文档对象模型把HTML文档看作DOM元素的集合。根据HTML文档中DOM元素出现的频率,网页就可以转化为一个向量。提出了一种基于自组织映射的恶意网页检测方法,对恶意网页检测具有一定的参考价值。
关键词 恶意网页 文档对象模型 自组织映射
下载PDF
正则表达式在网络蜘蛛抽取问答系统信息中的应用
20
作者 汪材印 《宿州学院学报》 2012年第5期32-35,共4页
问答系统是信息检索系统的一种高级形式,为了提高网络蜘蛛在抽取问答系统信息时的爬行效率,从问答系统所特有的布局结构特点出发,结合正则表达式,设计了一个针对问答系统的网络蜘蛛爬行策略。实验证明,该爬行策略提高了网络蜘蛛爬行效率... 问答系统是信息检索系统的一种高级形式,为了提高网络蜘蛛在抽取问答系统信息时的爬行效率,从问答系统所特有的布局结构特点出发,结合正则表达式,设计了一个针对问答系统的网络蜘蛛爬行策略。实验证明,该爬行策略提高了网络蜘蛛爬行效率,节省了网络带宽和本地存储空间,有效地提高了答案抽取的精度和效率。 展开更多
关键词 正则表达式 网络蜘蛛 问答系统)DOM树
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部