期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于.NET的移动话费详单页面的XML数据提取 被引量:2
1
作者 赵纯 施一剑 +1 位作者 张昱 金心宇 《计算机系统应用》 2011年第4期189-193,共5页
介绍了一种在Microsoft的.NET 3.5框架下,使用ASP.NET、SgmlReader、LINQ和XML等关键技术,对移动话费详单HTML页面进行自动数据提取的方案。该方案能实现对移动话费详单页面数据信息进行自动搜集的功能,有助于进一步完成对话费详单信息... 介绍了一种在Microsoft的.NET 3.5框架下,使用ASP.NET、SgmlReader、LINQ和XML等关键技术,对移动话费详单HTML页面进行自动数据提取的方案。该方案能实现对移动话费详单页面数据信息进行自动搜集的功能,有助于进一步完成对话费详单信息的统计、计算等处理工作。该方案具有简单、易行、高效的特点。 展开更多
关键词 web数据提取 .NET框架 XML LINQ 话费详单
下载PDF
WEB数据挖掘研究与探讨 被引量:10
2
作者 曼丽春 朱宏 《西南民族大学学报(自然科学版)》 CAS 2005年第2期302-306,共5页
随着WWW迅猛发展,WWW上的信息量不断增加,如何在这些信息中找到用户真正需要的内容,成了数据组 织和web相关领域的专家学者关注的焦点.为了解决这个问题,把数据挖掘的理论和技术应用于WWW,出现了一个新 的研究领域--Web数据挖掘.主要介... 随着WWW迅猛发展,WWW上的信息量不断增加,如何在这些信息中找到用户真正需要的内容,成了数据组 织和web相关领域的专家学者关注的焦点.为了解决这个问题,把数据挖掘的理论和技术应用于WWW,出现了一个新 的研究领域--Web数据挖掘.主要介绍了Web数据挖掘的原理、应用、实现以及它的最近发展情况. 展开更多
关键词 数据挖掘 web数据:信息提取 XML
下载PDF
XML技术在化学深层网数据提取中的应用 被引量:9
3
作者 卓流艺 李晓霞 郭力 《计算机与应用化学》 CAS CSCD 北大核心 2006年第11期1137-1141,共5页
Internet上的化学数据库是宝贵的化学信息资源,如何有效地利用这些数据是化学深层网所要解决的问题。本文总结了化学深层网的特点,基于XML技术实现从数据库检索返回的半结构化HTML页面中提取数据的目标,使之成为可供程序直接调用做进一... Internet上的化学数据库是宝贵的化学信息资源,如何有效地利用这些数据是化学深层网所要解决的问题。本文总结了化学深层网的特点,基于XML技术实现从数据库检索返回的半结构化HTML页面中提取数据的目标,使之成为可供程序直接调用做进一步计算的数据。在数据提取过程中,先采用JTidy规范化HTML,得到格式上完整、内容无误的XHTML文档,利用包含着XPath路径语言的XSLT数据转换模板实现数据转换和提取。其中XPath表达式的优劣决定了XSLT数据转换模板能否长久有效地提取化学数据,文中着重介绍了如何编辑健壮的XPath表达式,强调了XPath表达式应利用内容和属性特征实现对源树中数据的定位,并尽可能地降低表达式之间的耦合度,前瞻性地预测化学站点可能出现的变化并在XSLT数据转换模板中采取相应的措施以提高表达式的长期有效性。为创建化学深层网数据提取的XSLT数据提取模板提供方法指导。 展开更多
关键词 web数据提取 化学深层网 XML XSLT XPATH 化学数据
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部