期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
Web数据转换集成技术及其信息服务应用 被引量:7
1
作者 张成洪 肖军建 张诚 《计算机工程》 CAS CSCD 北大核心 2001年第1期94-95,98,共3页
Web的迅速普及,使获取信息比以前更加迅速与方便,但由于网站数量众多,数据又相对分散,使得获取有效信息的难度加大.Web数据转换集成技术可以自动从Web上获取数据,然后集成为用户所关心的有效信息,同时还提供查询代理服... Web的迅速普及,使获取信息比以前更加迅速与方便,但由于网站数量众多,数据又相对分散,使得获取有效信息的难度加大.Web数据转换集成技术可以自动从Web上获取数据,然后集成为用户所关心的有效信息,同时还提供查询代理服务,以更好地服务用户.该文以上海信息港的“房地产信息搜索集成系统”为实用实例,对该项技术及其在信息服务方面的应用进行详细阐述. 展开更多
关键词 数据库 WEB 数据转换 集成 信息服务
下载PDF
基于WEB的企业信息集成系统
2
作者 张成洪 张诚 肖军建 《中国管理科学》 CSSCI 2000年第S1期163-171,共9页
在Intranet和Internet环境中,数据结构的多样和数据分布的多样,给企业的信息综合分析和决策制定的工作带来了极大的挑战.Web的迅速普及,使这个问题日益突出。本文以基于Web的数据采集和分析为重点,提出了企... 在Intranet和Internet环境中,数据结构的多样和数据分布的多样,给企业的信息综合分析和决策制定的工作带来了极大的挑战.Web的迅速普及,使这个问题日益突出。本文以基于Web的数据采集和分析为重点,提出了企业管理集成系统的一整套解决方案,包括网页包装工具,异构数据源的数据整合工具,数据分析工具,完成了包装非结构化数据、从不同数据源提取数据、正确完整地组织异构数据源的数据、按需求组织数据的工作,并提供对查询结果作进一步分析的功能,使企业能够用统一的界面去查询、收集和处理来自Web 和远程数据库多个数据源的信息。帮助其完成决策制定。 展开更多
关键词 网页包装 异构数据源 规则表达式 半(非)结构化 上下文(Context)
下载PDF
Web内容抽取及其数据管理方法 被引量:16
3
作者 张成洪 肖军建 张诚 《复旦学报(自然科学版)》 CAS CSCD 北大核心 2001年第2期177-183,共7页
随着Internet及其相关技术的飞速发展 ,WWW已成为最大的信息集散地 .无论对企业还是个人 ,Web逐渐成为最主要的信息来源 .然而由于网站数量过多以及由此带来的信息泛滥 ,使得有用信息的获取越来越困难 .搜索引擎只能提供信息的查找范围 ... 随着Internet及其相关技术的飞速发展 ,WWW已成为最大的信息集散地 .无论对企业还是个人 ,Web逐渐成为最主要的信息来源 .然而由于网站数量过多以及由此带来的信息泛滥 ,使得有用信息的获取越来越困难 .搜索引擎只能提供信息的查找范围 ,而具体的内容还要靠详细搜查 .而且网页信息都是非结构化或半结构化的 ,无法直接利用分析工具进行分析 .所以有必要提供一种网页内容自动抽取及使网页数据结构化的方法 。 展开更多
关键词 数据抽取 网页包装 规则表达式 模式匹配 INTERNET WWW Web数据集成系统 数据管理 网页数据结构化
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部