期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
4
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
“分类-产品”结构的网页数据精确抽取方法探寻
1
作者
周亮
《数字技术与应用》
2011年第12期168-168,170,共2页
对"分类-产品"结构的网页特征进行分析之后,提出一种基于XQuery的精确抽取方法。该方法先提取分类页面的分页信息、产品URL等特征点,爬虫根据特征点进行爬取,然后对产品网页进行数据抽取并保存于XML数据库,使用XPath进行数据...
对"分类-产品"结构的网页特征进行分析之后,提出一种基于XQuery的精确抽取方法。该方法先提取分类页面的分页信息、产品URL等特征点,爬虫根据特征点进行爬取,然后对产品网页进行数据抽取并保存于XML数据库,使用XPath进行数据查询。该方法适用于需要精确抽取产品数据进行数据建模分析的情景。
展开更多
关键词
网页
抽取
“分类-产品”结构
网页包装
器
XQUERY
XPATH
下载PDF
职称材料
基于WEB的企业信息集成系统
2
作者
张成洪
张诚
肖军建
《中国管理科学》
CSSCI
2000年第S1期163-171,共9页
在Intranet和Internet环境中,数据结构的多样和数据分布的多样,给企业的信息综合分析和决策制定的工作带来了极大的挑战.Web的迅速普及,使这个问题日益突出。本文以基于Web的数据采集和分析为重点,提出了企...
在Intranet和Internet环境中,数据结构的多样和数据分布的多样,给企业的信息综合分析和决策制定的工作带来了极大的挑战.Web的迅速普及,使这个问题日益突出。本文以基于Web的数据采集和分析为重点,提出了企业管理集成系统的一整套解决方案,包括网页包装工具,异构数据源的数据整合工具,数据分析工具,完成了包装非结构化数据、从不同数据源提取数据、正确完整地组织异构数据源的数据、按需求组织数据的工作,并提供对查询结果作进一步分析的功能,使企业能够用统一的界面去查询、收集和处理来自Web 和远程数据库多个数据源的信息。帮助其完成决策制定。
展开更多
关键词
网页包装
异构数据源
规则表达式
半(非)结构化
上下文(Context)
下载PDF
职称材料
基于XML的Web系统集成
被引量:
4
3
作者
孙蛟
许爱华
胡运发
《计算机工程》
CAS
CSCD
北大核心
2002年第10期251-253,共3页
随着Internet上的信息量的迅速增加,Web系统集成已经成为越来越迫切的工作。XML是Internet数据表示和数据交换新的标准,正是XML的特性使得基于其的Web系统集成成为可能,从而更好地服务用户。该文以“上海高校网络图书馆”为实例,对...
随着Internet上的信息量的迅速增加,Web系统集成已经成为越来越迫切的工作。XML是Internet数据表示和数据交换新的标准,正是XML的特性使得基于其的Web系统集成成为可能,从而更好地服务用户。该文以“上海高校网络图书馆”为实例,对Web系统集成进行了详细的阐述。
展开更多
关键词
XMI
WEB
系统集成
网页包装
数据服务
INTERNET
下载PDF
职称材料
Web内容抽取及其数据管理方法
被引量:
16
4
作者
张成洪
肖军建
张诚
《复旦学报(自然科学版)》
CAS
CSCD
北大核心
2001年第2期177-183,共7页
随着Internet及其相关技术的飞速发展 ,WWW已成为最大的信息集散地 .无论对企业还是个人 ,Web逐渐成为最主要的信息来源 .然而由于网站数量过多以及由此带来的信息泛滥 ,使得有用信息的获取越来越困难 .搜索引擎只能提供信息的查找范围 ...
随着Internet及其相关技术的飞速发展 ,WWW已成为最大的信息集散地 .无论对企业还是个人 ,Web逐渐成为最主要的信息来源 .然而由于网站数量过多以及由此带来的信息泛滥 ,使得有用信息的获取越来越困难 .搜索引擎只能提供信息的查找范围 ,而具体的内容还要靠详细搜查 .而且网页信息都是非结构化或半结构化的 ,无法直接利用分析工具进行分析 .所以有必要提供一种网页内容自动抽取及使网页数据结构化的方法 。
展开更多
关键词
数据抽取
网页包装
规则表达式
模式匹配
INTERNET
WWW
Web数据集成系统
数据管理
网页
数据结构化
原文传递
题名
“分类-产品”结构的网页数据精确抽取方法探寻
1
作者
周亮
机构
华中科技大学电子与信息工程系
出处
《数字技术与应用》
2011年第12期168-168,170,共2页
文摘
对"分类-产品"结构的网页特征进行分析之后,提出一种基于XQuery的精确抽取方法。该方法先提取分类页面的分页信息、产品URL等特征点,爬虫根据特征点进行爬取,然后对产品网页进行数据抽取并保存于XML数据库,使用XPath进行数据查询。该方法适用于需要精确抽取产品数据进行数据建模分析的情景。
关键词
网页
抽取
“分类-产品”结构
网页包装
器
XQUERY
XPATH
分类号
TN919 [电子电信—通信与信息系统]
下载PDF
职称材料
题名
基于WEB的企业信息集成系统
2
作者
张成洪
张诚
肖军建
机构
复旦大学管理学院信息管理与信息系统系
出处
《中国管理科学》
CSSCI
2000年第S1期163-171,共9页
文摘
在Intranet和Internet环境中,数据结构的多样和数据分布的多样,给企业的信息综合分析和决策制定的工作带来了极大的挑战.Web的迅速普及,使这个问题日益突出。本文以基于Web的数据采集和分析为重点,提出了企业管理集成系统的一整套解决方案,包括网页包装工具,异构数据源的数据整合工具,数据分析工具,完成了包装非结构化数据、从不同数据源提取数据、正确完整地组织异构数据源的数据、按需求组织数据的工作,并提供对查询结果作进一步分析的功能,使企业能够用统一的界面去查询、收集和处理来自Web 和远程数据库多个数据源的信息。帮助其完成决策制定。
关键词
网页包装
异构数据源
规则表达式
半(非)结构化
上下文(Context)
Keywords
Web wrap
heterogeneous data scarces
regular expression
semi-structured
context
分类号
F270.7 [经济管理—企业管理]
下载PDF
职称材料
题名
基于XML的Web系统集成
被引量:
4
3
作者
孙蛟
许爱华
胡运发
机构
复旦大学计算机信息技术系
出处
《计算机工程》
CAS
CSCD
北大核心
2002年第10期251-253,共3页
文摘
随着Internet上的信息量的迅速增加,Web系统集成已经成为越来越迫切的工作。XML是Internet数据表示和数据交换新的标准,正是XML的特性使得基于其的Web系统集成成为可能,从而更好地服务用户。该文以“上海高校网络图书馆”为实例,对Web系统集成进行了详细的阐述。
关键词
XMI
WEB
系统集成
网页包装
数据服务
INTERNET
Keywords
XML
WRAPPER
DTD
Data service
分类号
TP393.4 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
Web内容抽取及其数据管理方法
被引量:
16
4
作者
张成洪
肖军建
张诚
机构
复旦大学管理学院
出处
《复旦学报(自然科学版)》
CAS
CSCD
北大核心
2001年第2期177-183,共7页
文摘
随着Internet及其相关技术的飞速发展 ,WWW已成为最大的信息集散地 .无论对企业还是个人 ,Web逐渐成为最主要的信息来源 .然而由于网站数量过多以及由此带来的信息泛滥 ,使得有用信息的获取越来越困难 .搜索引擎只能提供信息的查找范围 ,而具体的内容还要靠详细搜查 .而且网页信息都是非结构化或半结构化的 ,无法直接利用分析工具进行分析 .所以有必要提供一种网页内容自动抽取及使网页数据结构化的方法 。
关键词
数据抽取
网页包装
规则表达式
模式匹配
INTERNET
WWW
Web数据集成系统
数据管理
网页
数据结构化
Keywords
data extraction
Web wrapper
regular expression
semi structured
pattern matching
分类号
TP393.409 [自动化与计算机技术—计算机应用技术]
原文传递
题名
作者
出处
发文年
被引量
操作
1
“分类-产品”结构的网页数据精确抽取方法探寻
周亮
《数字技术与应用》
2011
0
下载PDF
职称材料
2
基于WEB的企业信息集成系统
张成洪
张诚
肖军建
《中国管理科学》
CSSCI
2000
0
下载PDF
职称材料
3
基于XML的Web系统集成
孙蛟
许爱华
胡运发
《计算机工程》
CAS
CSCD
北大核心
2002
4
下载PDF
职称材料
4
Web内容抽取及其数据管理方法
张成洪
肖军建
张诚
《复旦学报(自然科学版)》
CAS
CSCD
北大核心
2001
16
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部