期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于属性值序列图模型的deep Web新数据发现策略
被引量:
3
1
作者
鲜学丰
崔志明
+3 位作者
赵朋朋
方立刚
杨元峰
顾才东
《通信学报》
EI
CSCD
北大核心
2016年第3期20-32,共13页
针对数据源新产生数据记录的增量爬取问题,提出了一种deep Web新数据发现策略,该策略采用一种新的属性值序列图模型表示deep Web数据源,将新数据发现问题转化为属性值序列图的遍历问题,该模型仅与数据相关,与现有查询关联图模型相比,具...
针对数据源新产生数据记录的增量爬取问题,提出了一种deep Web新数据发现策略,该策略采用一种新的属性值序列图模型表示deep Web数据源,将新数据发现问题转化为属性值序列图的遍历问题,该模型仅与数据相关,与现有查询关联图模型相比,具有更强的适应性和确定性,可适用于仅仅包含简单查询接口的deep Web数据源。在此模型的基础上,发现增长节点并预测其新数据发现能力;利用互信息计算节点之间的依赖关系,查询选择时尽可能地降低查询依赖带来的负面影响。该策略提高了新数据爬取的效率,实验结果表明,在相同资源约束前提下,该策略能使本地数据和远程数据保持最大化同步。
展开更多
关键词
DEEP
WEB
新数据发现
数据
获取
下载PDF
职称材料
题名
基于属性值序列图模型的deep Web新数据发现策略
被引量:
3
1
作者
鲜学丰
崔志明
赵朋朋
方立刚
杨元峰
顾才东
机构
江苏省现代企业信息化应用支撑软件工程技术研发中心
苏州大学智能信息处理及应用研究所
苏州市职业大学计算机工程学院
出处
《通信学报》
EI
CSCD
北大核心
2016年第3期20-32,共13页
基金
国家自然科学基金资助项目(No.61440053
No.61472268
+4 种基金
No.41201338)
江苏省自然科学基金资助项目(No.BK2012164)
苏州市科技计划基金资助项目(No.SYG201342
No.SYG201343
No.SS201344)~~
文摘
针对数据源新产生数据记录的增量爬取问题,提出了一种deep Web新数据发现策略,该策略采用一种新的属性值序列图模型表示deep Web数据源,将新数据发现问题转化为属性值序列图的遍历问题,该模型仅与数据相关,与现有查询关联图模型相比,具有更强的适应性和确定性,可适用于仅仅包含简单查询接口的deep Web数据源。在此模型的基础上,发现增长节点并预测其新数据发现能力;利用互信息计算节点之间的依赖关系,查询选择时尽可能地降低查询依赖带来的负面影响。该策略提高了新数据爬取的效率,实验结果表明,在相同资源约束前提下,该策略能使本地数据和远程数据保持最大化同步。
关键词
DEEP
WEB
新数据发现
数据
获取
Keywords
deep Web
new data discovery
data acquisition
分类号
TP392 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于属性值序列图模型的deep Web新数据发现策略
鲜学丰
崔志明
赵朋朋
方立刚
杨元峰
顾才东
《通信学报》
EI
CSCD
北大核心
2016
3
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部