期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
Web数据源选择技术 被引量:16
1
作者 万常选 邓松 +3 位作者 刘喜平 廖国琼 刘德喜 江腾蛟 《软件学报》 EI CSCD 北大核心 2013年第4期781-797,共17页
在Web数据集成的过程中,如何从大量的Web数据源集合中选择合适数量的数据源,使得在满足特定查询需求的前提下尽可能地减少所需访问的数据源数量,同时保持返回数据结果的高质量,成为Web数据集成中的一个热点问题.以近十几年的研究实践为... 在Web数据集成的过程中,如何从大量的Web数据源集合中选择合适数量的数据源,使得在满足特定查询需求的前提下尽可能地减少所需访问的数据源数量,同时保持返回数据结果的高质量,成为Web数据集成中的一个热点问题.以近十几年的研究实践为背景,介绍Web数据源选择的研究沿革及现状,并对Web数据源选择方法进行了归类.分别讨论了基于相关性的和基于质量的数据源选择的研究动机、研究方法和研究成果等,并对相关研究的目标、关键技术、优点和缺点进行了对比分析;最后展望了Web数据源选择未来的研究方向. 展开更多
关键词 数据集成 web数据源 文本 结构化与半结构化 摘要
下载PDF
大数据环境下Web数据源质量评估方法研究 被引量:18
2
作者 赵星 李石君 +3 位作者 余伟 杨莎 丁永刚 胡亚慧 《计算机工程》 CAS CSCD 北大核心 2017年第2期48-56,共9页
在大数据环境下Web数据资源的开放性和多源性使得不同互联网平台提供的数据质量参差不齐,严重影响人们从互联网中有效准确地获取信息。为此,提出一种Web数据源质量评估方法。建立面向多源互联网平台的统一数据模型和数据质量标准模型,... 在大数据环境下Web数据资源的开放性和多源性使得不同互联网平台提供的数据质量参差不齐,严重影响人们从互联网中有效准确地获取信息。为此,提出一种Web数据源质量评估方法。建立面向多源互联网平台的统一数据模型和数据质量标准模型,给出针对大数据全样本数据分析的质量标准度量和表示方法,并通过多维数据质量的综合评估实现Web数据源质量的统一度量。实验结果表明,该方法能全面度量互联网平台的数据质量,为用户提供准确高效的质量评价结果。 展开更多
关键词 数据 web数据源 数据质量评估 全样本分析 MAPREDUCE框架
下载PDF
Deep Web数据源聚焦爬虫 被引量:11
3
作者 林超 赵朋朋 崔志明 《计算机工程》 CAS CSCD 北大核心 2008年第7期56-58,共3页
Internet上有大量页面是由后台数据库动态产生的,这部分页面不能通过传统的搜索引擎访问,被称为Deep Web。数据源发现是大规模Deep Web数据源集成的关键步骤。该文提出一种针对DeepWeb数据源的聚焦爬行算法。在评价链接重要性时,综合考... Internet上有大量页面是由后台数据库动态产生的,这部分页面不能通过传统的搜索引擎访问,被称为Deep Web。数据源发现是大规模Deep Web数据源集成的关键步骤。该文提出一种针对DeepWeb数据源的聚焦爬行算法。在评价链接重要性时,综合考虑了页面与主题的相关性和链接相关信息。实验证明该方法是有效的。 展开更多
关键词 DEEP web数据源 聚焦爬虫 贝叶斯分类器
下载PDF
基于本体的Deep Web数据源聚焦搜索系统研究 被引量:1
4
作者 张素智 李丽娜 《微计算机信息》 2010年第6期27-29,共3页
Deep Web中包含内容丰富、主题专一的高质量信息,为了自动地采集和集成这些数据,数据源的发现是关键。本文设计了一种基于本体的DeepWeb数据源聚焦搜索系统,给出了核心搜索算法。并通过实验,表明该方法是可行有效的。
关键词 本体 DEEP web数据源 聚焦搜索
下载PDF
两种Web数据源动态连接方法的比较 被引量:1
5
作者 童红兵 《江西科技师范学院学报》 2003年第5期135-136,共2页
介绍了利用OLEDB、ODBC连接Web数据源的两种方法,系统分析比较两种连接方法优缺点。
关键词 web数据源 ADO OLE-DB ODBC 动态连接方法 数据 数据访问 数据接口
下载PDF
基于CORBA/Java的多数据源Web数据库解决方案 被引量:1
6
作者 张菁 张小真 《西南师范大学学报(自然科学版)》 CAS CSCD 北大核心 2002年第2期156-161,共6页
讨论了CORBA标准 ,分析了多种数据库访问技术 。
关键词 CORBA/JAVA 数据web数据 公共对象请求代理结构 分布对象技术
下载PDF
基于HITS的冲突Deep Web数据多真值发现算法 被引量:5
7
作者 王继奎 李少波 《计算机工程》 CAS CSCD 北大核心 2016年第9期158-162,共5页
目前多数真值发现算法建立在真值唯一的基础上,无法处理多真值的情况。为此,针对冲突Deep Web数据的多真值发现问题,借鉴HITS算法思想,定义视图权威度与视图描述可信度,两者相互影响。在此基础上,定义视图链接关系图,提出多真值迭代发... 目前多数真值发现算法建立在真值唯一的基础上,无法处理多真值的情况。为此,针对冲突Deep Web数据的多真值发现问题,借鉴HITS算法思想,定义视图权威度与视图描述可信度,两者相互影响。在此基础上,定义视图链接关系图,提出多真值迭代发现算法MTF。当算法收敛时,权威度最大的视图就是真值。在Book-Authors数据集上进行实验,结果表明,与基准算法VOTE相比,MTF算法的精确度大幅提高。 展开更多
关键词 web数据源 数据模型 可信度 视图 真值发现
下载PDF
Web数据挖掘及其在电子商务系统中的应用 被引量:3
8
作者 徐艳丽 《软件导刊》 2015年第11期144-145,共2页
在互联网快速发展时代,Web数据挖掘应用成为研究热点。将Web数据挖掘技术应用到电子商务领域可有效处理信息,提高企业管理效率,增强竞争力。探讨Web数据挖掘的含义、分类及电子商务系统中Web数据挖掘的数据源和方法。
关键词 web数据挖掘 数据挖掘 电子商务系统 web数据源
下载PDF
一种Deep Web聚焦爬虫爬行策略 被引量:2
9
作者 蔡欣宝 陈洪平 +1 位作者 赵朋朋 崔志明 《微电子学与计算机》 CSCD 北大核心 2009年第8期117-120,共4页
实现大规模Deep Web数据源集成是方便用户使用Deep Web信息的一种有效途径.Deep Web爬虫是Deep Web数据源集成的关键组成部分.提出一种针对结构化Deep Web的聚焦爬虫爬行策略.通过对查询接口的特征分析来判断Deep Web数据源的主题相关性... 实现大规模Deep Web数据源集成是方便用户使用Deep Web信息的一种有效途径.Deep Web爬虫是Deep Web数据源集成的关键组成部分.提出一种针对结构化Deep Web的聚焦爬虫爬行策略.通过对查询接口的特征分析来判断Deep Web数据源的主题相关性.同时,在评价链接重要性时,综合考虑了页面内容的主题相关性和链接的相关信息.实验证明该方法是有效的. 展开更多
关键词 结构化Deep web数据源 聚焦爬虫 决策树分类器
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部