期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
9
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
Web数据源选择技术
被引量:
16
1
作者
万常选
邓松
+3 位作者
刘喜平
廖国琼
刘德喜
江腾蛟
《软件学报》
EI
CSCD
北大核心
2013年第4期781-797,共17页
在Web数据集成的过程中,如何从大量的Web数据源集合中选择合适数量的数据源,使得在满足特定查询需求的前提下尽可能地减少所需访问的数据源数量,同时保持返回数据结果的高质量,成为Web数据集成中的一个热点问题.以近十几年的研究实践为...
在Web数据集成的过程中,如何从大量的Web数据源集合中选择合适数量的数据源,使得在满足特定查询需求的前提下尽可能地减少所需访问的数据源数量,同时保持返回数据结果的高质量,成为Web数据集成中的一个热点问题.以近十几年的研究实践为背景,介绍Web数据源选择的研究沿革及现状,并对Web数据源选择方法进行了归类.分别讨论了基于相关性的和基于质量的数据源选择的研究动机、研究方法和研究成果等,并对相关研究的目标、关键技术、优点和缺点进行了对比分析;最后展望了Web数据源选择未来的研究方向.
展开更多
关键词
数据
集成
web数据源
文本
结构化与半结构化
源
摘要
下载PDF
职称材料
大数据环境下Web数据源质量评估方法研究
被引量:
18
2
作者
赵星
李石君
+3 位作者
余伟
杨莎
丁永刚
胡亚慧
《计算机工程》
CAS
CSCD
北大核心
2017年第2期48-56,共9页
在大数据环境下Web数据资源的开放性和多源性使得不同互联网平台提供的数据质量参差不齐,严重影响人们从互联网中有效准确地获取信息。为此,提出一种Web数据源质量评估方法。建立面向多源互联网平台的统一数据模型和数据质量标准模型,...
在大数据环境下Web数据资源的开放性和多源性使得不同互联网平台提供的数据质量参差不齐,严重影响人们从互联网中有效准确地获取信息。为此,提出一种Web数据源质量评估方法。建立面向多源互联网平台的统一数据模型和数据质量标准模型,给出针对大数据全样本数据分析的质量标准度量和表示方法,并通过多维数据质量的综合评估实现Web数据源质量的统一度量。实验结果表明,该方法能全面度量互联网平台的数据质量,为用户提供准确高效的质量评价结果。
展开更多
关键词
大
数据
web数据源
数据
质量评估
全样本分析
MAPREDUCE框架
下载PDF
职称材料
Deep Web数据源聚焦爬虫
被引量:
11
3
作者
林超
赵朋朋
崔志明
《计算机工程》
CAS
CSCD
北大核心
2008年第7期56-58,共3页
Internet上有大量页面是由后台数据库动态产生的,这部分页面不能通过传统的搜索引擎访问,被称为Deep Web。数据源发现是大规模Deep Web数据源集成的关键步骤。该文提出一种针对DeepWeb数据源的聚焦爬行算法。在评价链接重要性时,综合考...
Internet上有大量页面是由后台数据库动态产生的,这部分页面不能通过传统的搜索引擎访问,被称为Deep Web。数据源发现是大规模Deep Web数据源集成的关键步骤。该文提出一种针对DeepWeb数据源的聚焦爬行算法。在评价链接重要性时,综合考虑了页面与主题的相关性和链接相关信息。实验证明该方法是有效的。
展开更多
关键词
DEEP
web数据源
聚焦爬虫
贝叶斯分类器
下载PDF
职称材料
基于本体的Deep Web数据源聚焦搜索系统研究
被引量:
1
4
作者
张素智
李丽娜
《微计算机信息》
2010年第6期27-29,共3页
Deep Web中包含内容丰富、主题专一的高质量信息,为了自动地采集和集成这些数据,数据源的发现是关键。本文设计了一种基于本体的DeepWeb数据源聚焦搜索系统,给出了核心搜索算法。并通过实验,表明该方法是可行有效的。
关键词
本体
DEEP
web数据源
聚焦搜索
下载PDF
职称材料
两种Web数据源动态连接方法的比较
被引量:
1
5
作者
童红兵
《江西科技师范学院学报》
2003年第5期135-136,共2页
介绍了利用OLEDB、ODBC连接Web数据源的两种方法,系统分析比较两种连接方法优缺点。
关键词
web数据源
ADO
OLE-DB
ODBC
动态连接方法
数据
库
数据
访问
数据
接口
下载PDF
职称材料
基于CORBA/Java的多数据源Web数据库解决方案
被引量:
1
6
作者
张菁
张小真
《西南师范大学学报(自然科学版)》
CAS
CSCD
北大核心
2002年第2期156-161,共6页
讨论了CORBA标准 ,分析了多种数据库访问技术 。
关键词
CORBA/JAVA
多
数据
源
web
数据
库
公共对象请求代理结构
分布对象技术
下载PDF
职称材料
基于HITS的冲突Deep Web数据多真值发现算法
被引量:
5
7
作者
王继奎
李少波
《计算机工程》
CAS
CSCD
北大核心
2016年第9期158-162,共5页
目前多数真值发现算法建立在真值唯一的基础上,无法处理多真值的情况。为此,针对冲突Deep Web数据的多真值发现问题,借鉴HITS算法思想,定义视图权威度与视图描述可信度,两者相互影响。在此基础上,定义视图链接关系图,提出多真值迭代发...
目前多数真值发现算法建立在真值唯一的基础上,无法处理多真值的情况。为此,针对冲突Deep Web数据的多真值发现问题,借鉴HITS算法思想,定义视图权威度与视图描述可信度,两者相互影响。在此基础上,定义视图链接关系图,提出多真值迭代发现算法MTF。当算法收敛时,权威度最大的视图就是真值。在Book-Authors数据集上进行实验,结果表明,与基准算法VOTE相比,MTF算法的精确度大幅提高。
展开更多
关键词
web数据源
数据
模型
可信度
视图
真值发现
下载PDF
职称材料
Web数据挖掘及其在电子商务系统中的应用
被引量:
3
8
作者
徐艳丽
《软件导刊》
2015年第11期144-145,共2页
在互联网快速发展时代,Web数据挖掘应用成为研究热点。将Web数据挖掘技术应用到电子商务领域可有效处理信息,提高企业管理效率,增强竞争力。探讨Web数据挖掘的含义、分类及电子商务系统中Web数据挖掘的数据源和方法。
关键词
web
数据
挖掘
数据
挖掘
电子商务系统
web数据源
下载PDF
职称材料
一种Deep Web聚焦爬虫爬行策略
被引量:
2
9
作者
蔡欣宝
陈洪平
+1 位作者
赵朋朋
崔志明
《微电子学与计算机》
CSCD
北大核心
2009年第8期117-120,共4页
实现大规模Deep Web数据源集成是方便用户使用Deep Web信息的一种有效途径.Deep Web爬虫是Deep Web数据源集成的关键组成部分.提出一种针对结构化Deep Web的聚焦爬虫爬行策略.通过对查询接口的特征分析来判断Deep Web数据源的主题相关性...
实现大规模Deep Web数据源集成是方便用户使用Deep Web信息的一种有效途径.Deep Web爬虫是Deep Web数据源集成的关键组成部分.提出一种针对结构化Deep Web的聚焦爬虫爬行策略.通过对查询接口的特征分析来判断Deep Web数据源的主题相关性.同时,在评价链接重要性时,综合考虑了页面内容的主题相关性和链接的相关信息.实验证明该方法是有效的.
展开更多
关键词
结构化Deep
web数据源
聚焦爬虫
决策树分类器
下载PDF
职称材料
题名
Web数据源选择技术
被引量:
16
1
作者
万常选
邓松
刘喜平
廖国琼
刘德喜
江腾蛟
机构
江西财经大学信息管理学院
数据与知识工程江西省高校重点实验室(江西财经大学)
出处
《软件学报》
EI
CSCD
北大核心
2013年第4期781-797,共17页
基金
国家自然科学基金(61173146)
江西省高等学校科技落地计划(产学研合作)(KJLD12022)
+2 种基金
江西省教育厅科技项目(GJJ12733
GJJ12732
GJJ11729)
文摘
在Web数据集成的过程中,如何从大量的Web数据源集合中选择合适数量的数据源,使得在满足特定查询需求的前提下尽可能地减少所需访问的数据源数量,同时保持返回数据结果的高质量,成为Web数据集成中的一个热点问题.以近十几年的研究实践为背景,介绍Web数据源选择的研究沿革及现状,并对Web数据源选择方法进行了归类.分别讨论了基于相关性的和基于质量的数据源选择的研究动机、研究方法和研究成果等,并对相关研究的目标、关键技术、优点和缺点进行了对比分析;最后展望了Web数据源选择未来的研究方向.
关键词
数据
集成
web数据源
文本
结构化与半结构化
源
摘要
Keywords
data integration
web
data source
text
structured and semi-structured
source summary
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
大数据环境下Web数据源质量评估方法研究
被引量:
18
2
作者
赵星
李石君
余伟
杨莎
丁永刚
胡亚慧
机构
武汉大学计算机学院
纽约州立大学宾汉姆顿分校计算机科学系
出处
《计算机工程》
CAS
CSCD
北大核心
2017年第2期48-56,共9页
基金
国家自然科学基金(61502350
61672393
+2 种基金
U1536114)
中央高校基本科研业务费专项资金项目(2042014kf0057)
湖北省自然科学基金(2014CFB289)
文摘
在大数据环境下Web数据资源的开放性和多源性使得不同互联网平台提供的数据质量参差不齐,严重影响人们从互联网中有效准确地获取信息。为此,提出一种Web数据源质量评估方法。建立面向多源互联网平台的统一数据模型和数据质量标准模型,给出针对大数据全样本数据分析的质量标准度量和表示方法,并通过多维数据质量的综合评估实现Web数据源质量的统一度量。实验结果表明,该方法能全面度量互联网平台的数据质量,为用户提供准确高效的质量评价结果。
关键词
大
数据
web数据源
数据
质量评估
全样本分析
MAPREDUCE框架
Keywords
big data
web
data source
data quality assessment
full sample analysis
MapReduce framework
分类号
TP311.13 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
Deep Web数据源聚焦爬虫
被引量:
11
3
作者
林超
赵朋朋
崔志明
机构
苏州大学智能信息处理及应用研究所
出处
《计算机工程》
CAS
CSCD
北大核心
2008年第7期56-58,共3页
基金
国家自然科学基金资助项目(60673092)
2005年度教育部科研基金资助重点项目(205059)
+1 种基金
教育部高校博士学科点科研基金资助项目(20040285016)
江苏省高技术研究计划基金资助项目(BG2005019)
文摘
Internet上有大量页面是由后台数据库动态产生的,这部分页面不能通过传统的搜索引擎访问,被称为Deep Web。数据源发现是大规模Deep Web数据源集成的关键步骤。该文提出一种针对DeepWeb数据源的聚焦爬行算法。在评价链接重要性时,综合考虑了页面与主题的相关性和链接相关信息。实验证明该方法是有效的。
关键词
DEEP
web数据源
聚焦爬虫
贝叶斯分类器
Keywords
Deep
web
sourtes
focused crawler
Bayes classifier
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
基于本体的Deep Web数据源聚焦搜索系统研究
被引量:
1
4
作者
张素智
李丽娜
机构
郑州轻工业学院计算机与通信工程学院
出处
《微计算机信息》
2010年第6期27-29,共3页
文摘
Deep Web中包含内容丰富、主题专一的高质量信息,为了自动地采集和集成这些数据,数据源的发现是关键。本文设计了一种基于本体的DeepWeb数据源聚焦搜索系统,给出了核心搜索算法。并通过实验,表明该方法是可行有效的。
关键词
本体
DEEP
web数据源
聚焦搜索
Keywords
ontology
Deep
web
data sources
focused crawler
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
两种Web数据源动态连接方法的比较
被引量:
1
5
作者
童红兵
机构
宿州职业技术学院
出处
《江西科技师范学院学报》
2003年第5期135-136,共2页
文摘
介绍了利用OLEDB、ODBC连接Web数据源的两种方法,系统分析比较两种连接方法优缺点。
关键词
web数据源
ADO
OLE-DB
ODBC
动态连接方法
数据
库
数据
访问
数据
接口
Keywords
web
data source
ADO
OLE DB
ODBC
分类号
TP393.09 [自动化与计算机技术—计算机应用技术]
TP311.13 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
基于CORBA/Java的多数据源Web数据库解决方案
被引量:
1
6
作者
张菁
张小真
机构
西南师范大学电子信息工程系
西南师范大学计算机与信息科学学院
出处
《西南师范大学学报(自然科学版)》
CAS
CSCD
北大核心
2002年第2期156-161,共6页
基金
重庆科委应用基础研究项目 .
文摘
讨论了CORBA标准 ,分析了多种数据库访问技术 。
关键词
CORBA/JAVA
多
数据
源
web
数据
库
公共对象请求代理结构
分布对象技术
Keywords
Common Object Request Broker Architecture
Internet Inter-ORB Protocol
distributed object technology
database
分类号
TP311.131 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
基于HITS的冲突Deep Web数据多真值发现算法
被引量:
5
7
作者
王继奎
李少波
机构
兰州财经大学电子商务综合重点实验室
贵州大学现代制造技术教育部重点实验室
出处
《计算机工程》
CAS
CSCD
北大核心
2016年第9期158-162,共5页
基金
国家社科基金资助项目"基于大数据整合的空气质量测度方法研究"(14GSD95)
全国统计科研基金资助重点项目"海量异源异物数据的采集
+3 种基金
存储和分析方案研究"(2013LZ44)
陇原创新人才扶持计划基金资助项目(14GSD95)
甘肃省财政厅高校基本科研业务费基金资助项目(GZ14007
GZ14023)
文摘
目前多数真值发现算法建立在真值唯一的基础上,无法处理多真值的情况。为此,针对冲突Deep Web数据的多真值发现问题,借鉴HITS算法思想,定义视图权威度与视图描述可信度,两者相互影响。在此基础上,定义视图链接关系图,提出多真值迭代发现算法MTF。当算法收敛时,权威度最大的视图就是真值。在Book-Authors数据集上进行实验,结果表明,与基准算法VOTE相比,MTF算法的精确度大幅提高。
关键词
web数据源
数据
模型
可信度
视图
真值发现
Keywords
web
data source
data model
credibility
view
truth value discovery
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
Web数据挖掘及其在电子商务系统中的应用
被引量:
3
8
作者
徐艳丽
机构
青海师范大学计算机学院
出处
《软件导刊》
2015年第11期144-145,共2页
文摘
在互联网快速发展时代,Web数据挖掘应用成为研究热点。将Web数据挖掘技术应用到电子商务领域可有效处理信息,提高企业管理效率,增强竞争力。探讨Web数据挖掘的含义、分类及电子商务系统中Web数据挖掘的数据源和方法。
关键词
web
数据
挖掘
数据
挖掘
电子商务系统
web数据源
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
一种Deep Web聚焦爬虫爬行策略
被引量:
2
9
作者
蔡欣宝
陈洪平
赵朋朋
崔志明
机构
苏州大学智能信息处理及应用研究所
江苏省现代企业信息化应用支撑软件工程技术研发中心
出处
《微电子学与计算机》
CSCD
北大核心
2009年第8期117-120,共4页
基金
国家自然科学基金项目(60673092)
2008年江苏省重大科技支撑与自主创新项目(BE2008044)
江苏省现代企业信息化应用支撑软件工程技术研发中心开放基金项目(SX200904)
文摘
实现大规模Deep Web数据源集成是方便用户使用Deep Web信息的一种有效途径.Deep Web爬虫是Deep Web数据源集成的关键组成部分.提出一种针对结构化Deep Web的聚焦爬虫爬行策略.通过对查询接口的特征分析来判断Deep Web数据源的主题相关性.同时,在评价链接重要性时,综合考虑了页面内容的主题相关性和链接的相关信息.实验证明该方法是有效的.
关键词
结构化Deep
web数据源
聚焦爬虫
决策树分类器
Keywords
structural Deep
web
sources
focused crawler
decision tree classifier
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
Web数据源选择技术
万常选
邓松
刘喜平
廖国琼
刘德喜
江腾蛟
《软件学报》
EI
CSCD
北大核心
2013
16
下载PDF
职称材料
2
大数据环境下Web数据源质量评估方法研究
赵星
李石君
余伟
杨莎
丁永刚
胡亚慧
《计算机工程》
CAS
CSCD
北大核心
2017
18
下载PDF
职称材料
3
Deep Web数据源聚焦爬虫
林超
赵朋朋
崔志明
《计算机工程》
CAS
CSCD
北大核心
2008
11
下载PDF
职称材料
4
基于本体的Deep Web数据源聚焦搜索系统研究
张素智
李丽娜
《微计算机信息》
2010
1
下载PDF
职称材料
5
两种Web数据源动态连接方法的比较
童红兵
《江西科技师范学院学报》
2003
1
下载PDF
职称材料
6
基于CORBA/Java的多数据源Web数据库解决方案
张菁
张小真
《西南师范大学学报(自然科学版)》
CAS
CSCD
北大核心
2002
1
下载PDF
职称材料
7
基于HITS的冲突Deep Web数据多真值发现算法
王继奎
李少波
《计算机工程》
CAS
CSCD
北大核心
2016
5
下载PDF
职称材料
8
Web数据挖掘及其在电子商务系统中的应用
徐艳丽
《软件导刊》
2015
3
下载PDF
职称材料
9
一种Deep Web聚焦爬虫爬行策略
蔡欣宝
陈洪平
赵朋朋
崔志明
《微电子学与计算机》
CSCD
北大核心
2009
2
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部