期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
6
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于MapReduce快速kNN Join方法
被引量:
10
1
作者
戴健
丁治明
《计算机学报》
EI
CSCD
北大核心
2015年第1期99-108,共10页
kNN连接是空间数据库领域里一个基本而又重要的问题,被广泛地应用于多个其他领域.它对提高众多实际应用的性能有着重要意义.随着目前参加kNN连接的数据集的增大和要求的响应时间的缩短(尤其在一些应急环境中),作者实际上对kNN连接的效...
kNN连接是空间数据库领域里一个基本而又重要的问题,被广泛地应用于多个其他领域.它对提高众多实际应用的性能有着重要意义.随着目前参加kNN连接的数据集的增大和要求的响应时间的缩短(尤其在一些应急环境中),作者实际上对kNN连接的效率要求更高.然而,目前的方法大多基于单个进程或者单台机器,并不具有很好的伸缩性.为了解决这个问题,作者引入了map-reduce框架来运行kNN join并提出了两种新的方法:基于map-reduce的分布式网格概略化kNN join(DSGMP-J)和基于map-reduce的voronoi diagram下kNN join(VDMP-J).并把它们和最新的方法 H-BNLJ进行了实验对比.实验结果证明了作者提出的DSGMP-J和VDMP-J方法具有较优的伸缩性.
展开更多
关键词
knn
连接
大数据
MAPREDUCE
下载PDF
职称材料
pgi-distance:一种高效的并行KNN-join处理方法
被引量:
3
2
作者
何洪辉
王丽珍
周丽华
《计算机研究与发展》
EI
CSCD
北大核心
2007年第10期1774-1781,共8页
KNN-join是一种新近才提出的操作,它在数据挖掘中有着广泛的应用.利用KNN-join的"一次一个集合"的性质,一些数据挖掘任务,例如分类、例外挖掘和聚类等,就会更加容易地进行.MuX和Goreder则是两种专为KNN-join设计的算法.为了...
KNN-join是一种新近才提出的操作,它在数据挖掘中有着广泛的应用.利用KNN-join的"一次一个集合"的性质,一些数据挖掘任务,例如分类、例外挖掘和聚类等,就会更加容易地进行.MuX和Goreder则是两种专为KNN-join设计的算法.为了综合利用这两种方法的优点,一种新的KNN-join并行处理方法——pgi-distance(parallel grid index-distance)——被提了出来.pgi-distance使用双层结构,可以对I/O和CPU进行同时优化;基于距离的索引能够让它更好地适应数据维度和分布的变化.由于采用的是各DBMS厂商广泛支持的B+树索引,这让pgi-distance得以成为一种更为实用的KNN-join处理方法.在合成数据集和真实数据集上的测试也表明pgi-distance是实用的和高效的.
展开更多
关键词
knn
-
join
数据挖掘
分类
基于距离的索引
B+树
下载PDF
职称材料
一种基于主存Δ-tree的高维数据KNN连接算法
被引量:
7
3
作者
刘艳
郝忠孝
《计算机研究与发展》
EI
CSCD
北大核心
2010年第7期1234-1243,共10页
KNN连接作为数据挖掘的基元,可以用来大幅度提高相似搜索、数据分析和数据挖掘的速度.到目前为止,对KNN连接的研究主要在基于磁盘系统的背景下进行,假设数据库太大以至于不能装入主存.随着RAM越来越大,价格也越来越低廉,这种假设逐渐受...
KNN连接作为数据挖掘的基元,可以用来大幅度提高相似搜索、数据分析和数据挖掘的速度.到目前为止,对KNN连接的研究主要在基于磁盘系统的背景下进行,假设数据库太大以至于不能装入主存.随着RAM越来越大,价格也越来越低廉,这种假设逐渐受到挑战.因此,有必要重新对基于主存的KNN连接进行研究.在高效主存索引的基础上,采用编码解码、自底向上、深度优先遍历和剪枝等技术提出了一种新的KNN连接算法Δ-tree-KNN-Join.该算法解决了KNN连接中确定搜索半径困难的问题,提高了连接效率.在真实数据和合成聚类数据上进行了实验,结果显示Δ-tree-KNN-Join是一种有效的主存KNN连接算法.
展开更多
关键词
相似连接
knn
连接
高维空间
主存
数据挖掘
下载PDF
职称材料
高维主存kNN连接索引结构的核心算法
4
作者
刘艳
郝忠孝
《计算机科学》
CSCD
北大核心
2011年第9期146-149,共4页
kNN(k最近邻)连接是高维数据库中的一种重要但代价昂贵的基本操作。随着RAM容量越来越大且价格逐渐低廉,更多的数据集能够被装入主存。如何实现快速主存kNN连接,引起人们的关注。索引Δ-tree-R和-Δtree-S是根据kNN连接的特点专门为主存...
kNN(k最近邻)连接是高维数据库中的一种重要但代价昂贵的基本操作。随着RAM容量越来越大且价格逐渐低廉,更多的数据集能够被装入主存。如何实现快速主存kNN连接,引起人们的关注。索引Δ-tree-R和-Δtree-S是根据kNN连接的特点专门为主存kNN连接设计的索引。结合编码、节点中心重合技术,给出了构建Δ-tree-R和-Δtree-S的核心算法及相关证明,实验表明,基于该索引的主存kNN连接算法-Δtree-KNN-Join明显优于目前已存在的可用于主存的kNN连接算法Gorder。
展开更多
关键词
knn
连接
高维空间
主存
索引结构
knn
搜索
下载PDF
职称材料
基于数据流的k-近邻连接算法
被引量:
3
5
作者
王飞
秦小麟
+1 位作者
刘亮
沈尧
《计算机科学》
CSCD
北大核心
2015年第5期204-210,共7页
k-近邻连接查询是空间数据库中一种常用的操作,该查询处理过程涉及连接和最近邻查询两个复杂操作。传统的集中式k-近邻连接查询算法已不能适应当前呈爆炸式增长的数据规模,设计分布式k-近邻连接查询算法成为了目前亟需解决的问题。现有...
k-近邻连接查询是空间数据库中一种常用的操作,该查询处理过程涉及连接和最近邻查询两个复杂操作。传统的集中式k-近邻连接查询算法已不能适应当前呈爆炸式增长的数据规模,设计分布式k-近邻连接查询算法成为了目前亟需解决的问题。现有的分布式k-近邻连接查询算法都包括了多轮串行的MapReduce任务,而每个MapReduce任务均需要读写分布式文件系统,导致MapReduce不能有效表达多个任务之间的依赖关系,因此算法效率低下。首先提出了一种基于数据流的计算框架,该框架建立在MapReduce之上,将数据处理过程按照数据流图建模。在该框架基础上,提出了一种高效的k-近邻连接算法,它利用空间填充曲线将多维数据映射为一维数据,从而将k-近邻连接查询转化为一维范围查询。实验结果表明,该算法的可扩展性较高,且效率比现有算法更优。
展开更多
关键词
k-近邻连接
数据流
MAPREDUCE
计算框架
下载PDF
职称材料
大数据相似性连接查询技术研究进展
被引量:
15
6
作者
马友忠
张智辉
林春杰
《计算机应用》
CSCD
北大核心
2018年第4期978-986,1006,共10页
为了深入理解和全面把握大数据相似性连接查询技术的研究进展,更好地促进其在图片聚类、实体解析、相似文档检测、相似轨迹检索等领域的广泛应用,对大数据相似性连接查询技术相关研究工作进行了深入调研和分析。首先对相似性连接查询的...
为了深入理解和全面把握大数据相似性连接查询技术的研究进展,更好地促进其在图片聚类、实体解析、相似文档检测、相似轨迹检索等领域的广泛应用,对大数据相似性连接查询技术相关研究工作进行了深入调研和分析。首先对相似性连接查询的基本概念进行了介绍,然后分别对集合、向量、空间数据、概率数据、字符串等不同类型大数据的相似性连接查询相关研究工作进行了深入研究,对其优缺点进行了分析和总结。最后,指出了大数据相似性连接查询面临的若干挑战性问题及未来的研究重点。
展开更多
关键词
大数据
相似性连接查询
MAPREDUCE框架
K最近邻
下载PDF
职称材料
题名
基于MapReduce快速kNN Join方法
被引量:
10
1
作者
戴健
丁治明
机构
中国科学院大学
中国科学院软件研究所基础软件国家工程研究中心
出处
《计算机学报》
EI
CSCD
北大核心
2015年第1期99-108,共10页
基金
国家自然科学基金重大研究计划.重点项目(2012.1~2014.12)"面向非常规突发事件主动感知与应急指挥的物联网技术与系统"(91124001)
国家"八六三"高技术研究发展计划"智慧城市"重大专项之子课题(2013.1~2015.12)"面向城市动态运行管理的大规模数据智能检索技术"(2013AA01A603)
+1 种基金
中国科学院"感知中国"先导专项.重点课题(2012.1~2016.12)"面向物理信息感知的传感器时空数据管理与海云服务合成引擎研究"(XDA06020600)
中国科学院战略性科技先导专项课题(XDA06010600)资助~~
文摘
kNN连接是空间数据库领域里一个基本而又重要的问题,被广泛地应用于多个其他领域.它对提高众多实际应用的性能有着重要意义.随着目前参加kNN连接的数据集的增大和要求的响应时间的缩短(尤其在一些应急环境中),作者实际上对kNN连接的效率要求更高.然而,目前的方法大多基于单个进程或者单台机器,并不具有很好的伸缩性.为了解决这个问题,作者引入了map-reduce框架来运行kNN join并提出了两种新的方法:基于map-reduce的分布式网格概略化kNN join(DSGMP-J)和基于map-reduce的voronoi diagram下kNN join(VDMP-J).并把它们和最新的方法 H-BNLJ进行了实验对比.实验结果证明了作者提出的DSGMP-J和VDMP-J方法具有较优的伸缩性.
关键词
knn
连接
大数据
MAPREDUCE
Keywords
knn join
big data
MapReduce
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
pgi-distance:一种高效的并行KNN-join处理方法
被引量:
3
2
作者
何洪辉
王丽珍
周丽华
机构
云南大学信息学院
出处
《计算机研究与发展》
EI
CSCD
北大核心
2007年第10期1774-1781,共8页
基金
国家自然科学基金项目(60463004)
文摘
KNN-join是一种新近才提出的操作,它在数据挖掘中有着广泛的应用.利用KNN-join的"一次一个集合"的性质,一些数据挖掘任务,例如分类、例外挖掘和聚类等,就会更加容易地进行.MuX和Goreder则是两种专为KNN-join设计的算法.为了综合利用这两种方法的优点,一种新的KNN-join并行处理方法——pgi-distance(parallel grid index-distance)——被提了出来.pgi-distance使用双层结构,可以对I/O和CPU进行同时优化;基于距离的索引能够让它更好地适应数据维度和分布的变化.由于采用的是各DBMS厂商广泛支持的B+树索引,这让pgi-distance得以成为一种更为实用的KNN-join处理方法.在合成数据集和真实数据集上的测试也表明pgi-distance是实用的和高效的.
关键词
knn
-
join
数据挖掘
分类
基于距离的索引
B+树
Keywords
knn
-
join
data mining
classification
index based on distance
B+-tree
分类号
TP311.13 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
一种基于主存Δ-tree的高维数据KNN连接算法
被引量:
7
3
作者
刘艳
郝忠孝
机构
哈尔滨理工大学计算机科学与技术学院
长春大学软件学院
哈尔滨工业大学计算机科学与技术学院
出处
《计算机研究与发展》
EI
CSCD
北大核心
2010年第7期1234-1243,共10页
基金
黑龙江省自然科学基金项目(F200601)
文摘
KNN连接作为数据挖掘的基元,可以用来大幅度提高相似搜索、数据分析和数据挖掘的速度.到目前为止,对KNN连接的研究主要在基于磁盘系统的背景下进行,假设数据库太大以至于不能装入主存.随着RAM越来越大,价格也越来越低廉,这种假设逐渐受到挑战.因此,有必要重新对基于主存的KNN连接进行研究.在高效主存索引的基础上,采用编码解码、自底向上、深度优先遍历和剪枝等技术提出了一种新的KNN连接算法Δ-tree-KNN-Join.该算法解决了KNN连接中确定搜索半径困难的问题,提高了连接效率.在真实数据和合成聚类数据上进行了实验,结果显示Δ-tree-KNN-Join是一种有效的主存KNN连接算法.
关键词
相似连接
knn
连接
高维空间
主存
数据挖掘
Keywords
similarity
join
knn
-
join
high-dimensional space
main memory
data mining
分类号
TP311.13 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
高维主存kNN连接索引结构的核心算法
4
作者
刘艳
郝忠孝
机构
哈尔滨理工大学计算机科学与技术学院
长春大学计算机科学技术学院
哈尔滨工业大学计算机科学与技术学院
出处
《计算机科学》
CSCD
北大核心
2011年第9期146-149,共4页
基金
黑龙江省自然科学基金(F200601)资助
文摘
kNN(k最近邻)连接是高维数据库中的一种重要但代价昂贵的基本操作。随着RAM容量越来越大且价格逐渐低廉,更多的数据集能够被装入主存。如何实现快速主存kNN连接,引起人们的关注。索引Δ-tree-R和-Δtree-S是根据kNN连接的特点专门为主存kNN连接设计的索引。结合编码、节点中心重合技术,给出了构建Δ-tree-R和-Δtree-S的核心算法及相关证明,实验表明,基于该索引的主存kNN连接算法-Δtree-KNN-Join明显优于目前已存在的可用于主存的kNN连接算法Gorder。
关键词
knn
连接
高维空间
主存
索引结构
knn
搜索
Keywords
knn
-
join
High-dimensional space
Main-memory
Index structure
knn
search
分类号
TP311.13 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
基于数据流的k-近邻连接算法
被引量:
3
5
作者
王飞
秦小麟
刘亮
沈尧
机构
南京航空航天大学计算机科学与技术学院
出处
《计算机科学》
CSCD
北大核心
2015年第5期204-210,共7页
基金
国家自然科学基金项目(61373015
61300052)
+3 种基金
国家教育部高等学校博士学科点专项科研基金资助项目(20103218110017)
江苏高校优势学科建设工程资助项目(PAPD)
中央高校基本科研业务费专项项目(NP2013307)
云计算-南航-大数据处理引擎技术研究项目资助
文摘
k-近邻连接查询是空间数据库中一种常用的操作,该查询处理过程涉及连接和最近邻查询两个复杂操作。传统的集中式k-近邻连接查询算法已不能适应当前呈爆炸式增长的数据规模,设计分布式k-近邻连接查询算法成为了目前亟需解决的问题。现有的分布式k-近邻连接查询算法都包括了多轮串行的MapReduce任务,而每个MapReduce任务均需要读写分布式文件系统,导致MapReduce不能有效表达多个任务之间的依赖关系,因此算法效率低下。首先提出了一种基于数据流的计算框架,该框架建立在MapReduce之上,将数据处理过程按照数据流图建模。在该框架基础上,提出了一种高效的k-近邻连接算法,它利用空间填充曲线将多维数据映射为一维数据,从而将k-近邻连接查询转化为一维范围查询。实验结果表明,该算法的可扩展性较高,且效率比现有算法更优。
关键词
k-近邻连接
数据流
MAPREDUCE
计算框架
Keywords
knn join
, Data stream, MapReduce, Framework
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
大数据相似性连接查询技术研究进展
被引量:
15
6
作者
马友忠
张智辉
林春杰
机构
洛阳师范学院信息技术学院
河南省电子商务大数据处理与分析重点实验室(洛阳师范学院)
洛阳铁路信息工程学校计算机教研室
出处
《计算机应用》
CSCD
北大核心
2018年第4期978-986,1006,共10页
基金
国家自然科学基金资助项目(61602231)
国家重点研发计划项目(2016YFE0104600)
+2 种基金
河南省科技开放合作项目(172106000077
152106000048)
河南省高等学校重点科研项目(16A520022)~~
文摘
为了深入理解和全面把握大数据相似性连接查询技术的研究进展,更好地促进其在图片聚类、实体解析、相似文档检测、相似轨迹检索等领域的广泛应用,对大数据相似性连接查询技术相关研究工作进行了深入调研和分析。首先对相似性连接查询的基本概念进行了介绍,然后分别对集合、向量、空间数据、概率数据、字符串等不同类型大数据的相似性连接查询相关研究工作进行了深入研究,对其优缺点进行了分析和总结。最后,指出了大数据相似性连接查询面临的若干挑战性问题及未来的研究重点。
关键词
大数据
相似性连接查询
MAPREDUCE框架
K最近邻
Keywords
big data
similarity
join
query
MapReduce framework
K-Nearest Neighbors(
knn
)
分类号
TP311.13 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于MapReduce快速kNN Join方法
戴健
丁治明
《计算机学报》
EI
CSCD
北大核心
2015
10
下载PDF
职称材料
2
pgi-distance:一种高效的并行KNN-join处理方法
何洪辉
王丽珍
周丽华
《计算机研究与发展》
EI
CSCD
北大核心
2007
3
下载PDF
职称材料
3
一种基于主存Δ-tree的高维数据KNN连接算法
刘艳
郝忠孝
《计算机研究与发展》
EI
CSCD
北大核心
2010
7
下载PDF
职称材料
4
高维主存kNN连接索引结构的核心算法
刘艳
郝忠孝
《计算机科学》
CSCD
北大核心
2011
0
下载PDF
职称材料
5
基于数据流的k-近邻连接算法
王飞
秦小麟
刘亮
沈尧
《计算机科学》
CSCD
北大核心
2015
3
下载PDF
职称材料
6
大数据相似性连接查询技术研究进展
马友忠
张智辉
林春杰
《计算机应用》
CSCD
北大核心
2018
15
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部