期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
Efficient κ-Nearest-Neighbor Search Algorithms for Historical Moving Object Trajectories 被引量:4
1
作者 高云君 李春 +3 位作者 陈根才 陈岭 姜贤塔 陈纯 《Journal of Computer Science & Technology》 SCIE EI CSCD 2007年第2期232-244,共13页
Nearest Neighbor (κNN) search is one of the most important operations in spatial and spatio-temporal databases. Although it has received considerable attention in the database literature, there is little prior work... Nearest Neighbor (κNN) search is one of the most important operations in spatial and spatio-temporal databases. Although it has received considerable attention in the database literature, there is little prior work on κNN retrieval for moving object trajectories. Motivated by this observation, this paper studies the problem of efficiently processing κNN (κ≥ 1) search on R-tree-like structures storing historical information about moving object trajectories. Two algorithms are developed based on best-first traversal paradigm, called BFPκNN and BFTκNN, which handle the κNN retrieval with respect to the static query point and the moving query trajectory, respectively. Both algorithms minimize the number of node access, that is, they perform a single access only to those qualifying nodes that may contain the final result. Aiming at saving main-memory consumption and reducing CPU cost further, several effective pruning heuristics are also presented. Extensive experiments with synthetic and real datasets confirm that the proposed algorithms in this paper outperform their competitors significantly in both efficiency and scalability. 展开更多
关键词 query processing κ-nearest-neighbor search moving object trajectories ALGORITHMS spatio-temporal databases
原文传递
Composite Distance Transformation for Indexing and κ-Nearest-Neighbor Searching in High-Dimensional Spaces 被引量:3
2
作者 庄毅 庄越挺 吴飞 《Journal of Computer Science & Technology》 SCIE EI CSCD 2007年第2期208-217,共10页
Due to the famous dimensionality curse problem, search in a high-dimensional space is considered as a "hard" problem. In this paper, a novel composite distance transformation method, which is called CDT, is proposed... Due to the famous dimensionality curse problem, search in a high-dimensional space is considered as a "hard" problem. In this paper, a novel composite distance transformation method, which is called CDT, is proposed to support a fast κ-nearest-neighbor (κ-NN) search in high-dimensional spaces. In CDT, all (n) data points are first grouped into some clusters by a κ-Means clustering algorithm. Then a composite distance key of each data point is computed. Finally, these index keys of such n data points are inserted by a partition-based B^+-tree. Thus, given a query point, its κ-NN search in high-dimensional spaces is transformed into the search in the single dimensional space with the aid of CDT index. Extensive performance studies are conducted to evaluate the effectiveness and efficiency of the proposed scheme. Our results show that this method outperforms the state-of-the-art high-dimensional search techniques, such as the X-Tree, VA-file, iDistance and NB-Tree. 展开更多
关键词 centroid distance κ-nearest-neighbor search start distance
原文传递
一种面向不确定对象的可见k近邻查询算法 被引量:11
3
作者 王艳秋 徐传飞 +2 位作者 于戈 谷峪 陈默 《计算机学报》 EI CSCD 北大核心 2010年第10期1943-1952,共10页
真实世界中,常存在很多障碍物,影响空间对象到查询点的可见性及距离,可见k近邻查询查找距查询点最近的k个可见对象,是时空查询领域的一类重要算法.由于度量设备误差以及通信开销的限制等因素,空间对象位置不确定因素广泛存在.文中拟对... 真实世界中,常存在很多障碍物,影响空间对象到查询点的可见性及距离,可见k近邻查询查找距查询点最近的k个可见对象,是时空查询领域的一类重要算法.由于度量设备误差以及通信开销的限制等因素,空间对象位置不确定因素广泛存在.文中拟对不确定对象执行可见k近邻查询,提出了概率可见k近邻(PVkNN)查询,即查找前k个成为查询点最近邻居概率最大的节点.为了高效地执行这一查询,文中提出了k-界限剪枝方法,基于可见质心的紧缩过滤以及对不可见对象的剪枝策略,从空间角度过滤掉不符合条件的对象.为避免对候选集合中每个对象的概率都进行精确计算,从概率角度提出了根据概率上下限来对候选集合进行进一步的求精方法,采用近似采样技术来获取可见区域的比例,实现了对PVkNN的高效计算.采用真实和模拟数据集设计实验,充分验证了算法的效率和精度. 展开更多
关键词 概率可见k近邻查询 不确定对象 空间剪枝 概率上下限求精
下载PDF
基于改进k-最近邻回归算法的软测量建模 被引量:15
4
作者 叶涛 朱学峰 +1 位作者 李向阳 史步海 《自动化学报》 EI CSCD 北大核心 2007年第9期996-999,共4页
机器学习回归方法被广泛应用于复杂工业过程的软测量建模k-最近邻(kNN)算法是一种流行的学习算法,可用于函数回归问题.然而,传统kNN算法存在运行效率低、距离计算忽略特征权值的缺点.本文引入了二次型距离定义和样本集剪辑算法,改进了传... 机器学习回归方法被广泛应用于复杂工业过程的软测量建模k-最近邻(kNN)算法是一种流行的学习算法,可用于函数回归问题.然而,传统kNN算法存在运行效率低、距离计算忽略特征权值的缺点.本文引入了二次型距离定义和样本集剪辑算法,改进了传统kNN回归算法,并将改进的算法用于工业过程软测量建模.仿真实验得到了一些有益的结论. 展开更多
关键词 K-最近邻算法 二次型距离 软测量 纸浆KAPPA值
下载PDF
一种基于κ-最近邻的无监督文本分类算法 被引量:2
5
作者 余小鹏 马费成 《情报学报》 CSSCI 北大核心 2008年第4期550-555,共6页
κ-最近邻分类(KNN)是一种广泛使用的文本分类方法,但是该方法并不适用分布不均匀的数据集,同时对κ值也比较敏感。本文分析了传统KNN方法的不足及产生这些不足的根本原因,并提出一种无监督的KNN文本分类算法(UKNNC)。该方法先... κ-最近邻分类(KNN)是一种广泛使用的文本分类方法,但是该方法并不适用分布不均匀的数据集,同时对κ值也比较敏感。本文分析了传统KNN方法的不足及产生这些不足的根本原因,并提出一种无监督的KNN文本分类算法(UKNNC)。该方法先采用误差平方和准则自适应地从κ个最近邻居所包含的各类别中挑选与输入文档于同一簇的部分邻居作为参照,然后根据输入文档对各类参照邻居核密度的扰动程度进行分类。实验证明该方法具有更高的分类质量,能够有效适用于分布复杂的数据集,同时分类结果对κ值不敏感。 展开更多
关键词 κ-最近邻 核密度估计 误差平方和准则 文本分类
下载PDF
基于修正的伪氨基酸组成预测氧化还原酶辅酶类型 被引量:1
6
作者 张光亚 李红春 方柏山 《生物工程学报》 CAS CSCD 北大核心 2008年第8期1439-1445,共7页
从序列出发快速确定氧化还原酶的辅酶依赖类型对于了解其结构和功能、催化机制及构建辅酶再生体系具有重要指导作用。对Chou提出的伪氨基酸组成方法进行了修正并用于提取氧化还原酶序列特征值,采用k-近邻算法预测其辅酶依赖类型。当λ=4... 从序列出发快速确定氧化还原酶的辅酶依赖类型对于了解其结构和功能、催化机制及构建辅酶再生体系具有重要指导作用。对Chou提出的伪氨基酸组成方法进行了修正并用于提取氧化还原酶序列特征值,采用k-近邻算法预测其辅酶依赖类型。当λ=48,w=0.1时,10倍交叉验证结果表明:其ROC曲线下面积为0.9536,预测精度达92.0%,比最优条件下伪氨基酸组成预测精度提高了3.5%;与其他7种常见特征值提取方法相比,修正的伪氨基酸组成表现最好。结果表明从序列出发预测氧化还原酶辅酶依赖类型是可行的,且修正的伪氨基酸组成可望成为一种新的有效提取蛋白质序列特征值方法。 展开更多
关键词 氧化还原酶 辅酶依赖类型 修正的伪氨基酸组成 κ-近邻 ROC曲线下面积
下载PDF
ISU-Tree:一种支持概率k近邻查询的不确定高维索引 被引量:3
7
作者 庄毅 《计算机学报》 EI CSCD 北大核心 2010年第10期1934-1942,共9页
文中提出一种支持概率k近邻查询的不确定高维索引结构——ISU-Tree.在高维空间,首先对n个不确定数据对象进行k平均聚类,然后分别对每个不确定超球进行初始'切片',并对其进行多特征编码得到对应的统一化索引键值,并且用B+树建立... 文中提出一种支持概率k近邻查询的不确定高维索引结构——ISU-Tree.在高维空间,首先对n个不确定数据对象进行k平均聚类,然后分别对每个不确定超球进行初始'切片',并对其进行多特征编码得到对应的统一化索引键值,并且用B+树建立索引.这样,高维空间的概率查询就转变成对一维空间的启发式的范围查询及求精运算.理论及实验分析表明ISU-Tree索引能更有效地缩小搜索空间,减少积分计算的代价.在查询效率方面要明显优于其它的索引方法,尤其适合海量高维不确定数据的概率查询. 展开更多
关键词 初始距离 概率k近邻查询 不确定超球 初始片 概率密度函数
下载PDF
基于独立成分分析的含噪声时间序列预测 被引量:3
8
作者 杨臻明 岳继光 +1 位作者 王晓保 萧蕴诗 《控制与决策》 EI CSCD 北大核心 2013年第4期501-505,共5页
提出一种基于独立成分分析(ICA)的最小二乘支持向量机(LS-SVM),用于时间序列的多步超前独立预测.用ICA估计预测变量中的独立成分(IC),用不含噪声的IC重新构建时间序列.利用-最近邻法(-NN)减小训练集的规模,提出一种新的距离函数以降低LS... 提出一种基于独立成分分析(ICA)的最小二乘支持向量机(LS-SVM),用于时间序列的多步超前独立预测.用ICA估计预测变量中的独立成分(IC),用不含噪声的IC重新构建时间序列.利用-最近邻法(-NN)减小训练集的规模,提出一种新的距离函数以降低LS-SVM训练过程的计算复杂度,并用约束条件对预测值进行后处理.使用基于ICA的LS-SVM、普通LS-SVM与反向传播神经网络(BP-ANN),对多个时间序列进行对比预测实验.实验结果表明,基于ICA的LS-SVM的预测性能优于普通LS-SVM和BP-ANN. 展开更多
关键词 独立成分分析 时间序列预测 -最近邻法 最小二乘支持向量机
原文传递
一种基于κ-近邻互信息变化率的输入变量选择方法 被引量:3
9
作者 韩敏 梁志平 《控制与决策》 EI CSCD 北大核心 2012年第6期949-952,共4页
针对多变量时间序列建模中的输入变量选择问题,提出一种基于κ-近邻互信息变化率的变量选择方法.根据多变量之间的相关关系,以输入输出之间的κ-近邻互信息变化率作为评价标准选择相关变量;同时根据输入变量子集之间互信息值的大小判断... 针对多变量时间序列建模中的输入变量选择问题,提出一种基于κ-近邻互信息变化率的变量选择方法.根据多变量之间的相关关系,以输入输出之间的κ-近邻互信息变化率作为评价标准选择相关变量;同时根据输入变量子集之间互信息值的大小判断变量是否为冗余变量;通过设定合适的阈值系数,可以有效地实现输入变量选择.Friedman,Lorenz混沌时间序列以及Housing数据的变量选择仿真结果验证了所提出方法的有效性. 展开更多
关键词 κ-近邻互信息 输入变量选择 相关分析
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部