期刊文献+
共找到62篇文章
< 1 2 4 >
每页显示 20 50 100
自适应引力密度峰值聚类优化算法
1
作者 罗岚 詹凤 +2 位作者 周传华 任太娇 周昊 《微电子学与计算机》 2024年第3期21-28,共8页
针对密度峰值聚类(Density Peak Clustering,DPC)算法对截断距离的取值较为敏感,密度度量标准不统一且人为选取聚类中心存在主观性的问题,提出了一种自适应引力密度峰值聚类优化(Optimized Adaptive Gravitational Density Peak Cluster... 针对密度峰值聚类(Density Peak Clustering,DPC)算法对截断距离的取值较为敏感,密度度量标准不统一且人为选取聚类中心存在主观性的问题,提出了一种自适应引力密度峰值聚类优化(Optimized Adaptive Gravitational Density Peak Clustering Algorithm,OAGDPC)算法。首先采用模糊加权K-近邻技术(Fuzzy Weighted KNearest Neighbors Density Peak Clustering,FKNN-DPC)重新定义了局部密度,统一了密度度量的标准;然后提出一种自适应选择聚类中心的策略,结合基于引力的密度峰值(Gravitational Density Peak Clustering,GDPC)算法中牛顿万有引力定律与DPC算法的参数映射,使用引力类比距离,并设置综合考虑局部密度和引力的决策参数,依据决策参数降序折线图的顶角变化自适应确定聚类中心;最后聚集非中心点并识别异常点。实验选取DPC、GDPC、FKNN-DPC和OAGDPC在人工和UCI数据集上进行测试,结果表明,OAGDPC算法在各数据集上都有良好的表现,特别在聚类结果准确性、自适应能力、鲁棒性方面相对于对比算法具有明显优势。 展开更多
关键词 密度峰值聚类 聚类中心自适应 K最近邻 模糊邻域
下载PDF
RSSI室内定位在线匹配算法的研究与性能比较
2
作者 吴之宁 汪学刚 邹林 《江西师范大学学报(自然科学版)》 CAS 北大核心 2024年第1期69-74,共6页
针对在基于WiFi信号强度RSSI进行室内定位的指纹库算法的在线匹配环节中存在的不足,该文利用基于阈值R_(0)动态筛选匹配的指纹点数,提出了一种增强加权k近邻算法(EWKNN).因为阈值R_(0)可以动态筛选指纹库中的样本点,所以能够提高增强加... 针对在基于WiFi信号强度RSSI进行室内定位的指纹库算法的在线匹配环节中存在的不足,该文利用基于阈值R_(0)动态筛选匹配的指纹点数,提出了一种增强加权k近邻算法(EWKNN).因为阈值R_(0)可以动态筛选指纹库中的样本点,所以能够提高增强加权k近邻算法的适用度和高精度.仿真结果表明:在R_(0)设置恰当的情况下,增强加权k近邻算法的计算量与加权k近邻算法(WKNN)相当,但定位精度更高. 展开更多
关键词 室内定位 指纹库在线匹配 增强加权k近邻算法 加权k近邻算法 累积分布函数
下载PDF
融合稀疏约束的双向k近邻粗糙集模型
3
作者 樊晓雪 尹涛 +2 位作者 陆杨 鞠恒荣 丁卫平 《小型微型计算机系统》 CSCD 北大核心 2024年第10期2370-2377,共8页
k近邻粗糙集作为邻域粗糙集的拓展,被广泛应用于知识发现等领域.k近邻粗糙集模型的粒度构建是选取最近的k个样本.然而,传统k近邻粒度不能有效处理样本分布不均匀的数据.此外,单向粒度构建方法也会导致部分离群点被归入到粒度模型中,增... k近邻粗糙集作为邻域粗糙集的拓展,被广泛应用于知识发现等领域.k近邻粗糙集模型的粒度构建是选取最近的k个样本.然而,传统k近邻粒度不能有效处理样本分布不均匀的数据.此外,单向粒度构建方法也会导致部分离群点被归入到粒度模型中,增加了粒度的不确定性.为了解决上述问题,提升粒度模型的稳定性,本文提出了一种融合稀疏约束的双向k近邻粗糙集模型.首先,通过稀疏约束模型刻画样本之间联系,选取紧密关联的样本构造稀疏双向k近邻粒度.然后,基于双向互邻信息策略,剔除模型中不符合该策略的样本.最后,通过条件熵与互信息熵刻画粒度的不确定性程度.UCI数据集的实验结果证明,本文提出的融合稀疏约束的双向k近邻粗糙集模型能够降低信息的不确定性,也为k近邻粗糙集模型的改进提供了新的方向. 展开更多
关键词 k近邻粗糙集 稀疏约束 双向策略 条件熵 互信息熵
下载PDF
基于邻域互信息与K-means特征聚类的特征选择 被引量:1
4
作者 孙林 梁娜 徐久成 《智能系统学报》 CSCD 北大核心 2024年第4期983-996,共14页
针对多数邻域系统通过人工调试很难搜索到最佳邻域半径,以及传统的K-means聚类需要随机选取簇中心和指定簇的数目等问题,提出了一种基于邻域互信息与K-means特征聚类的特征选择方法。首先,将样本在各特征下与其他样本距离的平均值作为... 针对多数邻域系统通过人工调试很难搜索到最佳邻域半径,以及传统的K-means聚类需要随机选取簇中心和指定簇的数目等问题,提出了一种基于邻域互信息与K-means特征聚类的特征选择方法。首先,将样本在各特征下与其他样本距离的平均值作为自适应邻域半径,确定样本的邻域集,并由此构建自适应邻域熵、邻域互信息、归一化邻域互信息等度量,反映特征之间的相关性;然后,基于归一化邻域互信息构建自适应K近邻集合,利用Pearson相关系数表示特征的权重定义加权K近邻密度,实现自动选取K-means算法的簇中心,进而完成K-means特征聚类;最后,给出加权平均冗余度,选出每个特征簇中加权平均冗余度最大的特征构成最优特征子集。实验结果表明所提算法不仅可以有效提升特征选择的分类结果而且可以获得更好的聚类效果。 展开更多
关键词 特征选择 邻域互信息 K-MEANS 特征聚类 自适应K近邻 特征权重 加权K近邻密度
下载PDF
通过相似度支持度优化基于K近邻的协同过滤算法 被引量:126
5
作者 罗辛 欧阳元新 +1 位作者 熊璋 袁满 《计算机学报》 EI CSCD 北大核心 2010年第8期1437-1445,共9页
个性化推荐系统能基于用户个人兴趣为用户提供定制信息.此类系统通常使用协同过滤技术实现,其中一种广泛使用的经典模型是基于用户评分相似度的k近邻模型.使用k近邻模型需要预先计算出用户或者项目的k个最近邻居,k值过大时会导致计算量... 个性化推荐系统能基于用户个人兴趣为用户提供定制信息.此类系统通常使用协同过滤技术实现,其中一种广泛使用的经典模型是基于用户评分相似度的k近邻模型.使用k近邻模型需要预先计算出用户或者项目的k个最近邻居,k值过大时会导致计算量过大而影响推荐产生的实时性,而k值过小则会导致推荐精度下降.为解决此问题,该文中提出了一种新的最近邻度量——相似度支持度.基于相似度支持度,该文提出了数种能够在保持推荐精度和密度的前提下维持合理规模的k近邻的策略.在真实大规模数据集上的实验结果表明,相比传统算法,该文提出的策略能够在保证推荐精度的前提下大幅降低计算复杂度. 展开更多
关键词 个性化推荐 协同过滤 相似度支持度 K近邻 近邻关系模型
下载PDF
基于WiFi的自适应匹配预处理WKNN算法 被引量:17
6
作者 王磊 周慧 +1 位作者 蒋国平 郑宝玉 《信号处理》 CSCD 北大核心 2015年第9期1067-1074,共8页
针对基于接收信号强度(Received Signal Strength,RSS)的WiFi室内定位技术中,传统加权K邻近(Weighted K-nearest Neighbor,WKNN)算法不能自适应获取WLAN中有效接入点(Acess Point,AP)且参考点匹配准确度不高的问题,本文提出了自适应匹... 针对基于接收信号强度(Received Signal Strength,RSS)的WiFi室内定位技术中,传统加权K邻近(Weighted K-nearest Neighbor,WKNN)算法不能自适应获取WLAN中有效接入点(Acess Point,AP)且参考点匹配准确度不高的问题,本文提出了自适应匹配预处理WKNN算法。该算法中每个实时定位点自适应地根据网络状况对AP的RSS均值由大到小排序,然后选择RSS均值较大的前M个AP,与参考点中对应的M个AP一起参与匹配预处理计算,从而优化了传统的指纹定位算法。同时将室内定位和室内地图相结合,使参考点和定位结果直观地展示在地图上,并通过使用地图数据大幅度简化了离线训练过程。此外,本文设计并实现了基于Android平台的室内定位系统,通过该系统验证了本文所提算法在单点定位和移动定位中的有效性。实验结果表明,该算法可获得30以上的定位误差改善,有效提高了定位精度和定位稳定性。 展开更多
关键词 WIFI 室内定位 室内地图 加权K邻近算法 自适应匹配预处理
下载PDF
一种面向聚类的隐私保护数据发布方法 被引量:13
7
作者 崇志宏 倪巍伟 +1 位作者 刘腾腾 张勇 《计算机研究与发展》 EI CSCD 北大核心 2010年第12期2083-2089,共7页
隐私保护微数据发布技术可以在保护敏感数据隐私的同时,维持数据的可用性.但已有的多数发布方法都局限于类别属性数据集,发布后数据可用性以维持数据聚集查询可用性和频繁项集分析、分类挖掘可用性为主.针对数据挖掘领域另一重要任务—... 隐私保护微数据发布技术可以在保护敏感数据隐私的同时,维持数据的可用性.但已有的多数发布方法都局限于类别属性数据集,发布后数据可用性以维持数据聚集查询可用性和频繁项集分析、分类挖掘可用性为主.针对数据挖掘领域另一重要任务——聚类分析,以及聚类分析中常处理的数值属性数据隐藏发布问题,提出隐藏算法NeSDO,算法对数据记录关于聚类可用性的特征进行分析,引入个性数据记录和共性数据记录的定义.采用合成数据替换扰动方法,为个性数据记录定义相应的正邻域记录集和负邻域记录集.对共性数据记录用其k最近邻域数据记录的均值替换;对个性数据记录分别采用其正邻域记录集或负邻域记录集内记录的均值进行置换,实现隐藏处理.理论分析和实验结果表明,算法NeSDO能够较好地保护敏感数值不泄露,同时能够有效保持发布后数据的聚类可用性. 展开更多
关键词 隐私保护数据发布 聚类 k邻域 个性数据记录 共性数据记录
下载PDF
采用聚类算法优化的K近邻协同过滤算法 被引量:20
8
作者 尹航 常桂然 王兴伟 《小型微型计算机系统》 CSCD 北大核心 2013年第4期806-809,共4页
协同过滤推荐是电子商务系统最重要的技术之一,而协同过滤技术中一种被广泛使用的算法就是基于用户评分相似度的K近邻算法.该算法简单有效,易于实现.但K近邻算法在决定待预测样本的预测评分时,并未考虑这K个最近邻与其隶属类别的关联程... 协同过滤推荐是电子商务系统最重要的技术之一,而协同过滤技术中一种被广泛使用的算法就是基于用户评分相似度的K近邻算法.该算法简单有效,易于实现.但K近邻算法在决定待预测样本的预测评分时,并未考虑这K个最近邻与其隶属类别的关联程度.作为评分矩阵中的不同样本,由于它们对分类贡献各不相同,因此在评分预测时需要区别对待.本文采用中心聚类算法,先求出各样本与其所属类别的类别关联度,再利用类别关联度来区别对待待预测样本的K个最近邻.通过实验证明,优化后的K近邻算法能较好的提高推荐精度. 展开更多
关键词 K近邻 协同过滤 聚类算法 类别关联度
下载PDF
一种向量等价置换隐私保护数据干扰方法 被引量:6
9
作者 倪巍伟 张勇 +2 位作者 黄茂峰 崇志宏 贺玉芝 《软件学报》 EI CSCD 北大核心 2012年第12期3198-3208,共11页
近年来,隐私保护数据发布得到了研究者的广泛关注,聚类与隐藏原理上的差异使得面向聚类的隐藏成为难点.针对现有保距和保分布隐藏难以有效兼顾数据聚类可用性和隐私安全的不足,提出基于保邻域隐藏的扰动算法VecREP(vector equivalent re... 近年来,隐私保护数据发布得到了研究者的广泛关注,聚类与隐藏原理上的差异使得面向聚类的隐藏成为难点.针对现有保距和保分布隐藏难以有效兼顾数据聚类可用性和隐私安全的不足,提出基于保邻域隐藏的扰动算法VecREP(vector equivalent replacing based perturbing method),通过分析数据点邻域组成结构,引入能够保持数据邻域组成稳定的安全邻域定义.进一步基于向量偏移与合成思想,提出有效保持邻域数据分布特征的等价置换弧.对任意数据点,采用随机选取位于其安全邻域内等价置换弧上点替换的策略实现隐藏.将算法与已有的RBT,TDR,Camp-crest和NeNDS算法进行实验比较,结果表明:VecREP算法具有与保距隐藏算法RBT相近的聚类可用性,优于其余算法,能够较好地维持数据聚类的可用性.同时,具有好于其余算法的数据隐私保护安全性. 展开更多
关键词 隐私保护数据发布 聚类 安全邻域 等价置换弧 k邻域
下载PDF
基于动态k近邻的SlopeOne协同过滤推荐算法 被引量:20
10
作者 孙丽梅 李晶皎 孙焕良 《计算机科学与探索》 CSCD 2011年第9期857-864,共8页
协同过滤是个性化推荐系统中的常用技术,数据稀疏性是影响协同过滤算法预测精度的主要因素。SlopeOne算法利用线性回归模型解决数据稀疏性问题。基于用户相似度的k近邻方法可以优化参与预测的用户评分数据的质量。在SlopeOne算法的基础... 协同过滤是个性化推荐系统中的常用技术,数据稀疏性是影响协同过滤算法预测精度的主要因素。SlopeOne算法利用线性回归模型解决数据稀疏性问题。基于用户相似度的k近邻方法可以优化参与预测的用户评分数据的质量。在SlopeOne算法的基础上,提出了一种动态k近邻和SlopeOne相结合的算法。首先根据用户之间相似度的具体情况动态地为每个用户选择不同数目的近邻用户,然后利用近邻用户的评分数据生成项目之间的平均偏差,最后利用线性回归模型进行预测。在MovieLens数据集上的实验结果表明,改进算法在预测精度上比原SlopeOne算法有所提高,能适应数据稀疏度更低的推荐系统,并且与其他协同过滤算法相比,推荐精度也具有明显优势。 展开更多
关键词 协同过滤 推荐系统 K近邻 数据挖掘 知识发现
下载PDF
改进的K近邻方法在岩性识别中的应用 被引量:14
11
作者 王淑盛 徐正光 +2 位作者 刘黄伟 王志良 史立峰 《地球物理学进展》 CSCD 2004年第2期478-480,共3页
 岩性识别是石油勘探中的一项重要内容,数据信息的精度往往会严重的影响到识别的准确率.本文根据数据的特点,改进了传统的K近邻方法,提出了加权K近邻的方法,进一步增强了利用测井数据识别岩性的能力,并在实际应用中证明了本方法的正确...  岩性识别是石油勘探中的一项重要内容,数据信息的精度往往会严重的影响到识别的准确率.本文根据数据的特点,改进了传统的K近邻方法,提出了加权K近邻的方法,进一步增强了利用测井数据识别岩性的能力,并在实际应用中证明了本方法的正确性和实用性. 展开更多
关键词 加权K近邻 岩性识别 石油勘探
下载PDF
基于高斯核函数的局部离群点检测算法 被引量:7
12
作者 关绍云 郑丽坤 +3 位作者 金一宁 郭靖天 张忠平 苗创业 《哈尔滨商业大学学报(自然科学版)》 CAS 2019年第2期185-190,203,共7页
随着信息技术的快速发展,数据资源的结构越来越复杂,离群点挖掘受到越来越多人关注.基于高斯核函数,考虑数据对象的k个最近邻居,反向k近邻居和共享最近邻居三种邻居关系,估计数据对象的密度,提出了一种基于高斯核函数的局部离群点检测算... 随着信息技术的快速发展,数据资源的结构越来越复杂,离群点挖掘受到越来越多人关注.基于高斯核函数,考虑数据对象的k个最近邻居,反向k近邻居和共享最近邻居三种邻居关系,估计数据对象的密度,提出了一种基于高斯核函数的局部离群点检测算法.该算法通过KNN图存储每个数据对象的最近邻,包括k最近邻,反向k近邻和共享最近邻,构成数据对象的邻居集合S;通过核密度估计KDE方法估计数据对象的密度;通过相对密度离群因子RDOF来估计数据对象偏离邻域的程度,进而判定数据对象是否为离群点,并在真实和合成的数据集上证明了该算法的有效性. 展开更多
关键词 离群点 高斯核函数 核密度 共享邻居 k最近邻 数据挖掘
下载PDF
一种快速的基于稀疏表示分类器 被引量:19
13
作者 陈才扣 喻以明 史俊 《南京大学学报(自然科学版)》 CSCD 北大核心 2012年第1期70-76,共7页
基于稀疏表示的分类器(sparse representation-based classifier,SRC)被证实是一种非常有效的分类器.但SRC往往要通过一个超完备基来求得测试样本的稀疏表示,当数据库的数据量较大时,算法的计算复杂度成为限制其优良性能的瓶颈,致使SRC... 基于稀疏表示的分类器(sparse representation-based classifier,SRC)被证实是一种非常有效的分类器.但SRC往往要通过一个超完备基来求得测试样本的稀疏表示,当数据库的数据量较大时,算法的计算复杂度成为限制其优良性能的瓶颈,致使SRC无法用于实时识别.针对该问题,提出一种简便有效的改进算法,其试图寻求一个较小的超完备基来计算测试样本的稀疏表示,从而大大的缩减算法的计算复杂度.具体来说,对于每个测试样本点,首先,求出该测试样本点可能归属的类别,而后利用可能归属类的样本而并非所有的训练样本来对测试样本进行稀疏表示计算.ORL人脸库和FERET人脸库上的实验结果表明改进算法不仅能较大程度的缩减算法的计算复杂度,而且排除了干扰类的影响,从而在某种程度上提高了算法的识别率. 展开更多
关键词 稀疏表示 K-近邻 邻近类 分类方法 人脸识别
下载PDF
基于CBR+RBR的快速应急预案生成方法 被引量:10
14
作者 李洋 李星 +1 位作者 吴秋云 陈荦 《兵工自动化》 2013年第5期31-35,共5页
针对现存应急预案大都是文本形式预案,用于处理突发事件时指导性不强、指导作用不明显,提出基于案例推理(case based reasoning,CBR)与基于规则推理(rule based reasoning,RBR)相结合的方法。采用RBR方法,推理得出需要的应急预案,运用CB... 针对现存应急预案大都是文本形式预案,用于处理突发事件时指导性不强、指导作用不明显,提出基于案例推理(case based reasoning,CBR)与基于规则推理(rule based reasoning,RBR)相结合的方法。采用RBR方法,推理得出需要的应急预案,运用CBR方法,使用最近邻匹配方法从案例库中查找符合给定相似度的案例,并将2种方法相结合。结果表明:该方法能克服单独使用CBR时面临的无规则预案生成陷入困境及单独使用RBR时预案生成延时及规则建立难度大的瓶颈,兼容RBR极强的推理演绎能力和CBR建立与维护系统容易的优势,使生成应急预案更加高效可靠。 展开更多
关键词 应急预案 基于案例推理 基于规则推理 K近邻匹配
下载PDF
基于密度的不确定数据离群点检测研究 被引量:6
15
作者 洪沙 林佳丽 张月良 《计算机科学》 CSCD 北大核心 2015年第5期230-233,264,共5页
针对不确定数据集进行离群点检测,设计了基于密度的不确定数据的局部离群因子(Uncertain Local Outlier Factor,ULOF)算法。通过建立不确定数据的可能世界模型来确定不确定对象在可能世界中的概率。结合传统的LOF算法推导出ULOF算法,根... 针对不确定数据集进行离群点检测,设计了基于密度的不确定数据的局部离群因子(Uncertain Local Outlier Factor,ULOF)算法。通过建立不确定数据的可能世界模型来确定不确定对象在可能世界中的概率。结合传统的LOF算法推导出ULOF算法,根据ULOF值判断不确定对象的局部离群程度;然后对ULOF算法的效率性和准确性进行了详细分析,提出了基于网格的剪枝策略、k最近邻查询优化来减少数据的候选集;最后通过实验证明了ULOF算法对不确定数据检测的可行性和效率性,优化后的方法有效地提高了异常检测准确率,降低了时间复杂度,改善了不确定数据的异常检测性能。 展开更多
关键词 不确定数据 局部离群点检测 可能世界模型 k最近邻
下载PDF
基于局部均值的K-近质心近邻光谱分类 被引量:3
16
作者 屠良平 魏会明 +3 位作者 王志衡 韦鹏 罗阿理 赵永恒 《光谱学与光谱分析》 SCIE EI CAS CSCD 北大核心 2015年第4期1103-1106,共4页
天体光谱包含着许多重要的关于天体的物理和化学信息,如天体表面的有效温度、重力加速度以及化学丰度等,天体光谱的处理和分析对天文研究具有重要的科学意义。一些大型巡天计划的实施(如SDSS,LAMOST等)使我们获得了海量的天文光谱数据,... 天体光谱包含着许多重要的关于天体的物理和化学信息,如天体表面的有效温度、重力加速度以及化学丰度等,天体光谱的处理和分析对天文研究具有重要的科学意义。一些大型巡天计划的实施(如SDSS,LAMOST等)使我们获得了海量的天文光谱数据,因此天文光谱数据的自动分类成为重要的科学研究课题,然而面对如此海量的光谱数据,一些传统的光谱自动分类方法已经不适用,迫切需要寻找高效率的光谱自动分类技术。研究了基于局部均值的K-近质心近邻(local mean-based K-nearest centroid neighbor,LMKNCN)算法在恒星(Star)、星系(Galaxy)和类星体(Quasar,QSO)的光谱分类中的应用。LMKNCN算法的基本思想是根据近质心近邻原则,从每一类训练样本集中为待测样本点选取k个近质心近邻点,然后根据每一类中所选取的k个近质心近邻点的均值点到待测样本点x的距离来判别x的所属类别。针对美国SDSS-DR8的天体光谱数据,对比了K-近邻、K-近质心近邻、LMKNCN三种算法在恒星、星系和类星体的光谱分类中所表现的性能,结果表明三种方法中,LMKNCN算法对这三种光谱的识别率高于其他两种算法或者与其相当,而且其平均分类正确率高于另外两种算法,特别是在类星体的识别率上表现的更好。表明了该算法对天文光谱大数据的快速处理和有效利用具有重要的意义。 展开更多
关键词 光谱分类 K-近邻 近质心近邻 K-近质心近邻
下载PDF
基于双重匹配位置指纹的室内停车场定位方法 被引量:5
17
作者 杨澜 康宁 +3 位作者 艾玉亮 惠飞 张方政 彭伟 《测控技术》 CSCD 2017年第6期24-28,共5页
为了提高室内停车场的寻车效率,提出了一种基于双重匹配位置指纹的室内停车场定位方法。该方法在加权K邻近算法基础上,利用RSSI值得出用户坐标,融合数据过滤算法与格点对应算法,以降低算法的定位误差,并采用双重数据库方法提高定位效率... 为了提高室内停车场的寻车效率,提出了一种基于双重匹配位置指纹的室内停车场定位方法。该方法在加权K邻近算法基础上,利用RSSI值得出用户坐标,融合数据过滤算法与格点对应算法,以降低算法的定位误差,并采用双重数据库方法提高定位效率。实验采用均方根误差与累积分布函数两种指标对比了WKNN算法、过滤WKNN算法、格点WKNN算法与本文算法,实验结果表明本文算法具有较高的定位精度。 展开更多
关键词 室内定位 位置指纹 加权K邻近法
下载PDF
基于K-近邻树的离群检测算法 被引量:4
18
作者 范小刚 朱庆生 万家强 《计算机应用研究》 CSCD 北大核心 2015年第3期669-673,共5页
为适应数据集分布形状多样性以及克服数据集密度问题,针对已有算法对离群簇检测效果欠佳的现状,提出了一种基于K-近邻树的离群检测算法KNMOD(outlier detection based on K-nearest neighborhood MST)。算法结合密度与方向因素,提出一... 为适应数据集分布形状多样性以及克服数据集密度问题,针对已有算法对离群簇检测效果欠佳的现状,提出了一种基于K-近邻树的离群检测算法KNMOD(outlier detection based on K-nearest neighborhood MST)。算法结合密度与方向因素,提出一种基于K-近邻的不相似性度量,然后带约束切割基于此度量构建的最小生成树从而获得离群点。算法可以有效地检测出局部离群点以及局部离群簇,与LOF、COF、KNN及INFLO算法的对比结果也证实了算法的优越性能。 展开更多
关键词 离群检测 离群簇 最小生成树 不相似性 K-近邻
下载PDF
面向手机信令数据的交通枢纽人流量短时预测算法 被引量:7
19
作者 林培群 雷永巍 +1 位作者 张孜 陈丽甜 《哈尔滨工业大学学报》 EI CAS CSCD 北大核心 2018年第9期89-95,共7页
为实现对重点区域人群聚集动态的有效掌握,保障区域人群的及时疏运,预防群体性安全事故的发生,以广州市火车站枢纽区域为例,通过对海量手机信令数据进行信息处理,结合地理信息系统将手机信令数据映射至研究区域,实现区域人流量的实时统... 为实现对重点区域人群聚集动态的有效掌握,保障区域人群的及时疏运,预防群体性安全事故的发生,以广州市火车站枢纽区域为例,通过对海量手机信令数据进行信息处理,结合地理信息系统将手机信令数据映射至研究区域,实现区域人流量的实时统计,同时分析了大都市火车站枢纽区域春运人流量变化情况,得出春运期间区域人流量存在周期性变化的规律,以此为基础,构建了以平均绝对百分比误差最小的k值自适应计算模型,设计了基于手机信令数据的城市交通枢纽人流量k近邻预测算法,并以节假日与非节假日两种不同交通模式环境进行算法测试.结果表明:所建立的预测算法在两种模式下其平均绝对百分比误差PMAPE分别在6%与5%以内,均能够较为准确地对区域人流量进行预测. 展开更多
关键词 城市交通 交通枢纽 手机信令数据 K近邻算法 人流量短时预测
下载PDF
PODKNN:面向大数据集的并行离群点检测算法 被引量:7
20
作者 苟杰 马自堂 张喆程 《计算机科学》 CSCD 北大核心 2016年第7期251-254,274,共5页
针对现有离群点检测算法在运用于大规模数据集时时间效率较低的问题,提出一种基于K近邻的并行离群点检测算法PODKNN(Parallel Outlier Detection Based on K-nearest Neighborhood)。该算法利用划分策略对数据集进行预处理,在规模较小... 针对现有离群点检测算法在运用于大规模数据集时时间效率较低的问题,提出一种基于K近邻的并行离群点检测算法PODKNN(Parallel Outlier Detection Based on K-nearest Neighborhood)。该算法利用划分策略对数据集进行预处理,在规模较小的子集中寻找K近邻并计算离群度,最后合并结果并遴选出离群点,设计算法过程使其符合MapReduce的编程模型,实现并行化,从而提高了离群点检测算法处理大规模数据的计算效率。实验结果表明,PODKNN具有较高的加速比及较好的扩展性。 展开更多
关键词 数据挖掘 离群点检测 K近邻 MAPREDUCE
下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部