期刊文献+
共找到14篇文章
< 1 >
每页显示 20 50 100
基于局部均值的K-近质心近邻光谱分类 被引量:3
1
作者 屠良平 魏会明 +3 位作者 王志衡 韦鹏 罗阿理 赵永恒 《光谱学与光谱分析》 SCIE EI CAS CSCD 北大核心 2015年第4期1103-1106,共4页
天体光谱包含着许多重要的关于天体的物理和化学信息,如天体表面的有效温度、重力加速度以及化学丰度等,天体光谱的处理和分析对天文研究具有重要的科学意义。一些大型巡天计划的实施(如SDSS,LAMOST等)使我们获得了海量的天文光谱数据,... 天体光谱包含着许多重要的关于天体的物理和化学信息,如天体表面的有效温度、重力加速度以及化学丰度等,天体光谱的处理和分析对天文研究具有重要的科学意义。一些大型巡天计划的实施(如SDSS,LAMOST等)使我们获得了海量的天文光谱数据,因此天文光谱数据的自动分类成为重要的科学研究课题,然而面对如此海量的光谱数据,一些传统的光谱自动分类方法已经不适用,迫切需要寻找高效率的光谱自动分类技术。研究了基于局部均值的K-近质心近邻(local mean-based K-nearest centroid neighbor,LMKNCN)算法在恒星(Star)、星系(Galaxy)和类星体(Quasar,QSO)的光谱分类中的应用。LMKNCN算法的基本思想是根据近质心近邻原则,从每一类训练样本集中为待测样本点选取k个近质心近邻点,然后根据每一类中所选取的k个近质心近邻点的均值点到待测样本点x的距离来判别x的所属类别。针对美国SDSS-DR8的天体光谱数据,对比了K-近邻、K-近质心近邻、LMKNCN三种算法在恒星、星系和类星体的光谱分类中所表现的性能,结果表明三种方法中,LMKNCN算法对这三种光谱的识别率高于其他两种算法或者与其相当,而且其平均分类正确率高于另外两种算法,特别是在类星体的识别率上表现的更好。表明了该算法对天文光谱大数据的快速处理和有效利用具有重要的意义。 展开更多
关键词 光谱分类 K-近邻 近质心近邻 K-近质心近邻
下载PDF
基于质心的文本分类算法 被引量:6
2
作者 柴玉梅 朱国重 +2 位作者 咎红英 胡达明 冼家扬 《计算机工程》 CAS CSCD 北大核心 2009年第20期83-85,共3页
当文本集较分散或出现多峰值时,基于质心的文本分类算法分类效果很差。针对该问题提出一种改进的文本分类算法,与基于质心的经典分类算法相比,其性能较高。在香港慧科讯业公司提供的文本分类语料库上的测试结果表明,该算法的效率和精度... 当文本集较分散或出现多峰值时,基于质心的文本分类算法分类效果很差。针对该问题提出一种改进的文本分类算法,与基于质心的经典分类算法相比,其性能较高。在香港慧科讯业公司提供的文本分类语料库上的测试结果表明,该算法的效率和精度满足要求。 展开更多
关键词 文本分类 质心 K近邻
下载PDF
基于局部权重k-近质心近邻算法 被引量:2
3
作者 谢红 赵洪野 解武 《应用科技》 CAS 2015年第5期10-13,共4页
k-近质心近邻原则是k-近邻原则的一种有效扩展,是有效的模式分类方法之一。k-近质心近邻原则容易受到局外点的影响;同时,所有的k-近质心近邻点在分类决策时具有相同的权重和分类贡献率,这显然是不合理的。为了解决这一问题,考虑到质心... k-近质心近邻原则是k-近邻原则的一种有效扩展,是有效的模式分类方法之一。k-近质心近邻原则容易受到局外点的影响;同时,所有的k-近质心近邻点在分类决策时具有相同的权重和分类贡献率,这显然是不合理的。为了解决这一问题,考虑到质心近邻在模式分类问题上具有近邻特性和空间分布特性,提出一种基于局部权重的近质心近邻算法,实验结果表明该LWKNCN算法在分类精度上优于传统的KNN算法和KNCN算法。 展开更多
关键词 模式分类 近邻原则 K-近邻 k-近质心近邻 局部权重
下载PDF
扎龙湿地丹顶鹤巢址空间分布变化及其对环境变化指征 被引量:6
4
作者 王志强 傅建春 《生态环境学报》 CSCD 北大核心 2010年第3期697-700,共4页
扎龙国家级湿地保护区是我国一级保护鸟类丹顶鹤最重要的集中繁殖栖息地。以扎龙保护区为研究区,利用质心模型和最近邻体模型等方法,模拟1996至2004年间丹顶鹤(Grus japonensis)巢址的空间分布变化,分析这种变化对环境变化的指示作用。... 扎龙国家级湿地保护区是我国一级保护鸟类丹顶鹤最重要的集中繁殖栖息地。以扎龙保护区为研究区,利用质心模型和最近邻体模型等方法,模拟1996至2004年间丹顶鹤(Grus japonensis)巢址的空间分布变化,分析这种变化对环境变化的指示作用。结果表明:丹顶鹤种群巢址分布出现向核心区集中的现象,鹤巢平均最近邻体距离大幅减少,巢址的空间分布格局由1996年的均匀分布转变为2004年的成群分布型;丹顶鹤巢址的空间分布变化表明该区环境发生巨大的变化:1996年核心区内栖息资源相对均匀、丰富,而缓冲区和实验区适宜生境呈零星分布格局,此后生境质量经历了由适宜→非适宜,适宜生境空间分布由均匀→斑块化的过程,到2004年各功能区适宜生境数量大幅减少,且核心区内适宜生境斑块化严重。为研究区丹顶鹤种群及其生境的保护和管理提供参考。 展开更多
关键词 最近邻体模型 质心模型 斑块化 扎龙国家级湿地保护区
下载PDF
一种基于双重距离尺度的高维索引结构 被引量:3
5
作者 庄毅 翁建广 +1 位作者 庄越挺 吴飞 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2007年第3期380-385,共6页
为了提高高维数据相似查询的效率,提出一种基于双重距离尺度(DDM)的新型高维索引结构.通过建模得到该DDM的四元组数据结构,对于高维空间中的数据点,通过k平均聚类算法将数据点聚成若干类,分别计算每个点对应的始点和质心距离,得到基于... 为了提高高维数据相似查询的效率,提出一种基于双重距离尺度(DDM)的新型高维索引结构.通过建模得到该DDM的四元组数据结构,对于高维空间中的数据点,通过k平均聚类算法将数据点聚成若干类,分别计算每个点对应的始点和质心距离,得到基于加权的质心距离,并将加权的质心距离作为每个数据点的索引键值,且用基于分片的B+树建立索引,得到了该索引的创建算法.高维空间的查询就转变成对一维空间的检索,并研究了数据点的维数、数据量和查询请求参数对查询性能的影响.结果表明,该DDM能更有效地缩小搜索空间,减少距离计算的开销,特别适合海量高维数据的查询. 展开更多
关键词 K近邻查询 类超球 质心距离 始点距离
下载PDF
基于核的最近邻特征重心分类器及人脸识别应用 被引量:2
6
作者 贺云辉 赵力 邹采荣 《电路与系统学报》 CSCD 北大核心 2007年第2期5-10,共6页
本文提出核最近特征线和特征面分类器,可直接对高维人脸图像进行识别。为解决计算量大和可能失效的问题,提出(核)最近特征重心和(核)最近邻特征两种解决方法,前者降低了计算特征线和面距离的复杂度,后者减少了特征线和面的数目,两种方... 本文提出核最近特征线和特征面分类器,可直接对高维人脸图像进行识别。为解决计算量大和可能失效的问题,提出(核)最近特征重心和(核)最近邻特征两种解决方法,前者降低了计算特征线和面距离的复杂度,后者减少了特征线和面的数目,两种方法均避免了可能失效的问题。将二者结合得到的(核)最近邻特征重心分类器,在获得相近识别率的条件下,使计算复杂度降到了最小。所得方法无需预先抽取人脸图像特征,因此避免了在较多样本数时,特征抽取存在计算量大的问题。基于ORL人脸数据库的实验验证了本文方法的有效性。 展开更多
关键词 人脸识别 最近邻特征重心 分类器 核方法
下载PDF
基于LDA+kernel-KNNFLC的语音情感识别方法 被引量:8
7
作者 张昕然 查诚 +2 位作者 徐新洲 宋鹏 赵力 《东南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2015年第1期5-11,共7页
结合K近邻、核学习方法、特征线重心法和LDA算法,提出了用于情感识别的LDA+kernel-KNNFLC方法.首先针对先验样本特征造成的计算量庞大问题,采用重心准则学习样本距离,改进了核学习的K近邻方法;然后加入LDA对情感特征向量进行优化,在避... 结合K近邻、核学习方法、特征线重心法和LDA算法,提出了用于情感识别的LDA+kernel-KNNFLC方法.首先针对先验样本特征造成的计算量庞大问题,采用重心准则学习样本距离,改进了核学习的K近邻方法;然后加入LDA对情感特征向量进行优化,在避免维度冗余的情况下,更好地保证了情感信息识别的稳定性.最后,通过对特征空间再学习,结合LDA的kernel-KNNFLC方法优化了情感特征向量的类间区分度,适合于语音情感识别.对包含120维全局统计特征的语音情感数据库进行仿真实验,对降维方案、情感分类器和维度参数进行了多组对比分析.结果表明,LDA+kernel-KNNFLC方法在同等条件下性能提升效果最显著. 展开更多
关键词 语音情感识别 K近邻 核学习 特征重心线 线性判别分析
下载PDF
基于质心投影波动的离群点检测算法 被引量:3
8
作者 张忠平 张玉停 +1 位作者 刘伟雄 邓禹 《计算机集成制造系统》 EI CSCD 北大核心 2022年第12期3869-3878,共10页
离群点检测是数据挖掘研究的一个重要领域。在传统基于近邻的离群点检测方法中,k近邻关系被广泛使用。然而,随着数据分布的多样化和数据维度的增加,基于k近邻关系算法检测离群点的过程中易受不同类簇影响而检测效果不佳。针对以上问题,... 离群点检测是数据挖掘研究的一个重要领域。在传统基于近邻的离群点检测方法中,k近邻关系被广泛使用。然而,随着数据分布的多样化和数据维度的增加,基于k近邻关系算法检测离群点的过程中易受不同类簇影响而检测效果不佳。针对以上问题,首先通过引入近邻树代替k近邻关系生成新的邻域集合,提出质心投影的概念用来刻画数据对象与其邻居点的分布特征,其次在数据对象邻居点逐渐增多的过程中,离群点和内部点质心投影变化不同,采用质心投影波动来衡量每个数据对象的离群程度,最终提出了基于质心投影波动的离群点检测算法。通过在人工数据集和真实数据集下进行的实验表明,该算法能有效且较为全面地检测离群点。 展开更多
关键词 数据挖掘 离群点检测 K近邻 近邻树 质心投影波动
下载PDF
基于隶属度的模糊加权k近质心近邻算法 被引量:2
9
作者 刘利 张德生 肖燕婷 《计算机工程》 CAS CSCD 北大核心 2022年第7期122-129,共8页
模糊k近质心近邻算法(FKNCN)的分类结果易受噪声点和离群点影响,并且算法对所有样本特征同等对待,不能体现样本特征的差异性。针对这两个问题,提出基于隶属度的模糊加权k近质心近邻算法MRFKNCN。利用密度聚类思想构造新的隶属度函数计... 模糊k近质心近邻算法(FKNCN)的分类结果易受噪声点和离群点影响,并且算法对所有样本特征同等对待,不能体现样本特征的差异性。针对这两个问题,提出基于隶属度的模糊加权k近质心近邻算法MRFKNCN。利用密度聚类思想构造新的隶属度函数计算训练样本的隶属度,以减小噪声或离群样本对分类结果的影响。在此基础上,设计基于冗余分析的Relief-F算法计算每个特征的权重,删去较小权重所对应的特征和冗余特征,并通过加权欧氏距离选取有代表性的k个近质心近邻,提高分类性能。最终,根据最大隶属度原则确定待分类样本的类别。利用UCI和KEEL中的多个数据集对MRFKNCN算法进行测试,并与KNN、KNCN、LMKNCN、FKNN、FKNCN2和BMFKNCN算法进行比较。实验结果表明,MRFKNCN算法的分类性能明显优于其他6个对比算法,平均准确率最高可提升4.68个百分点。 展开更多
关键词 k近质心近邻算法 隶属度 冗余分析 特征选择 数据分类
下载PDF
基于点云边界质心的粗配准方法 被引量:1
10
作者 陆尚鸿 李文国 《电子科技》 2022年第4期53-59,66,共8页
点云配准的质量直接影响着三维重建的质量。针对传统K-4PCS耗时长且易出现错误匹配等问题,文中提出一种基于边界质心的点云粗配准方法。通过对点云进行边界提取,既保留点云外表特征,又减少了点云数据的大小,提高了粗配准速度。为了加快... 点云配准的质量直接影响着三维重建的质量。针对传统K-4PCS耗时长且易出现错误匹配等问题,文中提出一种基于边界质心的点云粗配准方法。通过对点云进行边界提取,既保留点云外表特征,又减少了点云数据的大小,提高了粗配准速度。为了加快边界点的提取速度,使用K-D tree算法完成对k近邻点的搜索。通过配准边界点的质心,减少点云初始距离并增加重叠度,保证了粗配准的精度。实验结果证明,文中方法在粗配准速度和精度方面都优于传统K-4PCS算法,其速度约为传统K-4PCS算法的2倍,平移和旋转精度也比传统K-4PCS高了40%以上。文中所提方法对提高点云粗配准的速度和精度具有一定的参考价值。 展开更多
关键词 点云配准 粗配准 快速配准 边界提取 k近邻点 边界质心 K-4PCS K-D tree
下载PDF
Composite Distance Transformation for Indexing and κ-Nearest-Neighbor Searching in High-Dimensional Spaces 被引量:3
11
作者 庄毅 庄越挺 吴飞 《Journal of Computer Science & Technology》 SCIE EI CSCD 2007年第2期208-217,共10页
Due to the famous dimensionality curse problem, search in a high-dimensional space is considered as a "hard" problem. In this paper, a novel composite distance transformation method, which is called CDT, is proposed... Due to the famous dimensionality curse problem, search in a high-dimensional space is considered as a "hard" problem. In this paper, a novel composite distance transformation method, which is called CDT, is proposed to support a fast κ-nearest-neighbor (κ-NN) search in high-dimensional spaces. In CDT, all (n) data points are first grouped into some clusters by a κ-Means clustering algorithm. Then a composite distance key of each data point is computed. Finally, these index keys of such n data points are inserted by a partition-based B^+-tree. Thus, given a query point, its κ-NN search in high-dimensional spaces is transformed into the search in the single dimensional space with the aid of CDT index. Extensive performance studies are conducted to evaluate the effectiveness and efficiency of the proposed scheme. Our results show that this method outperforms the state-of-the-art high-dimensional search techniques, such as the X-Tree, VA-file, iDistance and NB-Tree. 展开更多
关键词 centroid distance κ-nearest-neighbor search start distance
原文传递
基于局部多均值表示的K-近质心近邻分类算法
12
作者 周承如 熊太松 +2 位作者 吴宏伟 杨园园 宋君 《计算机与数字工程》 2022年第7期1422-1427,共6页
基于局部均值的KNN分类(LMKNN)算法使用了局部均值点来反映样本间的相似性,可以提高分类的正确率。但局部均值点对于分类却依然具有相同的权重,然而不同近邻点应当具有不同的权重。近质心近邻分类(K-Nearest Centroid Neighbor Classifi... 基于局部均值的KNN分类(LMKNN)算法使用了局部均值点来反映样本间的相似性,可以提高分类的正确率。但局部均值点对于分类却依然具有相同的权重,然而不同近邻点应当具有不同的权重。近质心近邻分类(K-Nearest Centroid Neighbor Classifier,KNCN)算法中近质心近邻可以反映样本的几何分布信息,但基于简单的最大投票原则也导致近邻点具有相同权重。故提出了基于局部多均值的K-近质心近邻分类(The Multi-Local Means-Based K-Nearest Centroid Neighbor Classifier,LMRKNCN)算法,为了验证该算法的分类有效性,选取较新的四种对比算法在真实数据集上进行实验比较,结果表明LMRKNCN的分类性能优于其他对比算法。 展开更多
关键词 K-近邻 协作表示 局部均值 近质心近邻 模式分类
下载PDF
WiFi融合环境光定位方法研究 被引量:3
13
作者 陶晓晓 卢小平 +2 位作者 路泽忠 周雨石 余振宝 《测绘科学》 CSCD 北大核心 2020年第6期57-61,72,共6页
针对现有基于WiFi的室内定位算法精度低、稳定性差的问题,该文提出了一种基于WiFi定位的环境光匹配组合室内定位方法。该方法利用智能手机中内置的传感器即可实现连续、可靠的定位。该文首先利用手机光线感应器采集室内环境光强度信息,... 针对现有基于WiFi的室内定位算法精度低、稳定性差的问题,该文提出了一种基于WiFi定位的环境光匹配组合室内定位方法。该方法利用智能手机中内置的传感器即可实现连续、可靠的定位。该文首先利用手机光线感应器采集室内环境光强度信息,并构建环境光指纹数据库;其次利用基于RSSI的质心定位算法进行初步定位;最后通过K-近邻匹配算法进行环境光数据库匹配,从而实现融合定位。实验结果表明,相比传统的仅靠WiFi进行定位的方法,该文算法的定位精度和稳定性有明显提升,可为大型超市、地下停车场、隧道、矿井等室内环境光较为稳定的区域提供定位技术帮助。 展开更多
关键词 室内定位 RSSI 质心定位 环境光 K近邻匹配
原文传递
An encoding-based dual distance tree high-dimensional index
14
作者 ZHUANG Yi ZHUANG YueTing WU Fei 《Science in China(Series F)》 2008年第10期1401-1414,共14页
The paper proposes a novel symmetrical encoding-based index structure, which is called EDD-tree (for encoding-based dual distance tree), to support fast k-nearest neighbor (k-NN) search in high-dimensional spaces.... The paper proposes a novel symmetrical encoding-based index structure, which is called EDD-tree (for encoding-based dual distance tree), to support fast k-nearest neighbor (k-NN) search in high-dimensional spaces. In the EDD-tree, all data points are first grouped into clusters by a k-means clustering algorithm. Then the uniform ID number of each data point is obtained by a dual-distance-driven encoding scheme, in which each cluster sphere is partitioned twice according to the dual distances of start- and centroid-distance. Finally, the uniform ID number and the centroid-distance of each data point are combined to get a uniform index key, the latter is then indexed through a partition-based B^+-tree. Thus, given a query point, its k-NN search in high-dimensional spaces can be transformed into search in a single dimensional space with the aid of the EDD-tree index. Extensive performance studies are conducted to evaluate the effectiveness and efficiency of our proposed scheme, and the results demonstrate that this method outperforms the state-of-the-art high-dimensional search techniques such as the X-tree, VA-file, iDistance and NB-tree, especially when the query radius is not very large. 展开更多
关键词 high-dimensional indexing centroid-distance start-distance k-nearest neighbor search
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部