期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
一种基于K-Means局部最优性的高效聚类算法 被引量:114
1
作者 雷小锋 谢昆青 +1 位作者 林帆 夏征义 《软件学报》 EI CSCD 北大核心 2008年第7期1683-1692,共10页
K-Means聚类算法只能保证收敛到局部最优,从而导致聚类结果对初始代表点的选择非常敏感.许多研究工作都着力于降低这种敏感性.然而,K-Means的局部最优和结果敏感性却构成了K-MeanSCAN聚类算法的基础.K-MeanSCAN算法对数据集进行多次采样... K-Means聚类算法只能保证收敛到局部最优,从而导致聚类结果对初始代表点的选择非常敏感.许多研究工作都着力于降低这种敏感性.然而,K-Means的局部最优和结果敏感性却构成了K-MeanSCAN聚类算法的基础.K-MeanSCAN算法对数据集进行多次采样和K-Means预聚类以产生多组不同的聚类结果,来自不同聚类结果的子簇之间必然会存在交集.算法的核心思想是,利用这些交集构造出关于子簇的加权连通图,并根据连通性合并子簇.理论和实验证明,K-MeanScan算法可以在很大程度上提高聚类结果的质量和算法的效率. 展开更多
关键词 K-MeanSCAN 基于密度 K-MEANS 聚类:连通性
下载PDF
基于旋转投影统计特征的手写数字识别方法 被引量:2
2
作者 庄伟 雷小锋 +2 位作者 宋丰泰 戴斌 谢昆青 《计算机科学》 CSCD 北大核心 2011年第11期278-281,302,共5页
通过抽取数字的轮廓和骨架来提取几何特征,可以有效地反映手写数字的细节,但手写数字的不规范性导致其识别率并不高。运用统计分析理论可以克服这一缺点。首先提出了基于投影间隔比率和间隔变化的特征提取方法,通过数字投影计算间隔的... 通过抽取数字的轮廓和骨架来提取几何特征,可以有效地反映手写数字的细节,但手写数字的不规范性导致其识别率并不高。运用统计分析理论可以克服这一缺点。首先提出了基于投影间隔比率和间隔变化的特征提取方法,通过数字投影计算间隔的像素数比率和变化趋势,并将其归一化作为特征向量。进一步通过旋转投影基准线,增加特征向量之间的正交性以减少信息冗余,基于这一思路提出旋转投影的识别方法。理论分析和实验证明了旋转投影可以在相同特征数量的情况下达到更高的识别率,并给出了推荐参数。此外,通过旋转投影,直接解决了倾斜数字的识别问题。 展开更多
关键词 统计分析 旋转投影 朴素贝叶斯 最小近邻法 手写数字识别
下载PDF
OPHCLUS:基于序关系保持的层次聚类算法 被引量:1
3
作者 雷小锋 庄伟 +2 位作者 程宇 丁世飞 谢昆青 《山东大学学报(工学版)》 CAS 北大核心 2010年第5期48-55,共8页
引入序关系保持的思想,即层次聚类的簇间距离度量应该能够最大限度地维护样本点间的原始距离排序关系。定义了样本点对序关系的概念和序关系损失度量,证明了序关系损失度量可用做聚类的目标准则函数和聚类结果质量的评价标准。利用序关... 引入序关系保持的思想,即层次聚类的簇间距离度量应该能够最大限度地维护样本点间的原始距离排序关系。定义了样本点对序关系的概念和序关系损失度量,证明了序关系损失度量可用做聚类的目标准则函数和聚类结果质量的评价标准。利用序关系损失的概念扩展出两种簇间距离度量,实现了基于序关系保持的层次聚类算法(order-preserving based hierarchical clustering algorithm,OPHCLUS)。实验仿真证明了OPHCLUS对聚类质量提升的有效性。 展开更多
关键词 层次聚类算法 序关系保持 簇间修正距离 簇间0-1加权距离
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部