-
题名一种基于CF树的k-medoids聚类算法
被引量:3
- 1
-
-
作者
曹丹阳
杨炳儒
李广原
刘英华
-
机构
北京科技大学信息工程学院
北方工业大学信息工程学院
-
出处
《计算机应用研究》
CSCD
北大核心
2011年第9期3260-3263,共4页
-
基金
北京市科技计划专项课题
国家自然科学基金资助项目(60875029
+1 种基金
51075423)
北京市属市管高等学校人才强教计划资助项目(PHR20100509)
-
文摘
当存在噪声和离群点时,k-medoids算法具有较好的鲁棒性,但是对于大数据集,算法的计算代价比较高。CF树是Birch算法中常用的一种结构,对于大数据集的聚类有较好的可伸缩性,但是对于非球形的数据,聚类结果较差。因此,在两种算法的基础上,提出一种基于CF树的k-medoids算法,先用数据集构建CF树,形成微簇,改进了欧式距离计算式,最后使用k-medoids算法对微簇进行聚类。当数据点较多时,改进算法比k-medoids算法运行速度快了近2倍。实验表明,改进算法具有较高的性能和可伸缩性。
-
关键词
聚类
K-中心点
cf树
微簇
-
Keywords
clustering
k-medoids
cf-tree
micro-cluster
-
分类号
TP311.138
[自动化与计算机技术—计算机软件与理论]
TP301.6
[自动化与计算机技术—计算机系统结构]
-
-
题名基于重复热点数据的CF广播结构改进算法
被引量:1
- 2
-
-
作者
孙金津
朱玉全
陈耿
-
机构
江苏大学计算机科学与通信工程学院
南京审计学院信息科学学院
-
出处
《计算机应用研究》
CSCD
北大核心
2010年第12期4698-4700,4704,共4页
-
基金
江苏省"青蓝工程"
江苏省六大人才高峰项目(07-E-025)
+2 种基金
江苏省高校自然科学重大基金研究(08KJA520001)
国家中小企业创新基金资助项目(09C26213203797)
国家自然科学基金资助项目(70971067)
-
文摘
针对现有广播结构构建中对数据访问概率倾斜度考虑不足的问题,在CF索引树的基础上提出了一种基于数据倾斜度的广播构建算法。该算法充分考虑热点数据的请求,根据数据在CF索引树中所处位置的不同,在一个广播周期内重复广播热点数据及其对应的索引节点,尽量减少移动用户的访问时间。最后通过实验验证了改进后广播结构的有效性。
-
关键词
移动计算
数据广播
cf索引树
广播结构
-
Keywords
mobile computing
data broadcast
cf index tree
broadcasting structure
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-
-
题名基于密度的改进BIRCH聚类算法
被引量:16
- 3
-
-
作者
韦相
-
机构
红河学院计算机科学与技术系
-
出处
《计算机工程与应用》
CSCD
2013年第10期201-205,共5页
-
基金
云南省教育厅科研基金项目(No.2011C122)
-
文摘
针对传统的BIRCH算法用直径来控制聚类的边界,对非球形聚类效果不佳,甚至会把非球状的簇分割为不同簇这一缺点,对BIRCH算法进行改进,改进算法首先建立多棵CF树,每棵CF树代表一个簇,并结合DBSCAN算法的密度可达的思想。该算法能对任意形状的簇进行准确的聚类。实验表明,算法能通过一次扫描进行有效聚类,时间复杂度与BIRCH算法相同,对大规模数据集具有较高的处理速度,实现了动态聚类,并可以准确地对任意形状的簇进行聚类并发现噪声点。
-
关键词
聚类
cf树
密度
质心
-
Keywords
cluster
cf-trees
density
center of mass
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
TP391
[自动化与计算机技术—计算机应用技术]
-