-
题名改进的K-means算法在电信客户细分中的应用
被引量:6
- 1
-
-
作者
耿筱媛
张燕平
闫屹
-
机构
安徽大学计算智能与信号处理教育部重点实验室
-
出处
《计算机技术与发展》
2008年第5期163-167,共5页
-
基金
国家自然科学基金项目(60675031
60475017)
+3 种基金
973计划(国家重点基础研究)(2004CB318108)
安徽省教育厅重点自然科学研究项目(2006kj015A)
安徽省教育厅自然科学研究项目(2005kj053)
安徽大学211工程学术创新团队
-
文摘
在K-means算法中,选择不同的初始聚类中心会产生不同的聚类结果且有不同的准确率,并且其迭代过程在时间上不是高效的。针对K-means算法的这两点不足做了一定程度上的改进,理论分析表明,改进后的算法具有较高的准确度和较低的时间复杂度。采用改进后K-means聚类算法对电信客户数据进行聚类分析,得到具有不同特征的客户群组,通过与统计分析的对比,聚类结果分析更合理清晰,更便于对不同群组采取不同的经营策略,为管理者提供了合理的决策支持。
-
关键词
数据挖掘
聚类算法
K-MEANS算法
准则函数
-
Keywords
data mining
clustering
K - means algorithm
Jc
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-
-
题名基于CHI值特征选取和覆盖的文本分类方法
被引量:4
- 2
-
-
作者
闫屹
张燕平
耿筱媛
-
机构
安徽大学计算机学院
-
出处
《计算机技术与发展》
2008年第5期79-81,85,共4页
-
基金
国家自然科学基金(60675031
60475017)
+3 种基金
安徽省教育厅重点自然科学研究项目(2006KJ015A)
安徽省教育厅自然科学研究项目(2005kj053)
安徽大学211工程学术创新团队
973计划(国家重点基础研究)(2004CB318108)
-
文摘
利用CHI值特征选取和前向神经网络的覆盖算法,通过对文本进行分词的预处理后,实现文本的自动分类。该方法利用CHI值进行特征选取即特征降维,应用覆盖算法进行文本分类。该方法将CHI值特征选取和覆盖算法充分结合,在提高了分类速度的同时还保证了分类的准确度。应用该方法对标准数据集中的文本进行实验,并在不同的维数上与SVM算法、朴素贝叶斯方法的实验结果进行了比较。结果表明,与SVM算法和朴素贝叶斯方法相比较,覆盖算法在准确度上更好。并且,维数的选择对分类的精确度影响很大。
-
关键词
文本处理
覆盖算法
文本分类
-
Keywords
text processing
cover algorithm
text classification
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-