-
题名基于多属性模糊C均值聚类的属性约简算法
被引量:1
- 1
-
-
作者
李诗瑾
李倩
徐桂琼
-
机构
上海大学管理学院
-
出处
《现代电子技术》
北大核心
2017年第21期112-116,共5页
-
基金
国家自然科学基金(11201290)
-
文摘
模糊C均值聚类算法在处理高维数据集时,存在计算复杂度高,算法泛化能力差,计算精度低等问题。考虑到特征属性对聚类的贡献程度的差异,在多属性模糊C均值聚类的思想上,提出一种基于属性重要性的约简算法。为验证有效性,在UCI数据集上,将新算法与因子分析法和粗糙集理论约简方法进行比较分析。实验结果表明,该方法具有更好的泛用性,在平均标准差大或类间中心距离较远的数据集上具有更好的性能。
-
关键词
数据挖掘
模糊C均值聚类
属性约简
聚类效果
-
Keywords
data mining
fuzzy C-means clustering
attribute reduction
clustering effect
-
分类号
TN911.134
[电子电信—通信与信息系统]
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名多属性加权的模糊c均值聚类算法
被引量:1
- 2
-
-
作者
李诗瑾
李倩
徐桂琼
-
机构
上海大学管理学院
-
出处
《微电子学与计算机》
CSCD
北大核心
2017年第7期92-95,100,共5页
-
基金
国家自然科学基金(11201290)
-
文摘
在多属性模糊c均值聚类的基础上,提出了一种基于属性重要性加权的聚类算法.为验证新算法的有效性,在6个UCI数据集上,将新算法与结合主成分分析法和基于粗糙集指数加权的聚类方法进行了比较分析.实验结果表明,基于属性重要性的聚类算法具有更好的泛用性和稳定性,且随着平均类间簇心距离的增大而提升聚类有效性.
-
关键词
数据挖掘
模糊C均值聚类
属性重要性
-
Keywords
data mining
fuzzy c-means algorithm
attributes importance
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于谱聚类与多因子融合的协同过滤推荐算法
被引量:2
- 3
-
-
作者
李倩
李诗瑾
徐桂琼
-
机构
上海大学管理学院
-
出处
《计算机应用研究》
CSCD
北大核心
2017年第10期2905-2908,共4页
-
基金
国家自然科学基金资助项目(11201290)
-
文摘
针对传统协同过滤算法面临数据稀疏、忽略用户时间上下文信息及对兴趣物品偏好程度等问题,提出基于谱聚类与多因子融合的协同过滤推荐算法。首先将FCM聚类融入到谱聚类算法的关键步骤,并通过聚类有效性指数对用户聚类个数进行优化,以降低生成最近邻的时耗;然后将Salton因子、时间衰减因子、用户偏好因子进行融合,从而对相似度进行改进;最后获取系统当前时间为目标用户生成推荐列表。Movie Lens上的实验结果表明,该算法在推荐精度、覆盖率及新颖度指标上有较大改善,提升了推荐性能。
-
关键词
协同过滤
谱聚类
Salton因子
时间衰减因子
用户偏好因子
-
Keywords
collaborative filtering
spectral clustering
Salton factor
time decay factor
user preference factor
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-