期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于改进CURE算法的微博热点话题发现 被引量:12
1
作者 杨长春 周猛 +1 位作者 叶施仁 徐小松 《计算机仿真》 CSCD 北大核心 2013年第11期383-387,共5页
由于微博平台的信息量大,为对博文热点进行准确识别,本文提出了一种基于经典CURE聚类算法的改进算法来发现微博热点话题。本文选取了20391条中文微博作为样本数据集,通过将博文稀疏矩阵化达到将高维数据降维的效果,很大程度上提高了计... 由于微博平台的信息量大,为对博文热点进行准确识别,本文提出了一种基于经典CURE聚类算法的改进算法来发现微博热点话题。本文选取了20391条中文微博作为样本数据集,通过将博文稀疏矩阵化达到将高维数据降维的效果,很大程度上提高了计算的精度和速度。从选取CURE层次聚类的代表点出发,将代表点转换为博文种子集,同时调节收缩因子,加大排除博文的异常点,利用CURE层次聚类算法的思想设计了改进的CURE算法来发现微博热点话题,通过实验发现改进CURE层次聚类算法能够将数据集中的74.65%作为孤立点,更好的提高了算法的精度,同时准确地抓住长尾效应的"头部",能够更加直观的发现微博热点话题。 展开更多
关键词 稀疏矩阵 热点话题 层次聚类算法 博文种子集 改进层次聚类算法
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部