通过对CURE(Clustering Using Representatives)的研究,在此基础上,针对网络话题文本内容广泛、孤立点较多的特点,增加对孤立点的预处理过程,提出一种适用于网络话题文本聚类的层次聚类算法。该算法能降低算法对孤立点的敏感度,同时提...通过对CURE(Clustering Using Representatives)的研究,在此基础上,针对网络话题文本内容广泛、孤立点较多的特点,增加对孤立点的预处理过程,提出一种适用于网络话题文本聚类的层次聚类算法。该算法能降低算法对孤立点的敏感度,同时提高聚类效率,通过实验证明改进后的算法更适合运用在网络话题文本的快速聚类中。展开更多
文摘通过对CURE(Clustering Using Representatives)的研究,在此基础上,针对网络话题文本内容广泛、孤立点较多的特点,增加对孤立点的预处理过程,提出一种适用于网络话题文本聚类的层次聚类算法。该算法能降低算法对孤立点的敏感度,同时提高聚类效率,通过实验证明改进后的算法更适合运用在网络话题文本的快速聚类中。