-
题名基于信息粒度的文本聚类算法
被引量:2
- 1
-
-
作者
赵亚琴
邹红艳
-
机构
南京林业大学机械电子工程学院
-
出处
《计算机工程与设计》
CSCD
北大核心
2009年第22期5171-5174,共4页
-
基金
南京林业大学高学历人才基金项目(163040033)
-
文摘
根据文本对象数据的高维性,稀疏性的特点,提出一种基于信息粒度原理的文本聚类方法。首先在给出文本的稀疏特征,文本的稀疏特征向量,文本的稀疏相似度,等价关系隶属度,广义的等价关系等定义的基础上,利用信息粒度原理生成初始聚类,然后提出并理论推导类间相似度的计算方法,进行类的归并。该算法聚类过程不依赖于输入样本的排列顺序,文本数据的有效压缩提高了算法的执行效率。
-
关键词
信息粒度
数据压缩
等价关系隶属度
文本聚类
-
Keywords
information granularity
data compression
membership degree of equivalence relation
text clustering
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-