-
题名一种优化的顺序IB文本聚类算法
被引量:2
- 1
-
-
作者
叶阳东
张洁
刘东
-
机构
郑州大学信息工程学院
-
出处
《模式识别与人工智能》
EI
CSCD
北大核心
2008年第3期417-423,共7页
-
基金
国家自然科学基金资助项目(No.60674001
60773048)
-
文摘
针对顺序 IB(sIB)算法在文本聚类上存在的诸如易陷入局部优解、效率较低等问题,基于模拟退火方法,提出一种优化的顺序文本聚类算法(SA-isIB).该算法根据一个合理的退火序列,从基本 sIB 算法产生的初始聚类结果中随机选取一定比例的文本,对其类标记进行随机修改并重新对解进行优化,经过退火过程后,得到比 sIB 算法精度更高的文本聚类结果.文本数据集上的实验结果表明,SA-isIB 能有效提高 sIB 算法用于文本聚类的精度.
-
关键词
文本聚类
信息瓶颈理论
模拟退火
基于模拟退火的迭代顺序ib(sa—isib)算法
-
Keywords
Document Clustering, Information Bottleneck (ib) Theory, Simulated Annealing,Simulated Annealing-Iterative Sequential Information Bottleneck (sa-isib) Algorithm
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-