摘要
该文提出了一种针对中文专利文本的聚类方法。使用自组织特征映射算法获得初始的聚类中心,并以此作为K-means算法的初始输入,从而得到最终的聚类结果。这样的组合可以在提高聚类准确率的同时,降低运行时间。在聚类之前还对文本进行LSI降维操作,降低了特征向量的维数,使得SOM和K-means两个对维数敏感的算法可以更加有效和快捷。
出处
《海峡科学》
2013年第12期31-33,共3页
Straits Science
基金
福建省科技计划项目<企业专利预警应用的混合聚类关键技术研究>(项目编号:2012H0016)资助