摘要
为了获得充足的训练语料,提出了半监督的K-means算法(SSK-means),算法的运行过程中不再随机选择初始中心点,而是先从各类标注数据分别选取一个作为初始中心点,其余的则从未标注数据中选择,选择距离已选初始点较远的数据,这就保证初始点不会属于同一类,从而使得标注的结果具有较高的准确率。实验结果表明,SSK-means算法是有效的,它具有较好的性能。
出处
《电脑编程技巧与维护》
2017年第13期40-42,共3页
Computer Programming Skills & Maintenance