摘要
文中提出了一种社会标注系统自适应网页聚类算法,可以自适应找出类别数目k并完成聚类。将随机选择的15组网页语料进行聚类对比实验,采用准确率、召回率、F-Measure值、Purity和NMI这5个指标来评测聚类的效果。实验结果表明,文中所提出的自适应网页聚类算法效果较好。
This paper presents adaptive webpage clustering algorithm in social annotation system,it can find class number k adaptively and complete clustering. It randomly selects 15 groups of Webpage corpus for contrast clustering experiment,and uses the accuracy rate,recall rate,F-Measure value,Purity and NMI indicators to evaluate the clustering effect. Experimental results show that the proposed adaptive webpage clustering algorithm in social annotation system is effective.
作者
郭红建
陈一飞
GUO Hongjian;CHEN Yifei(School of Management Science and Engineering,Nanjing Audit University,Nanjing 211815,China;School of Technology,Nanjing Audit University,Nanjing 211815,China)
出处
《电子科技》
2018年第8期73-76,共4页
Electronic Science and Technology
基金
国家自然科学基金(61202135
71572080)
江苏省公共工程审计重点实验室2012年开放课题(20201201211)
江苏省高校自然科学基金面上项目(BK20171495)
南京审计大学政府审计研究基金(GAS161019)
关键词
社会标注
网页聚类
网页相似度
social annotation
webpage clustering
web similarity