摘要
在互联网信息爆炸的时代,百科成为了互联网用户获取可信结构化信息的首选途径,然而,现有的百科文档的不规范、概念体系的不健全,造成了相当一大部分百科文档没能归入现有概念体系,影响了知识体系的构造和再生。文章以百度百科作为研究对象,采用基于信息框属性的分类算法,以及基于相关实体的分类算法对百度百科中的未分类文档进行分类,实验表明,两种算法都具有较高的分类准确率,结合两种算法能覆盖除部分只有标题信息的绝大部分未分类文档,因此,能对百科实例的分类问题给出较好的解答。
出处
《科技创新与应用》
2015年第13期47-49,共3页
Technology Innovation and Application