
基于中文维基百科的领域概念相关性研究 被引量:3

Research on Semantic Relatedness of Domain-specific Concepts Based on Chinese Wikipedia
摘要 以提高领域概念相关性判断的准确度为研究宗旨,提出综合利用中文维基百科的分类体系结构和概念释义内容进行概念间语义相关度计算的方法。选取中文维基百科分类体系下的图书情报领域的概念为实验对象,将基于分类信息和文本信息的加权算法与单独基于分类信息的语义距离算法和信息量算法,以及基于文本信息的文本重叠算法进行对比分析。实验结果表明:加权算法能取得更好的效果,可为实现面向领域的信息检索、领域本体构建等应用提供重要技术支持。 In order to improve the accuracy of computing the relatedness of the domain-specific concepts, this paper proposes a new semantic relatedness algorithm using Chinese Wikipedia category architecture and concept interpretation content. The concepts in library and information science in concept-hierarchy of Chinese Wikipedia are taken as experiment objects, and weighted algorithm based on category and text information are compared with other algorithms only based on Chinese Wikipedia category like Relsctup and Rel or on Chinese Wikipedia article like Rel,r. The experimental results show that the weighted algorithm is better than the others, and provide important technical support for application such as domain - oriented information retrieval, construction of domain ontology and so on.
出处 《图书情报工作》 CSSCI 北大核心 2014年第23期136-142,共7页 Library and Information Service
基金 国家社会科学基金重大项目"基于特定领域的网络资源知识组织与导航机制研究"(项目编号:12&ZD222) 教育部人文社会科学研究青年基金项目"面向轻博客热点话题情感倾向性分析的研究"(项目编号:12YJC870023)研究成果之一
关键词 中文维基百科 领域概念 语义相关性 语义关系 Chinese Wikipedia domain-specific concept semantic relatedness semantic relation
