-
题名基于知网的词汇集聚分析
- 1
-
-
作者
石晶
戴国忠
-
机构
长春工业大学计算机科学与工程学院
中国科学院软件研究所
-
出处
《现代图书情报技术》
CSSCI
北大核心
2008年第9期41-46,共6页
-
文摘
词汇集聚提供了文本的结构启示,因而在许多自然语言处理中有极为重要的应用。介绍基于知网分析词汇集聚的方法,首先利用语义网络的形式将知网知识表示出来;然后在文本概念间有引导地建立推理路径;最后基于路径搜索形成体现集聚的词汇链。测试表明,基于知网推理形成的词汇链基本符合人的直觉,准确率较高。
-
关键词
词汇集聚
语义网络
文本推理
-
Keywords
Lexical cohesion Semantic Network Text inference
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名基于词汇集聚的文档相关性计算
被引量:3
- 2
-
-
作者
赵玉茗
徐志明
王晓龙
朱鲲鹏
-
机构
哈尔滨工业大学计算机科学与技术学院
-
出处
《电子与信息学报》
EI
CSCD
北大核心
2008年第10期2512-2515,共4页
-
基金
国家"863"计划项目(2006AA012197)
国家自然科学基金重点项目(60435020)资助课题
-
文摘
该文提出了一种基于词汇集聚的文档相关性计算方法。该方法以知网为知识库,依靠词汇集聚,将文档中存在语义关联的词语连接成链,计算各条词汇链权重,以词汇链为元素对文档进行形式化表示,最终利用文档的此种形式化表示进行相关匹配计算。该文在中图法分类的语料上,开展了文档相关性计算的实验,准确率达到了85.4%。实验结果表明,该方法在一定程度上描述了文档的语义信息,将文档间的相关比较从字符或词层面的直接比较提升到近似概念层次的比较,是一种计算文档间相关性的有效方法。
-
关键词
词汇集聚
文档相关性
向量空间模型
-
Keywords
Lexical cohesion
Relevance
Vector space model
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-