-
题名限定语义距离的关键词同义扩展及精简
被引量:2
- 1
-
-
作者
段利国
陈俊杰
-
机构
太原理工大学计算机科学与技术学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2011年第23期13-16,24,共5页
-
基金
国家自然科学基金No.60970059
山西省国际科技合作计划项目(No.2009081022)~~
-
文摘
针对现存的单纯借助同义词词林或知识词典扩展关键词方法中存在噪音数据和计算量大的问题,提出了先扩展后精简的方法,即先利用同义词词林进行同义扩展,再利用知网义原树计算扩展词之间的语义距离,依据语义距离剔除相似度较小的噪音数据,实现关键词集合的精简。实验表明,当词语相似度阈值取0.8时,精简比例高达46.9%,精简后的关键词集合有效剔除了噪音数据,兼顾了信息检索的召回率和准确率,表现出良好的综合性能。
-
关键词
汉语问答系统
关键词扩展
义原树
关键词集合精简
-
Keywords
Chinese question-answer system
keywords expansion
sememe tree
reduction of keywords set
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-