-
题名基于词关联度的文本检索系统
- 1
-
-
作者
丁立恺
夏勇明
钱松荣
-
机构
复旦大学通信科学与工程系
-
出处
《微型电脑应用》
2011年第3期62-64,6,共4页
-
文摘
基于对语料的统计分析,提出了词关联度的概念。通过对文本库中词语出现的频率,以及任意两个词语共同出现的频率进行统计,获得了各个词语之间的关联度,并使用这一参数对语义向量进行调整,可以有效地解决传统向量空间模型的单词依赖问题。结合倒排索引技术,实际建立了一个相当规模的文本检索系统。测试结果表明,系统具有较好的效果和良好的性能,具备实用价值。
-
关键词
词关联度
信息检索
向量空间模型
倒排索引
-
Keywords
Word Relation
Information Retrieval
VSM
Inverted Index
-
分类号
TP391.3
[自动化与计算机技术—计算机应用技术]
-