-
题名面向文本检索的语义计算
被引量:28
- 1
-
-
作者
赵军
金千里
徐波
-
机构
中国科学院自动化研究所模式识别国家重点实验室
-
出处
《计算机学报》
EI
CSCD
北大核心
2005年第12期2068-2078,共11页
-
基金
国家自然科学基金(60372016)
北京市自然科学基金(4052027)资助.
-
文摘
随着信息社会尤其是互联网的发展,人们对文本检索的要求越来越高.作为对传统关键词匹配技术的改进,智能检索研究已经成为热点,并将是支撑下一代互联网的核心技术之一.将语义计算技术应用于文本检索,是智能检索的重要方向.文中在文本检索的两个关键技术(“标引”和“相似度计算”)中引入语义计算技术,用浅层语义来指导检索过程,提高检索准确率.针对“标引”技术,提出了语义树模型;针对“相似度计算”,基于语义张量的概念,结合自然语言处理的一些技术,提出三个可计算的窗口模型来近似语义张量的核心思想.以上工作在一定程度上实现了语义计算的功能.利用TREC数据集进行的评测表明,采用了语义计算技术后,文本检索的准确率可以提高10%左右.
-
关键词
文本检索
自然语言处理
语义计算
语义树
语义张量
TREC评测
-
Keywords
text retrieval
natural language processing
semantic computation
semantic tree
semantic tensor
TREC evaluation
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-