题名 Web信息检索结构化排序函数与标引词加权技术
被引量:1
1
作者
赵正文
康耀红
机构
海南大学信息科学技术学院通信与信息系统重点实验室
出处
《计算机工程与应用》
CSCD
北大核心
2007年第11期181-184,共4页
基金
国家教育部科学技术重点研究项目(the Key Technologies Project of the Ministry of Education of China No.03144)
海南省自然科学基金(the Natural Science Foundation of Hainan Province of China under Grant No.60533)。
文摘
分析了当前Web信息检索的技术现状,指出检索效率不高的根本原因在于搜索引擎所采用的排序函数和标引词加权技术。介绍了传统的信息检索排序函数和标引词加权技术。分析了Web文档的特点,指出其主要形式HTML文档是一种结构化文档,结构由标签显式地定义,不同文档结构对检索性能的贡献不同。对本领域国内外学者的成果作了对比研究。最后探讨了Web信息检索排序函数及标引词加权技术的发展方向。
关键词
排序函数
标引词加权
文档结构
搜索引擎
Keywords
ranking function
term weighting
document structure
search engine
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 汉语自动标引加权方法试验研究
被引量:1
2
作者
史继红
赖茂生
机构
北京大学信息管理系
出处
《现代图书情报技术》
CSSCI
北大核心
1994年第3期18-21,17,共5页
文摘
本文介绍了几种自动标引加权方法,以及把这几种方法应用于汉语文献自动标引试验的情况,给出了试验的有关数据、基于数据的分析和推出的结论,并对汉语科技文献自动标引中的若干问题进行了探讨。
关键词
自动标引
标引词加权 法
汉语文献
分类号
G254.36
[文化科学—图书馆学]