-
题名汉语文献文外频率加权与逆文献频率加权方法的比较
被引量:1
- 1
-
-
作者
王超
黄水清
杨小莉
-
机构
南京农业大学信息科学技术学院
-
出处
《情报理论与实践》
CSSCI
北大核心
2007年第2期275-277,202,共4页
-
文摘
本文针对信息表示和信息检索中的文外频率加权和逆文献频率加权进行定量分析。以《软件学报》2004年发表的166篇计算机类的文献为测试集,通过计算机切词,统计词频,分别计算出各种语词加权方式不同的权重,并进行比较分析,得出了逆文献频率加权优于文外频率加权法,对文献频率取对数的逆文献频率加权公式优于不取对数的加权公式的结论。
-
关键词
信息检索
加权算法
语词加权
逆文献频率加权
-
Keywords
information retrieval
weight algorithm
word weight
inverse document frequency
-
分类号
G250
[文化科学—图书馆学]
-
-
题名基于逆文献频率加权和N元分析算法的自动标引研究
- 2
-
-
作者
赵麟
陈晓莉
王丽婷
-
机构
南开大学图书馆
国家图书馆出版社
-
出处
《图书馆工作与研究》
CSSCI
北大核心
2013年第6期125-128,共4页
-
基金
南开大学2011年度人文社会科学校内青年项目"文本复合标引研究"(项目编号:NKQ112412)研究成果之一
-
文摘
本文对逆文献频率加权标引和N元分析进行对比分析,同时引入统计学领域的条件概率和信息论中的信息熵这两个工具,针对文献信息的处理提出了基于N元分析与逆文献加权的标引方法,以期提高文献的标引质量,避免自然语言处理中的一些问题。
-
关键词
逆文献频率加权
N元分析
自动标引
-
Keywords
Inverse document frequency weight metbod~ N-gram analysis method
Automatic indexing
-
分类号
G254.36
[文化科学—图书馆学]
-