-
题名采用相关反馈和文档相似度的维吾尔语检索词加权方法
- 1
-
-
作者
于丽
亚森.艾则孜
-
机构
新疆警察学院信息安全工程系
-
出处
《华侨大学学报(自然科学版)》
北大核心
2017年第3期408-413,共6页
-
基金
新疆维吾尔自治区自然科学基金资助项目(2015211A016)
-
文摘
针对维吾尔语Web文档的有效检索问题,提出一种基于相关反馈和文档相似度的检索词加权方法.首先,对维吾尔语文档进行预处理,获得相应的词干集.然后,当用户输入多个检索词时,执行初始检索,并基于局部相关反馈思想提取出排名靠前的N个文档.接着,利用TF-IDF算法计算检索词与反馈文档之间的词频相似度,通过余弦距离计算文档之间的相似度,并以此对检索词进行两次加权.最后,根据加权后的检索词进行文档检索.实验结果表明:该方法能够准确地检索出用户所需的文档,并将其靠前排序.
-
关键词
维吾尔语
文档检索
检索词加权
相关反馈
文档相似度
-
Keywords
Uygur
document retrieval
weighted retrieval words
relevance feedback
document similarity
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名相关反馈技术中的检索词排序算法
被引量:2
- 2
-
-
作者
宋玲丽
成颖
-
机构
南京大学信息管理系
-
出处
《现代图书情报技术》
CSSCI
北大核心
2004年第8期44-47,共4页
-
文摘
相关反馈是近年来信息检索领域的研究热点 ,是自动查询扩展中的一种重要形式 ,相关反馈主要包括检索词加权和检索词选择。本文介绍了在相关反馈技术中经典的检索词排序算法 ,对它们带来的性能改进做了比较 ,并提出了相关反馈的实际应用中需要解决的一些问题。
-
关键词
相关反馈
检索词排序
检索词加权
信息检索
-
Keywords
Relevance feedback Term ranking Term weighting Information retrieval
-
分类号
G354
[文化科学—情报学]
-
-
题名一种基于加权网络和句子窗口方案的信息检索模型
被引量:9
- 3
-
-
作者
陆伟
程齐凯
-
机构
武汉大学信息资源研究中心
-
出处
《情报学报》
CSSCI
北大核心
2013年第8期797-804,共8页
-
基金
教育部人文社会科学基地重大项目“面向细粒度的网络信息检索模型及框架构建研究”(项目编号:10JJD630014)
国家自然科学基金面上项目“基于语言模型的通用实体检索建模及框架实现研究”(项目编号:71173164)的研究成果之一
-
文摘
经典的信息检索模型在文档表示上多采用词袋模型,与此不同,本文提出了一种基于加权网络的信息检索模型。在这一模型中,文档被表示为一个加权共词网络,词汇在文档中的重要性通过词项节点在网络中的重要性加以衡量。基于固定窗口平移和句子窗口方案,本文提出了文本游走模型Textrank的四个检索模型变种,分别是Win_Weighted_Textrank、Sent_Weighted_Textrank、Win_Weighted_Posrank和Sent_Weighted_Posrank。在ReuterRCVl上的实验证明,与无权网络模型Textrank、Posrank相比,本文提出的模型能显著地提升检索效果。
-
关键词
信息检索信息检索模型加权网络共词网络
-
Keywords
information retrieval, information retrieval model, weighted network, co-words network
-
分类号
TP391.3
[自动化与计算机技术—计算机应用技术]
-