期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
6
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于主题词对的文档重排方法
被引量:
2
1
作者
何婷婷
许婷
+1 位作者
瞿国忠
涂新辉
《计算机工程与应用》
CSCD
北大核心
2007年第11期161-163,共3页
提出了一种基于主题词对的文档重排方法,使得检索结果在保持召回率的前提下提高精确率。主题词对意指能够共同表征同一主题的两个词语,其中一个来自于查询,另一个来自于文档,两者之间具有紧密的联系。主题词对的选择采用概率潜在语义索...
提出了一种基于主题词对的文档重排方法,使得检索结果在保持召回率的前提下提高精确率。主题词对意指能够共同表征同一主题的两个词语,其中一个来自于查询,另一个来自于文档,两者之间具有紧密的联系。主题词对的选择采用概率潜在语义索引的方法,并根据主题词对在文档中的分布状况对其进行重排。对NTCIR-5中文信息检索的文档集合进行测试,采用trec标准评估方法,结果表明采用该方法使得精确率在rigid和relax结果集上分别提高了53.6%和55.8%。
展开更多
关键词
主题词对
概率潜在语义索引
文档重排
下载PDF
职称材料
基于团模型的文档重排算法研究
被引量:
2
2
作者
付剑波
王明文
+1 位作者
罗远胜
张华伟
《中文信息学报》
CSCD
北大核心
2009年第1期71-78,共8页
为了满足用户对信息检索结果准确不断提高的需求,尽可能应用那些与查询及检索结果有关的信息进行查询结果优化是一种有效的手段。查询扩展和结果重排就是利用附加信息进行检索结果优化的方法。该文提出了基于文档团的文档重排模型(DCRM...
为了满足用户对信息检索结果准确不断提高的需求,尽可能应用那些与查询及检索结果有关的信息进行查询结果优化是一种有效的手段。查询扩展和结果重排就是利用附加信息进行检索结果优化的方法。该文提出了基于文档团的文档重排模型(DCRM模型),此模型通过对文档集的学习,构造文档与文档关系的Markov网络,提取出文档Markov网络中的"文档团",应用文档团信息进行文档重排。在adi、cacm、med、cisi和cran五个数据集上的实验结果表明,本文提出的基于文档团的文档重排模型较BM25模型性能得到有效提高。
展开更多
关键词
计算机应用
中文信息处理
MARKOV网络
文档
团
文档重排
下载PDF
职称材料
倒排索引中的文档序号重排技术综述
被引量:
4
3
作者
史亮
张鸿
+2 位作者
刘欣然
王勇
王斌
《中文信息学报》
CSCD
北大核心
2015年第2期24-32,共9页
倒排索引作为文本搜索的核心索引技术,广泛应用于搜索引擎、桌面搜索和数字图书馆领域。倒排索引由字典和对应的倒排表组成,倒排表一般采用差值存储和整数编码进行压缩。研究表明,当倒排表具有较好的局部连续性时,上述方法能够获得很高...
倒排索引作为文本搜索的核心索引技术,广泛应用于搜索引擎、桌面搜索和数字图书馆领域。倒排索引由字典和对应的倒排表组成,倒排表一般采用差值存储和整数编码进行压缩。研究表明,当倒排表具有较好的局部连续性时,上述方法能够获得很高的压缩率。整数编码研究通过不断改进编码算法来充分利用倒排表的局部连续性特征,而文档序号重排正是一种对文档序号重新排列来产生局部连续性的技术。通过文档序号重排,索引压缩率得到显著提高。该文主要介绍近年来文档序号重排技术取得的研究成果:首先介绍索引压缩的基本原理,然后详细介绍文档序号重排技术,包括分析、对比各个方法的优劣;最后对文档序号重排技术进行总结、整理和展望。
展开更多
关键词
搜索引擎
性能优化
索引压缩
文档
序号
重排
局部连续性
下载PDF
职称材料
支持信息检索结果多样化的排名优化技术研究
4
作者
李洁玉
袁润
王秀红
《科技情报开发与经济》
2015年第6期108-110,共3页
对近年来引起众多信息检索领域研究人员重视的有关支持结果多样化的最新实现技术进行了梳理,对文档重排技术、评价指标和评价活动、有代表性的检索系统等进行了重点介绍,并对该排名优化技术未来的发展趋势进行了分析和探讨。
关键词
信息检索
排名优化技术
文档重排
评价指标
下载PDF
职称材料
融合分类特征的信息检索技术研究
5
作者
李静柏
《黑龙江科技信息》
2011年第11期85-85,共1页
随着互联网信息量呈现指数级增长,人们希望搜索引擎能够把用户最关心的信息排在前面以方便浏览。本文提出了一种基于分类特征选择的信息检索结果重排序方法,将分类特征与其它检索特征融合在一起,在保持分类搜索引擎结果文档召回率的前提...
随着互联网信息量呈现指数级增长,人们希望搜索引擎能够把用户最关心的信息排在前面以方便浏览。本文提出了一种基于分类特征选择的信息检索结果重排序方法,将分类特征与其它检索特征融合在一起,在保持分类搜索引擎结果文档召回率的前提下,该方法有效地提高了检索结果的平均准确率。
展开更多
关键词
信息检索
特征选择
文档重排
LUCENE
下载PDF
职称材料
面向垂直搜索基于本体的可读性计算模型
6
作者
张文雅
宋大为
张鹏
《山东大学学报(理学版)》
CAS
CSCD
北大核心
2016年第7期23-29,共7页
作为一项新兴的信息检索评价指标,可读性在文档相关性、实用性以及质量评估中占据重要地位。其中,如何为用户提供相关可读的文档已成为垂直搜索领域一个亟待解决的问题。为了有效解决这个问题,提出了一种基于本体结构的可读性计算模型...
作为一项新兴的信息检索评价指标,可读性在文档相关性、实用性以及质量评估中占据重要地位。其中,如何为用户提供相关可读的文档已成为垂直搜索领域一个亟待解决的问题。为了有效解决这个问题,提出了一种基于本体结构的可读性计算模型。该模型以用户的阅读抽象过程为背景,分别从语篇表面层次和概念层次对文本进行可读性计算,从而引入了3个可读性指标,即概念势、概念域和文档连贯性。具体地是将单个指标或者指标组合计算所得可读性得分融入传统垂直检索模型中,对文档初次检索结果进行重排。在医学领域中,用户实验结果表明基于本体概念序列信息的可读性指标相对于传统的非序列化指标可以更加有效地预测文档的真实可读性水平。系统实验结果进一步说明了基于可读性的重排序模型可以兼顾文档的相关性和可读性,提升垂直领域信息检索性能。
展开更多
关键词
特定领域信息检索
可读性
文档重排
原文传递
题名
基于主题词对的文档重排方法
被引量:
2
1
作者
何婷婷
许婷
瞿国忠
涂新辉
机构
华中师范大学计算机科学系
教育部教育信息技术工程研究中心
出处
《计算机工程与应用》
CSCD
北大核心
2007年第11期161-163,共3页
基金
国家自然科学基金(the National Natural Science Foundation of China under Grant No.60442005
No.60673040)
+1 种基金
国家社科基金(No.06BYY029)
教育部科学技术研究重点项目(No.105117)。
文摘
提出了一种基于主题词对的文档重排方法,使得检索结果在保持召回率的前提下提高精确率。主题词对意指能够共同表征同一主题的两个词语,其中一个来自于查询,另一个来自于文档,两者之间具有紧密的联系。主题词对的选择采用概率潜在语义索引的方法,并根据主题词对在文档中的分布状况对其进行重排。对NTCIR-5中文信息检索的文档集合进行测试,采用trec标准评估方法,结果表明采用该方法使得精确率在rigid和relax结果集上分别提高了53.6%和55.8%。
关键词
主题词对
概率潜在语义索引
文档重排
Keywords
topic word pair
Probabilistic Latent Semantic Indexing (PLSI)
document re-ranking
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
基于团模型的文档重排算法研究
被引量:
2
2
作者
付剑波
王明文
罗远胜
张华伟
机构
江西财经大学信息管理学院
江西师范大学计算机信息工程学院
江西财经大学现代教育技术中心
出处
《中文信息学报》
CSCD
北大核心
2009年第1期71-78,共8页
基金
国家自然科学基金资助项目(60663007)
江西省科技攻关项目(20062184)
+1 种基金
江西省教育厅科技项目(20072129)
江西省自然科学基金资助项目(2007GZS2168)
文摘
为了满足用户对信息检索结果准确不断提高的需求,尽可能应用那些与查询及检索结果有关的信息进行查询结果优化是一种有效的手段。查询扩展和结果重排就是利用附加信息进行检索结果优化的方法。该文提出了基于文档团的文档重排模型(DCRM模型),此模型通过对文档集的学习,构造文档与文档关系的Markov网络,提取出文档Markov网络中的"文档团",应用文档团信息进行文档重排。在adi、cacm、med、cisi和cran五个数据集上的实验结果表明,本文提出的基于文档团的文档重排模型较BM25模型性能得到有效提高。
关键词
计算机应用
中文信息处理
MARKOV网络
文档
团
文档重排
Keywords
computer application
Chinese information processing
Markov network
document clique
document reranking
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
倒排索引中的文档序号重排技术综述
被引量:
4
3
作者
史亮
张鸿
刘欣然
王勇
王斌
机构
国家计算机网络应急技术处理协调中心
中国科学院信息工程研究所
出处
《中文信息学报》
CSCD
北大核心
2015年第2期24-32,共9页
基金
国家973重点基础研究发展规划项目(2011CB302605)
科技支撑计划(2012BAH47B04)
文摘
倒排索引作为文本搜索的核心索引技术,广泛应用于搜索引擎、桌面搜索和数字图书馆领域。倒排索引由字典和对应的倒排表组成,倒排表一般采用差值存储和整数编码进行压缩。研究表明,当倒排表具有较好的局部连续性时,上述方法能够获得很高的压缩率。整数编码研究通过不断改进编码算法来充分利用倒排表的局部连续性特征,而文档序号重排正是一种对文档序号重新排列来产生局部连续性的技术。通过文档序号重排,索引压缩率得到显著提高。该文主要介绍近年来文档序号重排技术取得的研究成果:首先介绍索引压缩的基本原理,然后详细介绍文档序号重排技术,包括分析、对比各个方法的优劣;最后对文档序号重排技术进行总结、整理和展望。
关键词
搜索引擎
性能优化
索引压缩
文档
序号
重排
局部连续性
Keywords
search engine
performance optimization
index compression
document identifier reordering
locality
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
支持信息检索结果多样化的排名优化技术研究
4
作者
李洁玉
袁润
王秀红
机构
江苏大学图书馆
出处
《科技情报开发与经济》
2015年第6期108-110,共3页
基金
教育部人文社科基金"基于新核函数的相似专利文献检索研究"(编号:13YJC870026)
文摘
对近年来引起众多信息检索领域研究人员重视的有关支持结果多样化的最新实现技术进行了梳理,对文档重排技术、评价指标和评价活动、有代表性的检索系统等进行了重点介绍,并对该排名优化技术未来的发展趋势进行了分析和探讨。
关键词
信息检索
排名优化技术
文档重排
评价指标
Keywords
information retrieval
ranking optimization technology
documents re-ranking
evaluation indicator
分类号
G254.9 [文化科学—图书馆学]
下载PDF
职称材料
题名
融合分类特征的信息检索技术研究
5
作者
李静柏
机构
黑龙江省林业设计研究院
出处
《黑龙江科技信息》
2011年第11期85-85,共1页
文摘
随着互联网信息量呈现指数级增长,人们希望搜索引擎能够把用户最关心的信息排在前面以方便浏览。本文提出了一种基于分类特征选择的信息检索结果重排序方法,将分类特征与其它检索特征融合在一起,在保持分类搜索引擎结果文档召回率的前提下,该方法有效地提高了检索结果的平均准确率。
关键词
信息检索
特征选择
文档重排
LUCENE
分类号
TP391.3 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
面向垂直搜索基于本体的可读性计算模型
6
作者
张文雅
宋大为
张鹏
机构
天津大学计算机科学与技术学院
出处
《山东大学学报(理学版)》
CAS
CSCD
北大核心
2016年第7期23-29,共7页
基金
国家重点基础研究发展计划"973计划"项目(2013CB329304
2014CB744604)
+2 种基金
国家自然科学基金资助项目(61402324
61272265)
教育部博士点基金资助项目(20130032120044)
文摘
作为一项新兴的信息检索评价指标,可读性在文档相关性、实用性以及质量评估中占据重要地位。其中,如何为用户提供相关可读的文档已成为垂直搜索领域一个亟待解决的问题。为了有效解决这个问题,提出了一种基于本体结构的可读性计算模型。该模型以用户的阅读抽象过程为背景,分别从语篇表面层次和概念层次对文本进行可读性计算,从而引入了3个可读性指标,即概念势、概念域和文档连贯性。具体地是将单个指标或者指标组合计算所得可读性得分融入传统垂直检索模型中,对文档初次检索结果进行重排。在医学领域中,用户实验结果表明基于本体概念序列信息的可读性指标相对于传统的非序列化指标可以更加有效地预测文档的真实可读性水平。系统实验结果进一步说明了基于可读性的重排序模型可以兼顾文档的相关性和可读性,提升垂直领域信息检索性能。
关键词
特定领域信息检索
可读性
文档重排
Keywords
vertical search
readability
documents re-ranking
分类号
TP391.3 [自动化与计算机技术—计算机应用技术]
原文传递
题名
作者
出处
发文年
被引量
操作
1
基于主题词对的文档重排方法
何婷婷
许婷
瞿国忠
涂新辉
《计算机工程与应用》
CSCD
北大核心
2007
2
下载PDF
职称材料
2
基于团模型的文档重排算法研究
付剑波
王明文
罗远胜
张华伟
《中文信息学报》
CSCD
北大核心
2009
2
下载PDF
职称材料
3
倒排索引中的文档序号重排技术综述
史亮
张鸿
刘欣然
王勇
王斌
《中文信息学报》
CSCD
北大核心
2015
4
下载PDF
职称材料
4
支持信息检索结果多样化的排名优化技术研究
李洁玉
袁润
王秀红
《科技情报开发与经济》
2015
0
下载PDF
职称材料
5
融合分类特征的信息检索技术研究
李静柏
《黑龙江科技信息》
2011
0
下载PDF
职称材料
6
面向垂直搜索基于本体的可读性计算模型
张文雅
宋大为
张鹏
《山东大学学报(理学版)》
CAS
CSCD
北大核心
2016
0
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部