期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
Lucene索引段合并优化策略
被引量:
3
1
作者
熊安萍
李传根
曹春江
《重庆邮电大学学报(自然科学版)》
CSCD
北大核心
2020年第1期105-112,共8页
随着大数据应用发展,如何从海量数据中进行高效信息搜索成为研究热点。Lucene全文搜索引擎通过索引段合并来提高索引效率,但Lucene索引段合并过程大多需要从磁盘加载各索引段,将占用大量系统资源,降低系统吞吐量。针对该问题,提出基于Lu...
随着大数据应用发展,如何从海量数据中进行高效信息搜索成为研究热点。Lucene全文搜索引擎通过索引段合并来提高索引效率,但Lucene索引段合并过程大多需要从磁盘加载各索引段,将占用大量系统资源,降低系统吞吐量。针对该问题,提出基于Lucene索引段合并优化策略,该策略通过负载系数来选择不同的索引段合并操作。为提高数据的检索速度,进一步建立索引段相似度评价模型来选择出最优合并索引段集合进行合并。通过与现有Tiere,LogByte,LogDoc等合并策略进行实验对比,提出的优化策略能有效减少索引段合并次数,提升系统吞吐量及索引效率。
展开更多
关键词
LUCENE
索引段合并
负载系数
索引
段
相似度
最优
合并
索引
段
下载PDF
职称材料
题名
Lucene索引段合并优化策略
被引量:
3
1
作者
熊安萍
李传根
曹春江
机构
重庆邮电大学计算机科学与技术学院
中国电信股份有限公司云南分公司
出处
《重庆邮电大学学报(自然科学版)》
CSCD
北大核心
2020年第1期105-112,共8页
基金
重庆市基础科学与前沿技术研究项目(cstc2017jcyjAX)
重庆市教委科学技术研究项目(KJ1704085)
重庆邮电大学博士启动基金(A2015-17)~~
文摘
随着大数据应用发展,如何从海量数据中进行高效信息搜索成为研究热点。Lucene全文搜索引擎通过索引段合并来提高索引效率,但Lucene索引段合并过程大多需要从磁盘加载各索引段,将占用大量系统资源,降低系统吞吐量。针对该问题,提出基于Lucene索引段合并优化策略,该策略通过负载系数来选择不同的索引段合并操作。为提高数据的检索速度,进一步建立索引段相似度评价模型来选择出最优合并索引段集合进行合并。通过与现有Tiere,LogByte,LogDoc等合并策略进行实验对比,提出的优化策略能有效减少索引段合并次数,提升系统吞吐量及索引效率。
关键词
LUCENE
索引段合并
负载系数
索引
段
相似度
最优
合并
索引
段
Keywords
Lucene
merging of index segment
node load
similarity of index segment
optimal index segment of merging
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
Lucene索引段合并优化策略
熊安萍
李传根
曹春江
《重庆邮电大学学报(自然科学版)》
CSCD
北大核心
2020
3
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部