题名 复杂布尔查询下的文档收集打分策略的优化
被引量:2
1
作者
黄达
闫宏飞
机构
北京大学信息科学技术学院
出处
《计算机科学与探索》
CSCD
北大核心
2017年第1期106-113,共8页
基金
国家重点基础研究发展计划(973计划)
国家自然科学基金~~
文摘
虽然布尔查询是信息检索领域中较早提出的一个概念,但是对布尔查询的大量研究主要还是针对布尔操作一致的布尔查询。对于复杂布尔查询,目前并没有太多的相关研究,复杂布尔查询却越来越被频繁地使用(如文本推荐领域)。为了促使这类查询能够被更加高效地执行,提出了一种基于DAAT(document-at-a-time)框架的文档收集打分策略——DCQ(DAAT for complex query)算法,并与著名开源搜索引擎Lucene进行比较实验,查询性能有了显著提升。此外,提出了一套对查询性能的回归预测机制,该机制能比较准确地决策DCQ算法的使用时机。实验表明,结合了性能预测器的复合算法要远优于Lucene当前的文档收集打分算法。
关键词
复杂布尔查询
查询 优化
性能回归
Keywords
complex Boolean query
optimizing query
performance regression
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 Lucene架构下布尔查询的执行计划研究
被引量:1
2
作者
赵广
机构
武汉体育学院体育工程与信息技术学院
出处
《云南民族大学学报(自然科学版)》
CAS
2019年第6期606-611,共6页
基金
湖北省教育科学规划项目(2018GA018)
湖北省教育厅教学研究项目(2017170,2018170)
武汉体育学院校级重点项目(2015022)
文摘
Lucene是一个优秀的全文检索框架,布尔查询是其实现精准数据检索的重要功能.对于布尔查询执行计划的深入研究,有利于灵活应用布尔查询,优化查询表达式,提高执行效率.本文从Lucene架构下布尔查询的执行计划入手,研究了布尔查询的表示方式、执行时序、逻辑运算规则和子查询归并算法.根据布尔查询的执行计划,提出了深度为2的复杂布尔查询的化简规律和布尔逻辑运算满足交换律的特性,并从理论上证明它们的正确性.最后通过实验模拟仿真,验证这些规律的有效性.
关键词
LUCENE
布尔查询
多路归并
执行计划
Keywords
Lucene
Boolean query
k-way
merge
execution plan
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
题名 基于STE的减少查询泄露的关系数据库加密方案
3
作者
苏雨晨
马昌社
机构
华南师范大学计算机学院
出处
《网络与信息安全学报》
2024年第2期165-181,共17页
文摘
近年提出的基于部分预计算的SQL连接索引(PpSj)方案是一种基于结构化加密技术的关系数据库加密方案,它利用部分预计算索引连接技术和过滤哈希集技术支持高效的连接查询和布尔查询。但是,该方案也存在一些缺陷,主要表现在执行布尔查询时会泄露过多的信息,以及不能支持范围查询。针对这些问题,提出一种改进的多功能加密数据库(MFEDB)方案,该方案在PpSj方案基础上,引入一种混合过滤技术,结合2种过滤方法,减少了布尔查询的信息泄露,扩展了支持的结构化查询语言(SQL)的查询子集,包括等值查询、连接查询、布尔查询和范围查询,同时平衡了服务器存储开销与客户端和服务器之间产生的通信开销。
关键词
等值查询
连接查询
范围查询
布尔查询
结构化加密
Keywords
equivalent query
join query
range query
Boolean query
structured encryption
分类号
TP309
[自动化与计算机技术—计算机系统结构]
题名 布尔查询的改写算法
被引量:1
4
作者
谢丽聪
俞建家
张莹
机构
福州大学数学与计算机科学学院
出处
《福州大学学报(自然科学版)》
CAS
CSCD
2004年第4期457-461,共5页
基金
福建省教育厅科研资助项目(JB03054
JB02099
JB02100)
文摘
研究数据集成中的布尔查询的改写问题.考虑布尔查询的特殊性,简化了布尔查询的改写处理,给出了在封闭世界假设下的多项式改写算法和开放世界假设下的指数型改写算法,同时说明两个算法都是可靠的.
关键词
布尔查询
改写算法
封闭世界假设
开放世界假设
Keywords
Boolean query
rewriting algorithms
closed world assumption
open world assumption
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
题名 倒排索引查询处理技术
被引量:5
5
作者
林俊鸿
姜琨
杨岳湘
机构
国防科学技术大学计算机学院
国防科学技术大学信息中心
出处
《计算机工程与设计》
北大核心
2015年第3期572-575,580,共5页
基金
国家自然科学基金项目(61170286)
文摘
介绍索引系统的基本结构以及经典查询处理方式DAAT和TAAT,给出在AND和OR两种布尔查询下的查询处理算法实现细节。分析结果表明,在海量索引规模查询的情况下,DAAT索引遍历方式要优于TAAT索引遍历方式,OR查询和AND查询的性能差距进一步加大,基于TREC WT2G和GOV2的多组实验验证了分析的结论。指出下一步在海量索引规模下搜索引擎查询处理研究的方向。
关键词
搜索引擎
倒排索引
跳转指针
查询 处理
布尔查询
Keywords
search engine
inverted index
skipping pointer
query processing
Boolean query
分类号
TP301
[自动化与计算机技术—计算机系统结构]
题名 带有范例元组的交互式数据转换映射方法研究
6
作者
李静
李贵
李征宇
韩子扬
曹科研
机构
沈阳建筑大学
出处
《数据挖掘》
2021年第2期84-99,共16页
文摘
模式映射是Web异构大数据集成的重要研究内容之一,通常包含实例层和模式层两方面的研究,本文的研究重点主要集中在模式层。要想在短时间内完全掌握这门技术并且加以运用,这对于那些不熟悉模式转换所涉及的转换语义和语言的非专家用户来说几乎是不可能的。因此,本文在已有的关于数据转换研究成果的基础之上提出了一个适用于非专家用户的交互式模式映射设计框架系统。首先,对由非专家用户提供的不完整的表达性较差的数据转换范例元组进行预处理。然后,再通过简单的用户交互递归地对初始范例元组的有效性进行布尔查询从而得到最终映射规则。其次,本文提出了两种探索所有数据转换映射空间的策略以满足任意用户范例元组。在探索过程中系统会根据与用户交互的结果来保留最适合用户需求的规则,并动态地剪枝搜索空间从而减少与用户交互的次数,本文实验采用来自中国土地市场网的数据集成转换来验证本文方法的有效性。
关键词
Web大数据
数据集成
数据转换
模式映射
布尔查询
分类号
TP3
[自动化与计算机技术—计算机科学与技术]
题名 元搜索引擎
被引量:3
7
作者
仇海峰
出处
《中国经济和信息化》
1997年第32期60-63,共4页
文摘
在Internet上遨游时,我们常常要使用各种搜索引擎,以找到所需的信息。一些著名的搜索引擎如:Alta Vista, InfoSeek和Yahoo等都能为我们提供较为满意的搜索结果。但除了这些独立的搜索引擎之外,网上还有另一种搜索引擎,称为元搜索引擎(meta-search engine)。和独立搜索引擎相比,元搜索引擎既有其优势,也有一些缺点。但对于经常上网查询信息的人来说,它无疑是一种值得一试的选择。
关键词
元搜索引擎
独立搜索引擎
查询 工具
查询 时间
黄页
新闻组
查询 方式
.com
个人主页
布尔查询
分类号
TP393.09
[自动化与计算机技术—计算机应用技术]