-
题名一种适用于汉语的索引文件结构
- 1
-
-
作者
王丫
蔡建山
唐勇
-
机构
燕山大学信息科学与工程学院
北京中搜在线软件有限公司搜索引擎研发中心
-
出处
《小型微型计算机系统》
CSCD
北大核心
2007年第7期1314-1317,共4页
-
基金
辽宁省自然科学基金资助项目(2004D110)资助.
-
文摘
本文给出一种以词语为索引项的索引文件存储结构,以及基于这种结构的索引查询算法.首先分析中文索引库的分布规律,接着在此基础上设计了一种逆序存储的三层索引结构,这种结构在创建索引时能根据词语频率自动调整存储顺序,最后给出一种基于自动机和逆向最大匹配的索引查询算法.实验系统T IFS将三层索引结构与B树、哈希方法在时间和空间复杂度方面进行对比,结果表明,对于大规模的中文文本检索,三层索引结构的综合效果最好.
-
关键词
三层索引结构
汉语索引
信息检索
自适应算法
-
Keywords
three-layer indexing structure
Chinese indexing
information retrieval
self-adapted algorithm
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名基于双时态RDF模型的索引方法
被引量:1
- 2
-
-
作者
王引娣
章哲庆
严丽
-
机构
南京航空航天大学计算机科学与技术学院
-
出处
《计算机科学》
CSCD
北大核心
2021年第4期63-69,共7页
-
基金
江苏省自然科学基金(BK20191274)
国家自然科学基金(61772269)。
-
文摘
RDF(Resource Description Framework)已被广泛用于大数据的语义表示与处理。传统的RDF只能表示静态语义,无法满足时间敏感场景下随时间动态处理语义的需求。为此,几种时态RDF模型已被提出,包括支持事务时间或有效时间的时态RDF模型,以及同时支持事务时间和有效时间的双时态RDF模型。为有效支持大规模时态RDF的高效处理,文中提出了一种基于双时态模型的时态RDF三层索引结构。第一层根据最大更新次数将双时态RDF数据划分为不同的数据子集;第二层在每一个数据子集上分别建立一棵四叉树来索引时间信息;第三层构建了包含3种组合键的复合位图来索引RDF三元组的主体、谓词和客体信息。实验从索引构建时间、索引占用空间,以及查询所需时间3个方面对所提时态RDF索引结构进行验证,结果表明,所提索引方案能有效缩短查询时间并提高查询效率。
-
关键词
RDF
时态信息
三层索引
四叉树
位图索引
-
Keywords
RDF
Temporal data
Three-level index
Quadtree
Bitmap index
-
分类号
TP399
[自动化与计算机技术—计算机应用技术]
-