-
题名二元互关联后继树精简索引模型研究
被引量:2
- 1
-
-
作者
霍林
黄俊文
卢正鼎
黄保华
潘英花
王力
-
机构
华中科技大学计算机学院
广西大学计算机与电子信息学院
-
出处
《小型微型计算机系统》
CSCD
北大核心
2011年第2期286-290,共5页
-
基金
国家"八六三"高技术研究发展计划项目(2007AA01Z403)资助
-
文摘
全文检索领域的关键问题是索引模型以及索引的创建与检索算法.基于二元互关联后继树模型,提出一个实用性能好的后继节点有序的后继树精简索引模型(SIRST),并给出此模型下索引的创建与检索算法.通过将该模型与使用广泛的倒排文件模型(IF)进行比较,表明SIRST的检索效率远远高于IF,同时,随着文本集规模越来越大,SIRST的创建效率优势愈发明显.
-
关键词
二元互关联后继树
后继节点有序
互关联后继树精简索引模型
-
Keywords
IRST
sorted successive node
SIRST
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于互关联后继树的XML索引技术
被引量:6
- 2
-
-
作者
雷向欣
胡运发
杨智应
刘勇
张凯
-
机构
复旦大学计算机与信息技术系
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2005年第7期1261-1271,共11页
-
基金
国家自然科学基金项目(60473070)
国家"八六三"高技术研究发展计划基金项目(2001AA115020)
-
文摘
提出了一种新的根树节点编码方法———基于叶序区间的节点编码(LOINS).编码方法只需对根树后序遍历一次即可完成,能实现常数时间内对任意两个树节点间前后代关系的判断.同时,结合互关联后继树模型(IRST)的标引性、可压缩性等特点,提出基于IRST的根树索引模型IsBaRTII,及对该模型空间优化的索引模型IsBaRTIII.IsBaRTII,II采用树节点名称(标签)及其在根树(XML文档树)中的出现计数索引节点间的父子关系和节点叶序区间编码,实现索引结构和节点编码的相互统一.IsBaRTII,II索引建立时间、空间代价小,可快速查询满足XPath表达式在XML文档树中的节点序列和路径.
-
关键词
XML
XPATH
互关联后继树
索引
查询
-
Keywords
XML
XPath
inter-relevant successive trees
index
query
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名互关联后继树模型及其实现
被引量:10
- 3
-
-
作者
申展
江宝林
张谧
唐磊
胡运发
-
机构
复旦大学计算机与信息技术系
-
出处
《计算机应用与软件》
CSCD
北大核心
2005年第3期7-9,104,共4页
-
基金
国家自然科学基金资助项目 (编号 :60 1 730 2 7)
-
文摘
全文检索是文本数据库研究的核心 ,而全文检索的首要问题是全文检索模型的选择。本文介绍了一种新颖的全文检索模型———互关联后继树模型及其实现 ,并将该模型与传统的倒排表模型进行了比较 。
-
关键词
文本数据库
全文检索模型
互关联后继树模型
信息检索
-
Keywords
Full-text retrieval Information retrieval Inter-relevant successive trees(IRST)
-
分类号
TP311.133
[自动化与计算机技术—计算机软件与理论]
G354.45
[文化科学—情报学]
-
-
题名基于互关联后继树的概念格构造算法
被引量:15
- 4
-
-
作者
张凯
胡运发
王瑜
-
机构
复旦大学计算机与信息技术系
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2004年第9期1493-1499,共7页
-
基金
国家自然科学基金项目 (60 173 0 2 7)
国家"八六三"高技术研究发展计划基金项目 (2 0 0 1AA115 0 2 0 )
-
文摘
概念格是知识工程中一个重要的知识表达工具 ,同时也是形式概念分析的核心 目前已出现了许多有效的概念格构造算法 提出了一个基于互关联后继树的概念格构造算法 ,以扩展的互关联后继树为数据模型 ,通过对树的搜索和相关判定定理完成所有形式概念的生成 分析了算法的性能 。
-
关键词
形式概念分析
概念格
互关联后继树
概念支持度
-
Keywords
FCA
concept lattice
IRST
concept support
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名基于互关联后继树的时间序列相似性查询
被引量:7
- 5
-
-
作者
曾海泉
宋扬
申展
胡运发
-
机构
复旦大学计算机与信息技术系数据库中心
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2004年第2期325-332,共8页
-
基金
国家自然科学基金项目 ( 60 173 0 2 7)
-
文摘
时间序列的相似性查询是分析时间序列变化规律的一种重要方法 ,对于时间序列的分类、预测以及知识发现都具有重要的现实意义 提出了一种基于分段技术的、同时支持可变长度的快速相似性查询方法 其主要思想是 :首先依据序列变化的重要点将序列逐步分段 ,抽取各子段的变化特征 ,通过分类方法将其转变成符号序列 在此基础上 ,引入一种称为互关联后继树的全文索引技术 ,从而实现序列的快速相似性查询 ,其时间复杂度降到了O(L) ,此外 。
-
关键词
时间序列
相似性查询
重要点分段
互关联后继树
-
Keywords
time series
similarity query
important point segmentation
inter-relevant successive trees(IRST)
-
分类号
TP182
[自动化与计算机技术—控制理论与控制工程]
-
-
题名基于互关联后继树的多时间序列关联模式挖掘
被引量:5
- 6
-
-
作者
曾海泉
刘永丹
宋扬
胡运发
-
机构
复旦大学计算机与信息技术系
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2003年第7期934-940,共7页
-
基金
国家自然科学基金 ( 60 173 0 2 7)
-
文摘
时间序列是现实生活中常见的数据形式之一 ,在时间序列中发现频繁模式是分析时间序列变化规律的一项重要任务 提出基于互关联后继树的多时间序列关联模式挖掘算法 该算法首先用Allen逻辑位置关系来描述序列状态关系 ,根据这些关系在时间窗口内顺序或并行出现情况 ,获得一个由这些关系组成的特殊序列 在此基础上提出了一个基于互关联后继树的新型挖掘模型 ,实现了序列间关联模式的挖掘 与其他方法相比 ,该算法简单、直观 ,而且整个挖掘过程不需要生成候选模式 。
-
关键词
时间序列
数据挖掘
关联模式
互关联后继树
-
Keywords
time series
data mining
relation pattern
inter relevant successive tree
-
分类号
TP182
[自动化与计算机技术—控制理论与控制工程]
-
-
题名基于互关联后继树的Web日志挖掘技术
被引量:2
- 7
-
-
作者
江宝林
张川
申展
葛家翔
胡运发
-
机构
复旦大学计算机与信息技术系
-
出处
《计算机应用与软件》
CSCD
北大核心
2004年第5期9-11,112,共4页
-
基金
国家自然科学基金项目 (编号 :60 1 730 2 7)
-
文摘
本文将互关联后继树 (Inter RelatedSuffixTree ,IRST)模型应用于Web日志事务挖掘 ,构造Web日志事务集的互关联后继树结构 ,从中挖掘频繁路径。
-
关键词
INTERNET
WEB
日志挖掘
互关联后继树
计算机网络
网站
-
Keywords
Web log mining Web log transaction Frequent path Inter-related Suffix tree(IRST)
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-
-
题名基于互关联后继树的频繁模式挖掘研究
被引量:2
- 8
-
-
作者
申展
江宝林
唐磊
胡运发
-
机构
复旦大学计算机与信息技术系
-
出处
《计算机工程》
CAS
CSCD
北大核心
2004年第21期30-32,共3页
-
基金
国家自然科学基金资助项目(60173027)
-
文摘
关联规则挖掘是数据挖掘的一个重要的研究内容,而产生频繁模式集是关联规则挖掘的第1步工作。很多传统的频繁模式挖掘算法都需要产生候选模式集,因而效率很低。该文提出了一种不需要产生候选集,而直接构造频繁集的频繁模式挖掘算法——基于互关联后继树的频繁模式挖掘算法。实验证明,该算法具有较好的性能。
-
关键词
关联规则
频繁模式挖掘
互关联后继树模型
数据挖掘
-
Keywords
Association rules
Frequent patterns mining
Inter-relevant successive tree(IRST)
-
分类号
TP274
[自动化与计算机技术—检测技术与自动化装置]
-
-
题名基于三元互关联后继树的Web日志挖掘
被引量:1
- 9
-
-
作者
张忠平
高一博
-
机构
燕山大学信息科学与工程学院
-
出处
《计算机应用与软件》
CSCD
2011年第10期50-54,共5页
-
基金
国家自然科学基金(60773100)
河北省教育厅科研计划项目(2006143)
-
文摘
针对二元的互关联后继树模型进行改进,构造三元互关联后继树,并结合Web日志的特点,构造Web事务集的互关联后继树和增量更新模型,设计基于三元互关联后继树的频繁路径挖掘算法,挖掘Web日志中的频繁路径。通过实验证明了基于三元互关联后继树和改进后的模型的出色插入查询性能。
-
关键词
WEB日志挖掘
WEB事务
互关联后继树
频繁路径
-
Keywords
Web log mining Web transaction Inter-related suffix tree Frequent paths
-
分类号
TP311.132.4
[自动化与计算机技术—计算机软件与理论]
-
-
题名互关联后继树技术及其在黄页搜索引擎系统中的应用
- 10
-
-
作者
胡运发
陶晓鹏
王政华
杨笑天
-
机构
复旦大学信息科学与工程学院
-
出处
《中国索引》
2007年第3期26-32,共7页
-
文摘
本文详细研究了互关联后继树技术在中国电信黄页搜索引擎系统中的应用。其技术核心是互关联后继树全文索引模型,它能够较好地满足搜索引擎对全文索引的各项要求。本文还给出了应用系统的软件设计方案,主要功能模块和使用方法。
-
关键词
互关联后继树
搜索引擎
黄页搜索
系统实现
使用说明
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于互关联后继树的数学表达式检索
被引量:4
- 11
-
-
作者
刘惠丛
田冰洁
田学东
-
机构
河北大学计算机科学与技术学院
河北金融学院经济贸易系
-
出处
《计算机工程》
CAS
CSCD
北大核心
2017年第6期129-135,共7页
-
基金
国家自然科学基金(61375075)
河北省高等学校科学技术研究重点项目(ZD2017208)
-
文摘
数学表达式结构复杂多样,给检索带来困难。为此,提出一种数学表达式索引与检索方法。在索引阶段,通过对LaTeX数学表达式特点的分析与归纳,定义面向表达式二维结构特性的数学表达式特征表示方式,将互关联后继树索引模型应用于数学表达式索引的构建,以解决树结构表示表达式的层次增长问题。在匹配阶段,设计包括精确匹配、相容匹配、子式匹配、模糊匹配等查询模式的匹配算法。在浏览器/服务器模式下采用51 076条数学表达式进行索引与匹配。实验结果表明,提出的方法可加快查询速度,减小索引存储空间,能够适应数学表达式的结构特点,取得较好的检索效果。
-
关键词
数学表达式
索引
检索
LaTeX格式
互关联后继树
-
Keywords
mathematical expression
indexing
retrieval
LaTeX format
inter-relevant successive tree
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名一个改进的互关联后继树数据模型
被引量:6
- 12
-
-
作者
马科
胡运发
-
机构
复旦大学计算机与信息技术数据库实验室
-
出处
《计算机工程》
CAS
CSCD
北大核心
2003年第21期70-72,共3页
-
基金
国家"863"计划基金资助项目( 2001AA115020)
-
文摘
介绍了一种新型的全文数据库模型——互关联后继树,阐述它与其它全文数据库 模型相比在呈现非结构化信息的存储和检索中的巨大优势,并探讨了面对呈现指数增长的非 结构化的海量信息时如何提高其性能。
-
关键词
互关联后继树
全文检索
海量存储
-
Keywords
Inter-relevant successive trees
Full-text retrieval
Sponge storag e
-
分类号
TP3111.11
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于后继区间的互关联后继树搜索算法
被引量:5
- 13
-
-
作者
王政华
胡运发
-
机构
复旦大学计算机与信息技术系
-
出处
《计算机工程》
CAS
CSCD
北大核心
2007年第9期84-86,共3页
-
文摘
全文检索领域的关键问题是索引模型以及该模型之上的高效搜索算法,基于一种优秀的全文索引模型互关联后继树提出了基于后继区间的搜索算法,大大提升了全文的检索速度,从而更加充分地体现了互关联后继树模型在全文领域的优势。
-
关键词
互关联后继树
后继区间
后继序列
-
Keywords
Inter-relevant successive trees(IRST)
Successive parts
Successive sequences
-
分类号
TP311.12
[自动化与计算机技术—计算机软件与理论]
-
-
题名互关联后继树在时间序列特征模式挖掘中的应用
被引量:1
- 14
-
-
作者
秦少辉
肖辉
胡运发
-
机构
复旦大学计算机与信息技术系
-
出处
《计算机工程与设计》
CSCD
北大核心
2006年第8期1327-1329,1332,共4页
-
基金
国家自然科学基金项目(60473070)
-
文摘
在文献[1]中提出的基于互关联后继树(IRST)的时间序列特征模式挖掘方法的基础上,加入了时间窗口的概念,以弥补IRST这种原本应用于文本检索中的索引模型在时间序列应用中的不足。对IRST以及挖掘算法做出了改进,弥补了其只能挖掘出紧密衔接特征模式的缺陷。实验结果表明,该方法可以挖掘出更多更具应用价值的特征模式。
-
关键词
时间序列
数据挖掘
特征模式
互关联后继树
时间窗口
-
Keywords
time series
data mining
frequent pattern
inter-relevant successive tree (IRST)
time window
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于互关联后继树的文本压缩
被引量:2
- 15
-
-
作者
申晓霞
胡运发
-
机构
复旦大学信息学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2007年第6期168-170,共3页
-
基金
国家自然科学基金(the National Natural Science Foundation of China under Grant No.60473070) 。
-
文摘
主要提出了使用互关联后继树来实现文本压缩的方法。利用互关联后继树的检索功能可以方便地查找最长匹配串,从而达到更好的文本压缩效果。从实验结果上来看,这种方法压缩率高于LZW,有好的实用性。
-
关键词
互关联后继树
LZW
文本压缩
-
Keywords
inter-relevant successive trees
LZW
text compression
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名后继序列有序的互关联后继树创建和搜索算法
被引量:2
- 16
-
-
作者
袁天宇
胡运发
-
机构
复旦大学计算机与信息技术系
-
出处
《计算机应用与软件》
CSCD
北大核心
2008年第4期1-3,共3页
-
基金
国家自然科学基金项目(60473070)
-
文摘
研究针对全文检索领域的索引结构模型,基于二元互关联后继树模型,提出并实现了一个后继序列有序的后继树模型,然后利用此索引模型实现查询操作的优化。
-
关键词
互关联后继树
后继区间
后继序列
后继序列有序
-
Keywords
Inter-relevant successive trees Successive part Successive sequence Sorted successive sequence
-
分类号
TP182
[自动化与计算机技术—控制理论与控制工程]
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名一个基于三元互关联后继树的多功能全文检索系统
被引量:2
- 17
-
-
作者
颜文伟
胡运发
-
机构
复旦大学计算机与信息技术系
-
出处
《计算机应用与软件》
CSCD
北大核心
2007年第2期124-126,129,共4页
-
文摘
针对全文检索领域的索引结构模型的研究,基于三元互关联后继树模型,提出并实现了一个存储结构良好的索引系统。利用该系统实现了多种有效的查询。
-
关键词
互关联后继树
全文索引
海量存储
-
Keywords
Inter-relevant successive trees Full-text retrieval Sponge storage
-
分类号
TP182
[自动化与计算机技术—控制理论与控制工程]
-
-
题名三元互关联后继树在海量存储和全文检索中的应用
- 18
-
-
作者
马科
胡运发
-
机构
复旦大学计算机与信息技术系
-
出处
《计算机应用与软件》
CSCD
北大核心
2004年第5期3-5,109,共4页
-
基金
国家自然科学基金项目 (No :60 1 730 2 7)
-
文摘
本文介绍了一种新的全文数据库的数据模型———三元互关联后继树 ,并探讨其在呈现指数增长的非结构化的海量信息的存储和检索中的应用。
-
关键词
全文检索
全文数据库
数据模型
三元互关联后继树
文本数据库
-
Keywords
The dyadic mutual dependent tree Full-text retrieval Sponge storage
-
分类号
G354.45
[文化科学—情报学]
-
-
题名基于互关联后继树的多库合并建库算法
- 19
-
-
作者
匡月
胡运发
-
机构
复旦大学软件学院
-
出处
《计算机应用与软件》
CSCD
北大核心
2008年第4期4-6,16,共4页
-
基金
国家自然科学基金资助(60473070)
-
文摘
针对全文检索领域的索引结构模型的研究,基于后继有序的互关联后继树模型,提出并实现了多库合并建库算法,这大大增加了可建索引库的容量,同时提高了建库的效率。
-
关键词
互关联后继树
多库存储
合并索引库
-
Keywords
Inter-relevant successive trees(IRST) Multiple-database storage Merge Index-database
-
分类号
TP182
[自动化与计算机技术—控制理论与控制工程]
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于OpenMP的互关联后继树索引创建算法优化
- 20
-
-
作者
张翔
刘梦伦
卢志翔
-
机构
广西大学计算机与信息工程学院
-
出处
《计算机光盘软件与应用》
2011年第8期160-161,共2页
-
文摘
在多核处理器平台上,针对互关联后继树索引模型,采用OpenMP指导语句对其创建算法进行改进优化。通过与未优化的串行程序结果进行比较,表明在多核处理平台上,对程序进行并行化优化可以提高程序的性能。
-
关键词
多核处理器
OPENMP
全文检索
互关联后继树
-
Keywords
Multi processor
OpenMP
Text Search
Inter-Revelant Sucessive Tree
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-