期刊文献+
共找到20篇文章
< 1 >
每页显示 20 50 100
An Improved Indexing and Matching Method for Mathematical Expressions Based on Inter-Relevant Successive Tree
1
作者 Huicong Liu Xuedong Tian +2 位作者 Bingjie Tian Fang Yang Xinfu Li 《Journal of Computer and Communications》 2016年第15期63-78,共17页
In recent years, a growing number of math contents are available on the Web. When conventional search engines deal with mathematical expressions, the two-dimen- sion-al structure of mathematical expressions is lost, w... In recent years, a growing number of math contents are available on the Web. When conventional search engines deal with mathematical expressions, the two-dimen- sion-al structure of mathematical expressions is lost, which results in a low performance of math retrieval. While the retrieval technology specifically designed for mathematical expressions is not mature currently. Aiming at these problems, an improved mathematical expression indexing and matching method was proposed through employing full text index method to deal with the two-dimensional structure of mathematical expressions. Firstly, through the fully consideration of LaTeX formulae’ characteristics, a feature representation method of mathematical expressions and a clustering method of feature keywords were put forward. Then, an improved inter-relevant successive trees index model was applied to the construction of the mathematical expression index, in which the cluster algorithm of mathematical expression features was employed to solve the problem of the quantity growth of the trees in processing large amount of formulae. Finally, the matching algorithms of mathematical expressions were given which provide four query modes called exact matching, compatible matching, sub-expression matching and fuzzy matching. In browser/server mode, 110027 formulae were used as experimental samples. The index file size was 29.02 Mb. The average time of retrieval was 1.092 seconds. The experimental result shows the effectiveness of the method. 展开更多
关键词 Mathematical Expression Retrieval Improved Math Index inter-relevant successive tree Clustering MATCHING
下载PDF
基于IRST的并行时序模式挖掘算法 被引量:3
2
作者 冯文超 吴绍春 王炜 《计算机应用研究》 CSCD 北大核心 2007年第12期137-140,共4页
提出一种建立在集群式高性能计算机上基于互关联后继树的并行时序模式挖掘算法,将数据线段化、树的建立及模式发现在多处理机上进行并行处理,有效地改进了算法的执行效率。实验结果表明,此算法较之串行算法有较高的效率。
关键词 互关联后继树 时间序列 时序模式 并行计算
下载PDF
互关联后继树模型及其实现 被引量:10
3
作者 申展 江宝林 +2 位作者 张谧 唐磊 胡运发 《计算机应用与软件》 CSCD 北大核心 2005年第3期7-9,104,共4页
全文检索是文本数据库研究的核心 ,而全文检索的首要问题是全文检索模型的选择。本文介绍了一种新颖的全文检索模型———互关联后继树模型及其实现 ,并将该模型与传统的倒排表模型进行了比较 。
关键词 文本数据库 全文检索模型 互关联后继树模型 信息检索
下载PDF
基于互关联后继树的时间序列相似性查询 被引量:7
4
作者 曾海泉 宋扬 +1 位作者 申展 胡运发 《计算机研究与发展》 EI CSCD 北大核心 2004年第2期325-332,共8页
时间序列的相似性查询是分析时间序列变化规律的一种重要方法 ,对于时间序列的分类、预测以及知识发现都具有重要的现实意义 提出了一种基于分段技术的、同时支持可变长度的快速相似性查询方法 其主要思想是 :首先依据序列变化的重要... 时间序列的相似性查询是分析时间序列变化规律的一种重要方法 ,对于时间序列的分类、预测以及知识发现都具有重要的现实意义 提出了一种基于分段技术的、同时支持可变长度的快速相似性查询方法 其主要思想是 :首先依据序列变化的重要点将序列逐步分段 ,抽取各子段的变化特征 ,通过分类方法将其转变成符号序列 在此基础上 ,引入一种称为互关联后继树的全文索引技术 ,从而实现序列的快速相似性查询 ,其时间复杂度降到了O(L) ,此外 。 展开更多
关键词 时间序列 相似性查询 重要点分段 互关联后继树
下载PDF
基于互关联后继树的XML索引技术 被引量:6
5
作者 雷向欣 胡运发 +2 位作者 杨智应 刘勇 张凯 《计算机研究与发展》 EI CSCD 北大核心 2005年第7期1261-1271,共11页
提出了一种新的根树节点编码方法———基于叶序区间的节点编码(LOINS).编码方法只需对根树后序遍历一次即可完成,能实现常数时间内对任意两个树节点间前后代关系的判断.同时,结合互关联后继树模型(IRST)的标引性、可压缩性等特点,提出... 提出了一种新的根树节点编码方法———基于叶序区间的节点编码(LOINS).编码方法只需对根树后序遍历一次即可完成,能实现常数时间内对任意两个树节点间前后代关系的判断.同时,结合互关联后继树模型(IRST)的标引性、可压缩性等特点,提出基于IRST的根树索引模型IsBaRTII,及对该模型空间优化的索引模型IsBaRTIII.IsBaRTII,II采用树节点名称(标签)及其在根树(XML文档树)中的出现计数索引节点间的父子关系和节点叶序区间编码,实现索引结构和节点编码的相互统一.IsBaRTII,II索引建立时间、空间代价小,可快速查询满足XPath表达式在XML文档树中的节点序列和路径. 展开更多
关键词 XML XPATH 互关联后继树 索引 查询
下载PDF
TTFS:一个倾向性文本过滤系统的设计与实现 被引量:9
6
作者 金峰 刘永丹 +1 位作者 江宝林 胡运发 《计算机工程与应用》 CSCD 北大核心 2003年第30期137-140,共4页
以往文本过滤的研究主要集中于主题性过滤,然而随着网络的发展,倾向性文本过滤在网络信息安全方面的作用越来越大。论文阐述了一个倾向性文本过滤系统TTFS(TendencyTextFilteringSystem),能够对具有关于某个主题的特定倾向的文本进行过... 以往文本过滤的研究主要集中于主题性过滤,然而随着网络的发展,倾向性文本过滤在网络信息安全方面的作用越来越大。论文阐述了一个倾向性文本过滤系统TTFS(TendencyTextFilteringSystem),能够对具有关于某个主题的特定倾向的文本进行过滤。该系统充分利用了领域知识,采用了语义模式分析等技术,实验表明其查全率和查准率高,速度较快。 展开更多
关键词 倾向性文本过滤 语义模式分析 互关联后继树
下载PDF
基于互关联后继树的多时间序列关联模式挖掘 被引量:5
7
作者 曾海泉 刘永丹 +1 位作者 宋扬 胡运发 《计算机研究与发展》 EI CSCD 北大核心 2003年第7期934-940,共7页
时间序列是现实生活中常见的数据形式之一 ,在时间序列中发现频繁模式是分析时间序列变化规律的一项重要任务 提出基于互关联后继树的多时间序列关联模式挖掘算法 该算法首先用Allen逻辑位置关系来描述序列状态关系 ,根据这些关系在时... 时间序列是现实生活中常见的数据形式之一 ,在时间序列中发现频繁模式是分析时间序列变化规律的一项重要任务 提出基于互关联后继树的多时间序列关联模式挖掘算法 该算法首先用Allen逻辑位置关系来描述序列状态关系 ,根据这些关系在时间窗口内顺序或并行出现情况 ,获得一个由这些关系组成的特殊序列 在此基础上提出了一个基于互关联后继树的新型挖掘模型 ,实现了序列间关联模式的挖掘 与其他方法相比 ,该算法简单、直观 ,而且整个挖掘过程不需要生成候选模式 。 展开更多
关键词 时间序列 数据挖掘 关联模式 互关联后继树
下载PDF
基于互关联后继树的频繁模式挖掘研究 被引量:2
8
作者 申展 江宝林 +1 位作者 唐磊 胡运发 《计算机工程》 CAS CSCD 北大核心 2004年第21期30-32,共3页
关联规则挖掘是数据挖掘的一个重要的研究内容,而产生频繁模式集是关联规则挖掘的第1步工作。很多传统的频繁模式挖掘算法都需要产生候选模式集,因而效率很低。该文提出了一种不需要产生候选集,而直接构造频繁集的频繁模式挖掘算法——... 关联规则挖掘是数据挖掘的一个重要的研究内容,而产生频繁模式集是关联规则挖掘的第1步工作。很多传统的频繁模式挖掘算法都需要产生候选模式集,因而效率很低。该文提出了一种不需要产生候选集,而直接构造频繁集的频繁模式挖掘算法——基于互关联后继树的频繁模式挖掘算法。实验证明,该算法具有较好的性能。 展开更多
关键词 关联规则 频繁模式挖掘 互关联后继树模型 数据挖掘
下载PDF
基于后继区间的互关联后继树搜索算法 被引量:5
9
作者 王政华 胡运发 《计算机工程》 CAS CSCD 北大核心 2007年第9期84-86,共3页
全文检索领域的关键问题是索引模型以及该模型之上的高效搜索算法,基于一种优秀的全文索引模型互关联后继树提出了基于后继区间的搜索算法,大大提升了全文的检索速度,从而更加充分地体现了互关联后继树模型在全文领域的优势。
关键词 互关联后继树 后继区间 后继序列
下载PDF
基于互关联后继树的数学表达式检索 被引量:4
10
作者 刘惠丛 田冰洁 田学东 《计算机工程》 CAS CSCD 北大核心 2017年第6期129-135,共7页
数学表达式结构复杂多样,给检索带来困难。为此,提出一种数学表达式索引与检索方法。在索引阶段,通过对LaTeX数学表达式特点的分析与归纳,定义面向表达式二维结构特性的数学表达式特征表示方式,将互关联后继树索引模型应用于数学表达式... 数学表达式结构复杂多样,给检索带来困难。为此,提出一种数学表达式索引与检索方法。在索引阶段,通过对LaTeX数学表达式特点的分析与归纳,定义面向表达式二维结构特性的数学表达式特征表示方式,将互关联后继树索引模型应用于数学表达式索引的构建,以解决树结构表示表达式的层次增长问题。在匹配阶段,设计包括精确匹配、相容匹配、子式匹配、模糊匹配等查询模式的匹配算法。在浏览器/服务器模式下采用51 076条数学表达式进行索引与匹配。实验结果表明,提出的方法可加快查询速度,减小索引存储空间,能够适应数学表达式的结构特点,取得较好的检索效果。 展开更多
关键词 数学表达式 索引 检索 LaTeX格式 互关联后继树
下载PDF
一个改进的互关联后继树数据模型 被引量:6
11
作者 马科 胡运发 《计算机工程》 CAS CSCD 北大核心 2003年第21期70-72,共3页
介绍了一种新型的全文数据库模型——互关联后继树,阐述它与其它全文数据库 模型相比在呈现非结构化信息的存储和检索中的巨大优势,并探讨了面对呈现指数增长的非 结构化的海量信息时如何提高其性能。
关键词 互关联后继树 全文检索 海量存储
下载PDF
互关联后继树在时间序列特征模式挖掘中的应用 被引量:1
12
作者 秦少辉 肖辉 胡运发 《计算机工程与设计》 CSCD 北大核心 2006年第8期1327-1329,1332,共4页
在文献[1]中提出的基于互关联后继树(IRST)的时间序列特征模式挖掘方法的基础上,加入了时间窗口的概念,以弥补IRST这种原本应用于文本检索中的索引模型在时间序列应用中的不足。对IRST以及挖掘算法做出了改进,弥补了其只能挖掘出紧密衔... 在文献[1]中提出的基于互关联后继树(IRST)的时间序列特征模式挖掘方法的基础上,加入了时间窗口的概念,以弥补IRST这种原本应用于文本检索中的索引模型在时间序列应用中的不足。对IRST以及挖掘算法做出了改进,弥补了其只能挖掘出紧密衔接特征模式的缺陷。实验结果表明,该方法可以挖掘出更多更具应用价值的特征模式。 展开更多
关键词 时间序列 数据挖掘 特征模式 互关联后继树 时间窗口
下载PDF
后继序列有序的互关联后继树创建和搜索算法 被引量:2
13
作者 袁天宇 胡运发 《计算机应用与软件》 CSCD 北大核心 2008年第4期1-3,共3页
研究针对全文检索领域的索引结构模型,基于二元互关联后继树模型,提出并实现了一个后继序列有序的后继树模型,然后利用此索引模型实现查询操作的优化。
关键词 互关联后继树 后继区间 后继序列 后继序列有序
下载PDF
基于互关联后继树的文本压缩 被引量:2
14
作者 申晓霞 胡运发 《计算机工程与应用》 CSCD 北大核心 2007年第6期168-170,共3页
主要提出了使用互关联后继树来实现文本压缩的方法。利用互关联后继树的检索功能可以方便地查找最长匹配串,从而达到更好的文本压缩效果。从实验结果上来看,这种方法压缩率高于LZW,有好的实用性。
关键词 互关联后继树 LZW 文本压缩
下载PDF
一个基于三元互关联后继树的多功能全文检索系统 被引量:2
15
作者 颜文伟 胡运发 《计算机应用与软件》 CSCD 北大核心 2007年第2期124-126,129,共4页
针对全文检索领域的索引结构模型的研究,基于三元互关联后继树模型,提出并实现了一个存储结构良好的索引系统。利用该系统实现了多种有效的查询。
关键词 互关联后继树 全文索引 海量存储
下载PDF
全文检索系统中动态索引技术的研究 被引量:2
16
作者 郭琦娟 陈通照 《计算机与数字工程》 2007年第1期40-42,共3页
全文检索是一种非常有效的信息检索技术,本文通过分析全文检索系统中静态索引技术的优缺点,以及影响动态性能的因素,提出一种基于互关联后继树模型的动态索引技术,该技术在不影响查询效率等性能的情况下,很好地解决了索引的更新问题,提... 全文检索是一种非常有效的信息检索技术,本文通过分析全文检索系统中静态索引技术的优缺点,以及影响动态性能的因素,提出一种基于互关联后继树模型的动态索引技术,该技术在不影响查询效率等性能的情况下,很好地解决了索引的更新问题,提高了索引的动态性能。 展开更多
关键词 全文检索 互关联后继树 静态索引 动态索引
下载PDF
基于互关联后继树的多库合并建库算法
17
作者 匡月 胡运发 《计算机应用与软件》 CSCD 北大核心 2008年第4期4-6,16,共4页
针对全文检索领域的索引结构模型的研究,基于后继有序的互关联后继树模型,提出并实现了多库合并建库算法,这大大增加了可建索引库的容量,同时提高了建库的效率。
关键词 互关联后继树 多库存储 合并索引库
下载PDF
全文检索系统中动态索引技术的研究
18
作者 郭琦娟 陈通照 《微型电脑应用》 2006年第11期11-12,15,共3页
全文检索是一种非常有效的信息检索技术,本文通过分析全文检索系统中静态索引技术的优缺点,以及影响动态性能的因素,提出一种基于互关联后继树模型的动态索引技术,该技术在不影响查询效率等性能的情况下,很好地解决了索引的更新问题,提... 全文检索是一种非常有效的信息检索技术,本文通过分析全文检索系统中静态索引技术的优缺点,以及影响动态性能的因素,提出一种基于互关联后继树模型的动态索引技术,该技术在不影响查询效率等性能的情况下,很好地解决了索引的更新问题,提高了索引的动态性能。 展开更多
关键词 全文检索 互关联后继树 静态索引 动态索引
下载PDF
基于IRST的谱图相似性查找方法研究
19
作者 尚军 陈莉 +2 位作者 汤宏胜 张苍松 李华 《计算机与应用化学》 CAS CSCD 北大核心 2014年第3期333-336,共4页
光谱图相似性匹配是推测化合物结构的重要研究方法之一,而如何在标准谱图数据库中进行相似性查找是关键步骤。传统的谱图匹配方法在数据量较大时,检索效率较低。本文首次将互关联后继树(TRST)算法思想应用于光谱图数据领域,从光谱图特... 光谱图相似性匹配是推测化合物结构的重要研究方法之一,而如何在标准谱图数据库中进行相似性查找是关键步骤。传统的谱图匹配方法在数据量较大时,检索效率较低。本文首次将互关联后继树(TRST)算法思想应用于光谱图数据领域,从光谱图特征数据点出发,通过对算法的改进,提出了1种基于斜率序列的互关联后继树算法(SSIRST)实现光谱图相似性匹配查找,旨在通过减少匹配过程中的数据量缩短查找时间。实验结果表明,算法可以有效提高光谱图相似性匹配查找效率1倍以上。 展开更多
关键词 互关联后继树模型 相似性查找 光谱图
原文传递
基于互关联后继树的时序模式挖掘 被引量:4
20
作者 曾海泉 胡勤友 +1 位作者 周水庚 胡运发 《模式识别与人工智能》 EI CSCD 北大核心 2003年第3期299-305,共7页
时间序列是现实生活中常见的数据形式之一。在时间序列中发现频繁模式是分析时间序列变化规律的一项重要任务。本文提出一种基于互关联后继树模型的时间序列频繁模式发现方法。该方法依据序列重要点进行分段,引入相对斜率值并结合领域... 时间序列是现实生活中常见的数据形式之一。在时间序列中发现频繁模式是分析时间序列变化规律的一项重要任务。本文提出一种基于互关联后继树模型的时间序列频繁模式发现方法。该方法依据序列重要点进行分段,引入相对斜率值并结合领域知识将序列符号化,在此基础上提出一种互关联后继树的新型挖掘算法,实现了时序频繁模式的发现。理论与实验表明,该方法简单、直观、高效,具有实用价值。 展开更多
关键词 时序数据库 数据挖掘 频繁模式 数据形式 时间序列 关联规则
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部