期刊文献+
共找到152篇文章
< 1 2 8 >
每页显示 20 50 100
A Chinese Web Page Clustering Algorithm Based on the Suffix Tree 被引量:4
1
作者 YANGJian-wu 《Wuhan University Journal of Natural Sciences》 EI CAS 2004年第5期817-822,共6页
In this paper, an improved algorithm, named STC-I, is proposed for Chinese Web page clustering based on Chinese language characteristics, which adopts a new unit choice principle and a novel suffix tree construction p... In this paper, an improved algorithm, named STC-I, is proposed for Chinese Web page clustering based on Chinese language characteristics, which adopts a new unit choice principle and a novel suffix tree construction policy. The experimental results show that the new algorithm keeps advantages of STC, and is better than STC in precision and speed when they are used to cluster Chinese Web page. Key words clustering - suffix tree - Web mining CLC number TP 311 Foundation item: Supported by the National Information Industry Development Foundation of ChinaBiography: YANG Jian-wu (1973-), male, Ph. D, research direction: information retrieval and text mining. 展开更多
关键词 CLUstERING suffix tree Web mining
下载PDF
On-line linear time construction of sequential binary suffix trees
2
作者 Lai Huoyao Liu Gongshen 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2009年第5期1104-1110,共7页
Suffix trees are the key data structure for text string matching, and are used in wide application areas such as bioinformatics and data compression. Ukkonen algorithm is deeply investigated and a new algorithm, which... Suffix trees are the key data structure for text string matching, and are used in wide application areas such as bioinformatics and data compression. Ukkonen algorithm is deeply investigated and a new algorithm, which decreases the number of memory operations in construction and keeps the result tree sequential, is proposed. The experiment result shows that both the construction and the matching procedure are more efficient than Ukkonen algorithm. 展开更多
关键词 suffix tree SEQUENTIAL linear time construction.
下载PDF
Fault Tolerant Suffix Trees
3
作者 Iftikhar Ahmad Syed Zulfiqar Ali Shah +5 位作者 Ambreen Shahnaz Sadeeq Jan Salma Noor Wajeeha Khalil Fazal Qudus Khan Muhammad Iftikhar Khan 《Computers, Materials & Continua》 SCIE EI 2021年第1期157-164,共8页
Classical algorithms and data structures assume that the underlying memory is reliable,and the data remain safe during or after processing.However,the assumption is perilous as several studies have shown that large an... Classical algorithms and data structures assume that the underlying memory is reliable,and the data remain safe during or after processing.However,the assumption is perilous as several studies have shown that large and inexpensive memories are vulnerable to bit flips.Thus,the correctness of output of a classical algorithm can be threatened by a few memory faults.Fault tolerant data structures and resilient algorithms are developed to tolerate a limited number of faults and provide a correct output based on the uncorrupted part of the data.Suffix tree is one of the important data structures that has widespread applications including substring search,super string problem and data compression.The fault tolerant version of the suffix tree presented in the literature uses complex techniques of encodable and decodable error-correcting codes,blocked data structures and fault-resistant tries.In this work,we use the natural approach of data replication to develop a fault tolerant suffix tree based on the faulty memory random access machine model.The proposed data structure stores copies of the indices to sustain memory faults injected by an adversary.We develop a resilient version of the Ukkonen’s algorithm for constructing the fault tolerant suffix tree and derive an upper bound on the number of corrupt suffixes. 展开更多
关键词 Resilient data structures fault tolerant data structures suffix tree
下载PDF
SUFFIX TREE文件生成器
4
作者 Aleksejs Udris 刘岩 《电脑知识与技术》 2016年第5期77-79,共3页
后缀树是一个功能强大的数据结构,可以用于计算机科学执行字符串后处理操作。使用树结构的一个挑战是,随着树的生长、树的结构变得难以想象。该文的项目就是针对后缀树的这一问题,通过使用三维空间来改善树的呈现效果。项目的目的将允... 后缀树是一个功能强大的数据结构,可以用于计算机科学执行字符串后处理操作。使用树结构的一个挑战是,随着树的生长、树的结构变得难以想象。该文的项目就是针对后缀树的这一问题,通过使用三维空间来改善树的呈现效果。项目的目的将允许用户在没有重叠显示的情况下,大幅增加从屏幕上获得的数据量。这个项目将着眼于渲染定向图,如在双曲空间的后缀树。 展开更多
关键词 后缀树 双曲空间 定向图 数据结构 suffix tree 计算机科学 生物学数据 可视化工具 结构体积 测试操作
下载PDF
STS、PP_(333)对牡丹切花保鲜及某些生理特性的影响 被引量:21
5
作者 刘亚丽 刘蕾 王荣峰 《吉林农业大学学报》 CAS CSCD 北大核心 2005年第3期276-279,共4页
以PP333为基本保鲜液,以1mmol LSTS溶液为预处理液,研究了STS和PP333对牡丹切花保鲜及某些生理特性的影响。结果表明:各处理均比对照保鲜效果好,切花的瓶插寿命延长1~2 5d;瓶插前用STS预处理比未用STS预处理的花径略小;各处理比对照的... 以PP333为基本保鲜液,以1mmol LSTS溶液为预处理液,研究了STS和PP333对牡丹切花保鲜及某些生理特性的影响。结果表明:各处理均比对照保鲜效果好,切花的瓶插寿命延长1~2 5d;瓶插前用STS预处理比未用STS预处理的花径略小;各处理比对照的花青素含量高1 89%~2 77%,POD活性大0 57~1 46mg min,可溶性蛋白含量高0 35~1 65mg g,相对电导率小3 91%~8 42%。综合各项指标,认为以100mg LPP333为基本保鲜液,并用1mmol LSTS进行预处理对牡丹切花的保鲜效果最佳。 展开更多
关键词 牡丹 切花 多效唑 硫代硫酸银 过氧化物酶 花青素 可溶性蛋白 相对电导率
下载PDF
基于STC的中文文本聚类算法 被引量:2
6
作者 王国强 郑海清 牛军钰 《上海师范大学学报(自然科学版)》 2006年第5期21-26,共6页
提出了一种文档聚类方法,对用户的检索结果中类似的文档进行聚类,提供目录结构,辅助用户浏览检索结果,首先分析了现有的文本聚类方法,讨论了它们的优势和不足,然后提出了基于后缀树的中文文本聚类算法,并详细描述了该算法的原理和构造... 提出了一种文档聚类方法,对用户的检索结果中类似的文档进行聚类,提供目录结构,辅助用户浏览检索结果,首先分析了现有的文本聚类方法,讨论了它们的优势和不足,然后提出了基于后缀树的中文文本聚类算法,并详细描述了该算法的原理和构造使用过程,及在算法实现的过程中遇到的关键问题及解决方案。 展开更多
关键词 后缀树 文本聚类 文本处理
下载PDF
中国、加拿大乡村旅游可持续发展对比研究——以阳朔大榕树景区与加拿大St.Jacobs Village为例 被引量:6
7
作者 覃群 《旅游论坛》 2012年第1期102-108,共7页
以阳朔大榕树景区和加拿大St.Jacobs Village作为案例地,通过实地调研获取一手数据,并采用比较分析的方法来探讨乡村旅游可持续发展问题。数据来源之问卷调查及深度访谈于2009年2月至8月在以上两个研究点进行。从"旅游产品的持续创... 以阳朔大榕树景区和加拿大St.Jacobs Village作为案例地,通过实地调研获取一手数据,并采用比较分析的方法来探讨乡村旅游可持续发展问题。数据来源之问卷调查及深度访谈于2009年2月至8月在以上两个研究点进行。从"旅游产品的持续创新"、"传统与现代的平衡"、"居民社区与旅游发展"及"文化内涵的挖掘与延伸"4个不同的视角来展开讨论。注重比较中、加两国实践,并提出乡村旅游可持续发展的若干启示。 展开更多
关键词 乡村旅游 可持续发展 对比研究 大榕树景区 st.Jacobs VILLAGE
下载PDF
ISTC: A New Method for Clustering Search Results 被引量:2
8
作者 ZHANG Wei XU Baowen +1 位作者 ZHANG Weifeng XU Junling 《Wuhan University Journal of Natural Sciences》 CAS 2008年第4期501-504,共4页
A new common phrase scoring method is proposed according to term frequency-inverse document frequency (TFIDF) and independence of the phrase. Combining the two properties can help identify more reasonable common phr... A new common phrase scoring method is proposed according to term frequency-inverse document frequency (TFIDF) and independence of the phrase. Combining the two properties can help identify more reasonable common phrases, which improve the accuracy of clustering. Also, the equation to measure the in-dependence of a phrase is proposed in this paper. The new algorithm which improves suffix tree clustering algorithm (STC) is named as improved suffix tree clustering (ISTC). To validate the proposed algorithm, a prototype system is implemented and used to cluster several groups of web search results obtained from Google search engine. Experimental results show that the improved algorithm offers higher accuracy than traditional suffix tree clustering. 展开更多
关键词 Web search results clustering suffix tree term frequency-inverse document frequency (TFIDF) independence of phrases
下载PDF
CUBE计算中的MMST树以及BIT形成算法
9
作者 方曲祥 孙海涛 《计算机工程与应用》 CSCD 北大核心 2000年第5期1-3,11,共4页
首先介绍了联机分析处理(OLAP)中的CUBE运算符以及几种计算CUB的优化方法,然后分析了以减少10操作优化方法为主的MMST优化策略,并给出了形成MMST树的BIT算法以及伪代码。该BIT算法概念清晰,实现简捷快... 首先介绍了联机分析处理(OLAP)中的CUBE运算符以及几种计算CUB的优化方法,然后分析了以减少10操作优化方法为主的MMST优化策略,并给出了形成MMST树的BIT算法以及伪代码。该BIT算法概念清晰,实现简捷快速,在以MMST树为基础的CUBE计算中非常关键。 展开更多
关键词 联机分析处理 MMst BIT算法 CUBE 数据库
下载PDF
STC算法的网络服务分类技术研究
10
作者 邓峰 陈家琪 《信息技术》 2013年第9期13-17,共5页
针对现有的大部分网络服务分类机制基本上靠人工分类的缺陷,以及半自动分类技术准确率和查全率的效率较低等问题,进行了基于后缀树聚类算法的网络服务自动分类技术研究,同时提出概念与例子层次树结构来表示部分存在上下位关系或者同义... 针对现有的大部分网络服务分类机制基本上靠人工分类的缺陷,以及半自动分类技术准确率和查全率的效率较低等问题,进行了基于后缀树聚类算法的网络服务自动分类技术研究,同时提出概念与例子层次树结构来表示部分存在上下位关系或者同义关系的聚类标签,在后缀树聚类基础上对这些标签进行二次聚类。通过引入文本预处理和WordNet语义相似度计算的基础上来实现服务自动分类。实验结果表明,该服务自动分类算法具有较好的准备率和查全率,另外根据WordNet提取出抽象的聚类标签,有利于对日益剧增的网络服务进行抽象层次的分类,提高了海量网络服务分类的效率。 展开更多
关键词 网络服务 后缀树聚类(stC)算法 WORDNET 语义相似度计算
下载PDF
利用精英策略ST-ACO算法对UA-FLP的优化求解
11
作者 杨娜娜 徐克林 《现代制造工程》 CSCD 北大核心 2012年第12期56-61,共6页
针对制造业中常见的不等面积设施布局优化问题(UA-FLP),提出了一种精英策略蚁群优化算法(ACO)。该算法的主要特点是采用基于切片树(ST)的编码方法,将解分成三部分,即一只蚂蚁代表一个解,它有三部分的信息素;然后结合启发式信息,进行更... 针对制造业中常见的不等面积设施布局优化问题(UA-FLP),提出了一种精英策略蚁群优化算法(ACO)。该算法的主要特点是采用基于切片树(ST)的编码方法,将解分成三部分,即一只蚂蚁代表一个解,它有三部分的信息素;然后结合启发式信息,进行更新寻优,得到最小的物流费用;同时采用比较新颖的边界曲线(BC)回溯方法求出最小物流费用所对应的设施布局尺寸,并确定设施之间最优的输入、输出点(I、O)位置;最后,通过算例对比证明了该方法在解决中小规模实际问题中的有效性及相比于某些现存方法的优越性。 展开更多
关键词 不等面积设施布局优化 精英策略蚁群优化算法 切片树 边界曲线回溯方法 输入 输出点位置
下载PDF
Factors Influencing the Patronage of Coconut Fruit Case Study: Cape Coast Metropolis Ghana
12
作者 Irene Kafui Amponsah 《Journal of Environmental Science and Engineering(A)》 2012年第8期1058-1064,共7页
Majority (80%) of people worldwide may not be aware of the numerous invaluable benefits of"the tree of life": the coconut palm especially the fruit. Some benefits include: its juice for weight loss, cure of hung... Majority (80%) of people worldwide may not be aware of the numerous invaluable benefits of"the tree of life": the coconut palm especially the fruit. Some benefits include: its juice for weight loss, cure of hung-over, diarrhoea, balance of body's pH level, among others. None-the-less, its availability and continuity to support life is hindered by the Cape St. Paul disease. To buttress government's efforts, this paper seeks to find out whether people are aware of some of the benefits of the coconut palm and the disease that attacks it. The survey revealed that, although awareness level of respondents' on some facts about the coconut fruit was moderate (40%-69%), majority (97%) of respondents consumed both the meat and juice. Respondents (70%) patronized coconut fruit weekly. Consumers' patronage of coconut fruit was influenced by three factors: health benefits, availability and packaging. The development of the CPS (coconut patronage scale) was a major contribution. 展开更多
关键词 CPS health benefits Cape st. Paul disease factor analysis tree of life.
下载PDF
SuffIndex——一种基于后缀树的XML索引结构 被引量:7
13
作者 包小源 宋再生 +2 位作者 唐世渭 杨冬青 王腾蛟 《计算机研究与发展》 EI CSCD 北大核心 2004年第10期1793-1801,共9页
针对形如∥element1/element2 /… /elementm 的查询 ,提出了一种基于后缀树 (suffixtree)的XML索引结构SuffIndex SuffIndex的构造通过只对OEM数据树遍历一次以及在SuffIndex中引入后缀链 (Sufflink)的方法 ,从而达到较低的构造代价 S... 针对形如∥element1/element2 /… /elementm 的查询 ,提出了一种基于后缀树 (suffixtree)的XML索引结构SuffIndex SuffIndex的构造通过只对OEM数据树遍历一次以及在SuffIndex中引入后缀链 (Sufflink)的方法 ,从而达到较低的构造代价 SuffIndex中所有结点利用Hash表保存到其所有子结点的指针 ,最终使查询∥element1/element2 /… /elementm 的处理代价为O(m) 展开更多
关键词 后缀树 XML 索引
下载PDF
一种改进的基于广义后缀树的文本聚类算法 被引量:7
14
作者 杜红斌 夏克文 +1 位作者 刘南平 吴涛 《信息与控制》 CSCD 北大核心 2009年第3期331-336,共6页
分析了基本STC算法存在的三个缺点,即不能有效处理包含文本数目差距较大但具有包含关系的节点,不能有效处理包含文本相似但主题不同的节点,缺乏有效的类别标识提取算法。针对以上问题,在综合考虑主题相似性以及文本包含相似性的基础上,... 分析了基本STC算法存在的三个缺点,即不能有效处理包含文本数目差距较大但具有包含关系的节点,不能有效处理包含文本相似但主题不同的节点,缺乏有效的类别标识提取算法。针对以上问题,在综合考虑主题相似性以及文本包含相似性的基础上,给出了改进的用于基类合并的相似度公式,并提出基于信息增益的类别标识提取算法。为了进一步提高聚类效率,给出了一种简单有效的用于基类选择的测度,用来排除一些无意义的广义后缀树节点。实验结果表明,所提算法不仅可以有效提高STC算法的聚类准确度,而且可以对聚类结果进行有效的类别标识。 展开更多
关键词 文本聚类 WEB挖掘 广义后缀树 后缀树聚类(stC)
下载PDF
网页搜索结果聚类与可视化 被引量:5
15
作者 赵华军 钟才明 +2 位作者 李文 王睿智 苗夺谦 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2010年第5期542-551,共10页
搜索引擎成为当今在互联网上进行信息检索最常用的工具.主流搜索引擎以与用户查询的相关度排序返回搜索结果,且自然语言中存在的"一义多词"和"一词多义"现象,用户很难清楚表达他们的意图,导致往往花费较长时间从结... 搜索引擎成为当今在互联网上进行信息检索最常用的工具.主流搜索引擎以与用户查询的相关度排序返回搜索结果,且自然语言中存在的"一义多词"和"一词多义"现象,用户很难清楚表达他们的意图,导致往往花费较长时间从结果列表中选择所感兴趣的话题.针对这种状况,采用网页聚类技术对标题和摘要进行聚类后,并可视化地以树和图的方式向用户快速、全貌和直观地展示搜索结果,明显改善了用户搜索体验.在此基础上设计了网页聚类原型系统ECE(effective clustering engine),实验结果表明该算法具有聚类结果可读性好以及聚类准确度比较高的优点. 展开更多
关键词 网页聚类 后缀树 可视化 短语簇 算法
下载PDF
全文索引技术时空效率分析 被引量:16
16
作者 刘小珠 彭智勇 《软件学报》 EI CSCD 北大核心 2009年第7期1768-1784,共17页
全文索引技术(full-text index technique)作为提高全文检索时空效率的有效方式之一,近年来得到了广泛而深入的研究.根据全文索引实现技术的不同,将其分为三大类:索引技术、压缩与索引混合技术以及自索引技术(self-index technique).从... 全文索引技术(full-text index technique)作为提高全文检索时空效率的有效方式之一,近年来得到了广泛而深入的研究.根据全文索引实现技术的不同,将其分为三大类:索引技术、压缩与索引混合技术以及自索引技术(self-index technique).从上述分类角度综述了全文索引时空效率方法中具有代表性的一些方法和技术:倒排文件、签名文件、后缀树与后缀数组、基于这3种索引的压缩技术、基于倒排文件的自索引与基于后缀数组的自索引的基本原理、所面临的问题及进展,并对这些技术的时空性能进行了详细的分析和比较,分析了各种技术的适应环境及优劣.最后总结了上述技术的特点,指出了存在的问题以及未来的研究方向. 展开更多
关键词 倒排文件 签名文件 后缀树 后缀数组 自索引 压缩 时空效率
下载PDF
基于重复模式的Web信息抽取 被引量:6
17
作者 高强 张敬之 +1 位作者 耿桦 潘金贵 《计算机科学》 CSCD 北大核心 2007年第4期210-212,221,共4页
网页中的大量数据记录往往以重复的HTML结构进行有规律的组织,从而形成一致的表现形式。根据这一特征,本文给出一种基于重复模式的Web内容抽取方法。通过使用一种叫做后缀树的数据结构,分析页面结构中所包含的重复模式,进而从模式的实... 网页中的大量数据记录往往以重复的HTML结构进行有规律的组织,从而形成一致的表现形式。根据这一特征,本文给出一种基于重复模式的Web内容抽取方法。通过使用一种叫做后缀树的数据结构,分析页面结构中所包含的重复模式,进而从模式的实例中抽取出对应的数据记录。 展开更多
关键词 WEB信息抽取 重复模式 后缀树
下载PDF
一种入侵检测系统的模式匹配算法 被引量:4
18
作者 韩忠秋 刘晓洁 +3 位作者 李涛 梁刚 龚勋 姚隽兮 《计算机应用研究》 CSCD 北大核心 2009年第8期3033-3035,共3页
提出了一种基于后缀树自动机的模式匹配算法,匹配中应用后缀启发机制进行启发跳跃,忽略不必要的比较。实验表明,该方法与传统模式匹配方法相比能有效地加快模式匹配的速度,提高入侵检测效率。
关键词 入侵检测系统 模式匹配 后缀树 自动机
下载PDF
求最长公共子串问题的算法分析 被引量:11
19
作者 张毅超 车玫 马骏 《计算机仿真》 CSCD 2007年第12期97-100,116,共5页
高效求解2个字符串的最长公共子串(Longest Common Substring)是实现很多字符串算法的关键。文中首先给出了求解LCP问题的动态规划算法,广义后缀树算法,研究并分析了这两种算法,得出动态规划算法易于理解,但时间复杂度较高;广义后缀树... 高效求解2个字符串的最长公共子串(Longest Common Substring)是实现很多字符串算法的关键。文中首先给出了求解LCP问题的动态规划算法,广义后缀树算法,研究并分析了这两种算法,得出动态规划算法易于理解,但时间复杂度较高;广义后缀树算法的时间复杂度较低,但实现较为复杂并且广义后缀树占用的空间也较多。最后提出了一个新算法,该算法使用2个字符串的广义后缀数组,在保持和广义后缀树时间复杂度相等的基础上,可以简单地实现并且占用较少的空间。 展开更多
关键词 最长公共子串 动态规划 广义后缀树 广义后缀数组
下载PDF
基于后缀树的Web论坛信息抽取 被引量:3
20
作者 肖建鹏 张来顺 +1 位作者 任星 宋晓光 《计算机工程与设计》 CSCD 北大核心 2008年第7期1675-1677,共3页
针对现有网上论坛信息抽取的不足,提出一种基于后缀树的论坛信息抽取方法。将标准化后的HTML文档转换为后缀树,查找出其中的重复模式并产生分装器,将分装器转换为NFA(非确定型有穷自动机)达到抽取论坛信息的目的。该方法运用构造后缀树... 针对现有网上论坛信息抽取的不足,提出一种基于后缀树的论坛信息抽取方法。将标准化后的HTML文档转换为后缀树,查找出其中的重复模式并产生分装器,将分装器转换为NFA(非确定型有穷自动机)达到抽取论坛信息的目的。该方法运用构造后缀树的技术来抽取论坛信息,较好地解决了现有的抽取方法准确性较差、通用性不强的问题。实验结果表明,该方法具有较高的准确性和实用性。 展开更多
关键词 信息抽取 分装器 后缀树 重复模式 论坛
下载PDF
上一页 1 2 8 下一页 到第
使用帮助 返回顶部