期刊文献+
共找到112篇文章
< 1 2 6 >
每页显示 20 50 100
利用prefix-hash-tree实现从中文文本到事务数据的转换
1
作者 钱铁云 王元珍 冯小年 《计算机科学》 CSCD 北大核心 2005年第5期167-169,184,共4页
电子文档的飞速增长为自动文本分类提供了巨大的机遇和挑战。在现有的众多方法中,关联分类以其较高的准确率和较快的训练时间而成为一种重要的自动文本分类方法。为实现基于关联的文本分类,首先需要将无结构的文本转换为结构化的事务数... 电子文档的飞速增长为自动文本分类提供了巨大的机遇和挑战。在现有的众多方法中,关联分类以其较高的准确率和较快的训练时间而成为一种重要的自动文本分类方法。为实现基于关联的文本分类,首先需要将无结构的文本转换为结构化的事务数据,本文提出的prefix-hash-tree是针对汉语的特殊性而设计的一种数据结构,利用它可以方便地将中文文本转化为事务数据,实验证明利用该数据结构相应的查找、插入和重构算法都具有较好的效率。 展开更多
关键词 中文文本 HASH 事务 自动文本分类 电子文档 分类方法 文本转换 数据结构 实验证明 重构算法 准确率 结构化 特殊性 结构相 关联
下载PDF
基于FP-Tree的共享前缀频繁项集挖掘算法 被引量:4
2
作者 胡中栋 罗会兰 曾珽 《计算机工程与应用》 CSCD 北大核心 2009年第27期137-139,共3页
在数据挖掘中发现关联规则是一个基本问题,而发现频繁项集是关联规则挖掘中最基本、最重要的问题。提出了基于FP-Tree的共享前缀频繁项集挖掘算法-FP-SPMA算法。构造FP-Tree来压缩事务数据库,通过共享前缀和前瞻剪枝快速减小候选项集,... 在数据挖掘中发现关联规则是一个基本问题,而发现频繁项集是关联规则挖掘中最基本、最重要的问题。提出了基于FP-Tree的共享前缀频繁项集挖掘算法-FP-SPMA算法。构造FP-Tree来压缩事务数据库,通过共享前缀和前瞻剪枝快速减小候选项集,无需递归构造条件模式树,算法性能有明显的提高。 展开更多
关键词 频繁项集 高频繁模式树(FP-tree) 共享前缀 基于FP-tree的共享前缀频繁项集挖掘算法(FP-SPMA)
下载PDF
基于FP-Tree快速挖掘频繁项集 被引量:2
3
作者 姜晗 范建淑 贾泂 《计算机应用与软件》 CSCD 2010年第10期36-37,130,共3页
发现频繁项集是关联规则挖掘中最基本、最重要的问题。目前已有两类频繁项集挖掘算法,然而由于其内在的复杂性,这一问题并未完全解决。提出了一种基于FP-Tree的频繁项集挖掘算法,该算法通过计算FP-Tree中非叶子节点的频繁子孙集和频繁前... 发现频繁项集是关联规则挖掘中最基本、最重要的问题。目前已有两类频繁项集挖掘算法,然而由于其内在的复杂性,这一问题并未完全解决。提出了一种基于FP-Tree的频繁项集挖掘算法,该算法通过计算FP-Tree中非叶子节点的频繁子孙集和频繁前缀,组合生成频繁项集,无需递归构造每个频繁项的条件模式树,节约了时间和内存空间,算法性能在一定程度上得到了提高。 展开更多
关键词 频繁项集 FP-tree 频繁子孙集 频繁前缀 关联规则
下载PDF
一种构造QC-Tree的单阶段算法
4
作者 向隆刚 龚健雅 《小型微型计算机系统》 CSCD 北大核心 2007年第10期1865-1868,共4页
QC-tree是一种组织数据立方的有效数据结构,不仅可以降低数据立方的存储开销,而且能够保持数据立方的语义关系.QC-tree的原始构造算法分为两个阶段,由于涉及到临时类的生成和处理,构造性能很低.为此,本文研究了QC-tree结构,导出了两个... QC-tree是一种组织数据立方的有效数据结构,不仅可以降低数据立方的存储开销,而且能够保持数据立方的语义关系.QC-tree的原始构造算法分为两个阶段,由于涉及到临时类的生成和处理,构造性能很低.为此,本文研究了QC-tree结构,导出了两个关于事实表划分和前缀路径的重要定理,在此基础上提出了构造QC-tree的单阶段算法,即OPA算法.实验和分析表明,OPA算法的构造效率远远优于原始构造算法.此外,OPA算法大大降低了对于工作内存的需求. 展开更多
关键词 数据立方 QC-tree 划分 前缀路径
下载PDF
SCTree:一种互异情节模式挖掘算法 被引量:1
5
作者 黄鹏 王鹏 汪卫 《计算机应用与软件》 CSCD 北大核心 2013年第3期177-181,共5页
现有的事件序列情节模式挖掘算法多是基于滑动窗口和非重叠出现的。目前没有有效算法挖掘基于互异出现的互异情节模式。为此,提出带状态计数的前缀树结构(SCTree)来生成互异情节模式候选集,进行互异计数和裁剪。为减少数据库扫描次数,提... 现有的事件序列情节模式挖掘算法多是基于滑动窗口和非重叠出现的。目前没有有效算法挖掘基于互异出现的互异情节模式。为此,提出带状态计数的前缀树结构(SCTree)来生成互异情节模式候选集,进行互异计数和裁剪。为减少数据库扫描次数,提出SCTree的主动扩展技术。实验表明了算法的有效性和高效性。 展开更多
关键词 数据挖掘 频繁情节模式 互异出现 带状态计数的前缀树
下载PDF
Prefix Subsection Matching Binary Algorithm in Passive RFID System
6
作者 王新锋 俞静一 +1 位作者 张绍军 周颖 《Defence Technology(防务技术)》 SCIE EI CAS 2011年第2期82-86,共5页
Identifying speed,tag average response times and reliability are the most important capabilities in passive RFID(radio frequency identification) system.QT(query tree) is a famous algorithm for lowest-cost RFID tags,bu... Identifying speed,tag average response times and reliability are the most important capabilities in passive RFID(radio frequency identification) system.QT(query tree) is a famous algorithm for lowest-cost RFID tags,but its shortcoming is high searching delay and high tag average response times.A prefix subsection matching binary(PSMB) algorithm based on QTalgorithm is proposed.The key idea of PSMB anti-collision algorithm is that,during searching phase,a given reader uses the particular tags ID,which has been searched out formerly,to shorten searching delay and depress tag average response times.The idea of PSMB algorithm can be described as follows.Usually,tag ID is composed of several subsections which have different meanings.Based on the tags ID searched out formerly,a given reader builds a prefix database.In subsequent searching phase,the reader uses its prefix database to deduce searching space of tag ID.Simulation results show that identification delay of PSMB algorithm is about 1/3 of QTalgorithm,tag average response times is about 1/4 of QTalgorithm,and system throughput rate is treble QTalgorithm. 展开更多
关键词 information processing radio frequency identification ANTI-COLLISION binary tree prefix matching
下载PDF
大容量高带宽路由查找算法设计与FPGA实现 被引量:3
7
作者 彭鼎祥 《现代电子技术》 2023年第15期20-24,共5页
为了解决目前IP路由查表大容量和高吞吐需求的同时,实现低硬件资源成本,提出一种大容量高带宽IP路由查表算法,并完成FPGA实现。算法将FIB表项的存储映射为字典树的数据结构,进行路径压缩和级别压缩以节省存储资源。将字典树根节点信息... 为了解决目前IP路由查表大容量和高吞吐需求的同时,实现低硬件资源成本,提出一种大容量高带宽IP路由查表算法,并完成FPGA实现。算法将FIB表项的存储映射为字典树的数据结构,进行路径压缩和级别压缩以节省存储资源。将字典树根节点信息存储在片内SRAM,子树节点存储于片外DRAM。查找时,在芯片硬件内采用流水线方式优化资源负载均衡,实现片外DRAM的一次访问即可得到结果,实现了单周期线速查表,并支持增量更新。该算法通过FPGA设计实现,并进行仿真和实机验证。结果表明,该方案可同时支持大容量IPv4和IPv6 FIB表项并行查找,与现有方案相比,做到了更大容量、更高带宽和更低成本。 展开更多
关键词 大容量 高带宽 IP路由表 FIB表 最长前缀匹配 FPGA 字典树算法 流水线
下载PDF
基于前缀劫持及路由更改对BGP产生的影响
8
作者 张皛 《工业控制计算机》 2023年第11期35-36,84,共3页
在网络中,由于配置错误或恶意路由宣告而导致的BGP前缀劫持事件,给当今的互联网带来了极大的麻烦。外包缓解措施是最近提出的一种前缀劫持缓解修复的方法。它通过将把数据同步出来传送给路由器,再提取ROA当中的信息,更新证书后,替换Upd... 在网络中,由于配置错误或恶意路由宣告而导致的BGP前缀劫持事件,给当今的互联网带来了极大的麻烦。外包缓解措施是最近提出的一种前缀劫持缓解修复的方法。它通过将把数据同步出来传送给路由器,再提取ROA当中的信息,更新证书后,替换Update报文中的内容再进行传递的机制方法,来缓解源AS号劫持事件,使机制重定向位置以此吸引大量网络流量。吸引和重定向行为的AS号对于提高修复能力非常有效。因此,如何衡量不同AS号的缓解效果并有效选择缓解因子是外包缓解措施的关键问题。为了从网络整体来均衡能耗,延长网络生存时间,采取了Cluster路由算法改进的方法,对不同的簇树中节点关系的选择,由不同节点的能量来避免路由发生回路和绕路等现象,从而更改Cluster-list id进行严格的路由选择,实现最优路由产生。 展开更多
关键词 边界网关协议 前缀劫持 动态路由 Cluster-tree
下载PDF
改进的树型结构RFID防碰撞算法 被引量:20
9
作者 王雪 钱志鸿 +1 位作者 刘晓慧 程超 《通信学报》 EI CSCD 北大核心 2015年第7期129-137,共9页
将整棵大查询树分为若干分支,在每一个分支内进行标签识别,减少碰撞发生的概率。算法分为前缀确定和分支查询2个阶段,在前缀确定阶段读取所有标签前缀,每个前缀代表一个分支,依次遍历每一分支;查询过程采用后退式搜索策略和动态搜索方... 将整棵大查询树分为若干分支,在每一个分支内进行标签识别,减少碰撞发生的概率。算法分为前缀确定和分支查询2个阶段,在前缀确定阶段读取所有标签前缀,每个前缀代表一个分支,依次遍历每一分支;查询过程采用后退式搜索策略和动态搜索方式。理论分析和仿真实验表明,算法能够从查询次数、时延、吞吐率多方面改善RFID系统的整体性能。 展开更多
关键词 RFID 防碰撞 树型结构 前缀查询 后退式搜索
下载PDF
一种基于前缀树的频繁模式挖掘算法 被引量:4
10
作者 朱光喜 吴伟民 +1 位作者 阮幼林 刘干 《计算机科学》 CSCD 北大核心 2005年第4期34-36,共3页
挖掘频繁模式是许多数据挖掘任务的关键步骤。基于FP-Tree的挖掘算法由于无须生成候进项集效率明显高于Apriori类算法,但FP-Tree结构存在动态维护复杂、而且在挖掘过程中需要递归地创建大量的条件FP-Tree,时空效率不高。因此,本文提出... 挖掘频繁模式是许多数据挖掘任务的关键步骤。基于FP-Tree的挖掘算法由于无须生成候进项集效率明显高于Apriori类算法,但FP-Tree结构存在动态维护复杂、而且在挖掘过程中需要递归地创建大量的条件FP-Tree,时空效率不高。因此,本文提出一种基于前缀树的新算法。该算法通过引入一种新结构—前缀树(Prefix Tree)用来压缩存放数据所相关信息,并通过调整前缀树中节点信息和节点键直接在Prefix Tree上采用深度优先的策略挖掘频繁模式,而不需要任何附加的数据结构,从而大大提高了挖掘效率。 展开更多
关键词 频繁模式 挖掘算法 前缀 关键步骤 数据挖掘 候选项集 动态维护 挖掘过程 时空效率 相关信息 深度优先 数据结构 新算法 中节点 递归
下载PDF
一种基于前缀广义表的关联规则增量式更新算法 被引量:23
11
作者 杨明 孙志挥 《计算机学报》 EI CSCD 北大核心 2003年第10期1318-1325,共8页
关联规则挖掘是数据挖掘研究的一个重要方面 ,关联规则的高效维护算法研究是当前研究的热点 .传统更新算法与Apriori算法框架一致 ,要多遍扫描数据库并产生大量的候选项目集 .为此 ,该文对FP tree进行了改进 ,引入了前缀广义表———PG ... 关联规则挖掘是数据挖掘研究的一个重要方面 ,关联规则的高效维护算法研究是当前研究的热点 .传统更新算法与Apriori算法框架一致 ,要多遍扫描数据库并产生大量的候选项目集 .为此 ,该文对FP tree进行了改进 ,引入了前缀广义表———PG List,并提出了基于PG List的关联规则挖掘 (MARBPGL)与增量式更新算法(IUABPGL) .算法MARBPGL仅须扫描数据库两遍 ,算法IUABPGL在最坏的情况下仅须扫描原数据库一遍 ,扫描新增数据库两遍 ,且两个算法均无须生成候选项目集 ,避免了产生“知识的组合爆炸” ,提高了挖掘和维护的效率 .理论分析和实验结果表明该文提出的算法是有效可行的 . 展开更多
关键词 关联规则 增量式更新算法 前缀广义表 数据挖掘 频繁模式树 数据库 APRIORI算法
下载PDF
一种基于Hadoop的关联规则挖掘算法 被引量:7
12
作者 丁勇 朱长水 武玉艳 《计算机科学》 CSCD 北大核心 2018年第B11期409-411,416,共4页
传统的并行关联规则算法对每一次迭代都定义一个MapReduce任务,以实现候选项集的生成和计数功能,但多次启动MapReduce任务会带来极大的性能开销。文中定义了一种并行关联规则挖掘算法PST-Apriori,该算法采取分治策略,在每个分布式计算... 传统的并行关联规则算法对每一次迭代都定义一个MapReduce任务,以实现候选项集的生成和计数功能,但多次启动MapReduce任务会带来极大的性能开销。文中定义了一种并行关联规则挖掘算法PST-Apriori,该算法采取分治策略,在每个分布式计算节点定义一个前缀共享树,通过递归调用的方式将事务T生成的候选项集逐层压缩到前缀共享树(PST)中。然后广度遍历PST,逐层将每个节点对应的〈key,value〉作为map函数的输入,并由MapReduce框架自动按照key值进行聚集。最后调用reduce函数对多个任务的处理结果进行汇总,得到满足最小支持度阈值的频繁项集。算法只使用两个MapReduce任务,且PST按照key值排序便于Mapper端的shuffle操作,提高了运行效率。 展开更多
关键词 关联规则 HADOOP MAPREDUCE 前缀共享树
下载PDF
可靠可缩放安全多播密钥更新实现研究 被引量:6
13
作者 许勇 凌龙 顾冠群 《计算机研究与发展》 EI CSCD 北大核心 2004年第6期934-939,共6页
实现安全多播的一般方法是设法让参与多播的所有成员共享一个组密钥 当有组成员离开或组密钥失密时 ,要进行组密钥的更新 当多播组较大时 ,组密钥更新的缩放性和可靠性是一个重要问题 解决缩放性可采用批量密钥更新方法 (BKR) ;解决可... 实现安全多播的一般方法是设法让参与多播的所有成员共享一个组密钥 当有组成员离开或组密钥失密时 ,要进行组密钥的更新 当多播组较大时 ,组密钥更新的缩放性和可靠性是一个重要问题 解决缩放性可采用批量密钥更新方法 (BKR) ;解决可靠性可基于报文重传和纠错码等方法 WKA给出了一种对密钥树分层加权解决上述问题 在分析密钥更新需求的基础上 ,基于WKA方法 ,提出了一种在前缀编码的密钥树中 ,实现动态分层式密钥更新的方法 (A WKA) 使用前缀编码可以很方便地计算出密钥树中变化结点位置关系 ,从而为动态分层提供快速、准确的决策依据 仿真分析表明 。 展开更多
关键词 前缀编码 安全多播 密钥树 密钥更新
下载PDF
差分隐私下的一种频繁序列模式挖掘方法 被引量:7
14
作者 卢国庆 张啸剑 +2 位作者 丁丽萍 李彦峰 廖鑫 《计算机研究与发展》 EI CSCD 北大核心 2015年第12期2789-2801,共13页
频繁序列模式挖掘是数据挖掘领域的1个基本问题,然而模式本身及其支持度计数都有可能泄露用户隐私信息.差分隐私(differential privacy,DP)作为一种新出现的隐私保护技术,定义了一个相当严格的攻击模型,通过添加噪音使数据失真达到隐私... 频繁序列模式挖掘是数据挖掘领域的1个基本问题,然而模式本身及其支持度计数都有可能泄露用户隐私信息.差分隐私(differential privacy,DP)作为一种新出现的隐私保护技术,定义了一个相当严格的攻击模型,通过添加噪音使数据失真达到隐私保护的目的.由于序列数据内在序列性和高维度的特点,给差分隐私应用于频繁序列模式挖掘带来了挑战.对此提出了一种基于交互式差分隐私保护框架的频繁序列模式挖掘算法Diff-FSPM(differential-privacy frequent sequential pattern mining).该算法利用指数机制获取最优序列长度,并采用一种维规约策略获得原始序列数据集的规约表示,有效降低序列维度的影响;应用前缀树压缩频繁序列模式,利用拉普拉斯机制产生的噪音扰动频繁模式的真实支持度计数,同时采用闭频繁序列模式和Markov假设,有效分配隐私预算,并利用一致性约束后置处理,增强输出模式的可用性.理论角度证明算法满足ε-差分隐私,实验结果验证算法具有较好的可用性. 展开更多
关键词 频繁序列模式 数据挖掘 差分隐私 隐私保护 前缀树
下载PDF
真前缀标记树——一种面向用户的子树选取策略表示方法 被引量:1
15
作者 陈华竣 郑智 倪德明 《计算机技术与发展》 2006年第12期9-12,共4页
针对周期性任务处理中用户对操作数据的规则定义问题,提出了一种带有标记的真前缀树的表示方法,定义了树形数据集合上的选择/排斥规则。根据这种规则,用户制定的周期任务能自动地处理原有的和变化的数据。并给出真前缀标记树的一种GUI... 针对周期性任务处理中用户对操作数据的规则定义问题,提出了一种带有标记的真前缀树的表示方法,定义了树形数据集合上的选择/排斥规则。根据这种规则,用户制定的周期任务能自动地处理原有的和变化的数据。并给出真前缀标记树的一种GUI表现方式。 展开更多
关键词 真前缀树 标记 规则
下载PDF
RFID系统中改进的混合查询树防碰撞算法 被引量:6
16
作者 南敬昌 单晓艳 高明明 《计算机工程》 CAS CSCD 2012年第23期291-292,F0003,共3页
针对无线射频识别(RFID)技术系统中的标签碰撞问题,采用混合查询树与多叉树结合的方法,提出一种改进的混合查询树防碰撞算法。在QT算法的基础上,通过标签序列生成器判断标签碰撞信息,结合八叉树询问机制,避免空闲周期和延迟时隙产生,减... 针对无线射频识别(RFID)技术系统中的标签碰撞问题,采用混合查询树与多叉树结合的方法,提出一种改进的混合查询树防碰撞算法。在QT算法的基础上,通过标签序列生成器判断标签碰撞信息,结合八叉树询问机制,避免空闲周期和延迟时隙产生,减少碰撞以及标签冲突和系统开销。实验结果证明,该算法优于QT、HQT算法,可减少查询次数和系统通信量,改进的混合查询树算法的识别效率较HQT算法提高46.1%。 展开更多
关键词 无线射频识别 标签 查询树 匹配前缀 八叉树 防碰撞
下载PDF
一种改进的基于数据库的树存储策略 被引量:5
17
作者 汪建 方洪鹰 陈昌川 《重庆师范大学学报(自然科学版)》 CAS 2007年第4期50-53,共4页
关系数据库管理系统的优势在于存储以二维数据表为模型的数据结构,而在科学研究领域中,一般树作为重要的数据模型广泛存在。本文讨论的中心问题是如何在数据库管理系统中存放压缩的一般树,并在维护海量数据的同时,降低数据冗余,最后讨... 关系数据库管理系统的优势在于存储以二维数据表为模型的数据结构,而在科学研究领域中,一般树作为重要的数据模型广泛存在。本文讨论的中心问题是如何在数据库管理系统中存放压缩的一般树,并在维护海量数据的同时,降低数据冗余,最后讨论数据一致性的保证和对比分析存储、检索算法的时空复杂度。本文通过对树的压缩存储技术的研究,所产生的结论和方法可以延伸到解决众多非线性数据结构在数据库管理系统中的存储问题。 展开更多
关键词 数据压缩 一般树 存储 检索 前缀码
下载PDF
最大频繁模式的快速挖掘与更新算法 被引量:3
18
作者 阮幼林 李庆华 刘干 《计算机工程与应用》 CSCD 北大核心 2005年第24期23-26,143,共5页
挖掘和更新最大频繁模式是多种数据挖掘应用中的关键问题。之前的许多研究都是采用Apriori类的候选生成-检验方法或基于FP-Tree的方法,而产生大量候选和动态创建大量FP-Tree的代价太高,特别是在支持度阈值较小或存在长模式时。因此,文... 挖掘和更新最大频繁模式是多种数据挖掘应用中的关键问题。之前的许多研究都是采用Apriori类的候选生成-检验方法或基于FP-Tree的方法,而产生大量候选和动态创建大量FP-Tree的代价太高,特别是在支持度阈值较小或存在长模式时。因此,文章提出了一种最大频繁模式的快速挖掘算法DMFP及更新算法IUMFP。DMFP算法利用前缀树压缩存放数据,并通过调整前缀树中节点信息和节点链直接在前缀树上采用深度优先的策略进行挖掘,而不需要创建条件模式树,从而大大提高了挖掘效率。算法IUMFP充分利用以前的挖掘结果减少发现更新数据中新的最大频繁模式的代价。 展开更多
关键词 最大频繁模式 FP-tree 前缀树 数据挖掘
下载PDF
基于交集为空的概念格批处理生成算法 被引量:2
19
作者 董辉 马垣 +2 位作者 沈文轩 宫玺 汤新明 《广西师范大学学报(自然科学版)》 CAS 北大核心 2007年第4期32-35,共4页
采用剪枝方法,通过对NextClosure算法的改进,提出一种基于剪枝的概念格批处理算法Prun-NextClosure,减少了概念格构造过程中闭包运算的次数,从而提高概念格的构造效率。实验使用随机生成的数据集,验证了该算法的正确性和有效性。
关键词 概念格 批处理算法 前缀树
下载PDF
一种最大频繁模式的快速挖掘算法 被引量:3
20
作者 王运鹏 胡修林 阮幼林 《计算机应用研究》 CSCD 北大核心 2006年第10期86-88,共3页
挖掘最大频繁模式是多种数据挖掘应用中的关键问题。提出一种挖掘最大频繁模式的快速算法,该算法利用前缀树压缩存放数据,并通过调整前缀树中节点信息和节点链直接在前缀树上采用深度优先的策略进行挖掘,而不需要创建条件模式树,从而大... 挖掘最大频繁模式是多种数据挖掘应用中的关键问题。提出一种挖掘最大频繁模式的快速算法,该算法利用前缀树压缩存放数据,并通过调整前缀树中节点信息和节点链直接在前缀树上采用深度优先的策略进行挖掘,而不需要创建条件模式树,从而大大提高了挖掘效率。 展开更多
关键词 最大频繁模式 FP-tree 前缀树 数据挖掘
下载PDF
上一页 1 2 6 下一页 到第
使用帮助 返回顶部