题名 一种频繁核心项集的快速挖掘算法
被引量:6
1
作者
田卫东
纪允
机构
合肥工业大学计算机与信息学院
出处
《计算机工程》
CAS
CSCD
2014年第6期120-124,共5页
基金
国家自然科学基金资助项目(60603068)
文摘
传统的频繁核心项集挖掘需多次生成和反复扫描数据库,导致生成效率低下。为此,提出一种快速生成频繁核心项集算法FMEP。该算法使用Rymon枚举树作为搜索空间,并采用分而治之的策略选择特定的路径进行剪枝。利用频繁核心项集特有的反单调性质,可以快速地判断某一个候选项集是否为频繁核心项集,而无需和所有直接子集的析取支持度进行比较。通过上述方法,可以达到快速挖掘的目的。实验结果证明,该算法能够在挖掘出所有的频繁核心项集精简表示元素的同时,降低消耗时间,与MEP算法相比,在密集型数据集上的时间可缩短2倍以上,在稀疏型数据集上时间至少缩短30%。
关键词
数据挖掘
频繁项集
精简表示
频繁核心项集
Rymon枚举树
Keywords
data mining
frequent itemsets
concise representation
frequent essential itemsets
Rymon enumeration tree
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
题名 基于FP树的一种快速挖掘生成器算法
被引量:3
2
作者
许普乐
张勤
纪允
机构
芜湖职业技术学院
安徽林业职业技术学院
合肥工业大学
出处
《安庆师范学院学报(自然科学版)》
2013年第1期48-53,77,共7页
基金
安徽省教学研究项目(20101259)资助
文摘
频繁项集挖掘是数据挖掘的一个热点,频繁项集的精简表示有助于减少频繁项集的数量,是频繁项集挖掘中的一个关键性问题。文章在总结频繁项集的相关精简模型后,对频繁项集精简模型,生成器精简表示模型进行研究。传统的生成器精简表示模型每次生成都需要扫描数据库,效率不高。本文提出一种新颖的频繁项集精简算法FPASCAL,使用FP树数据结构代替数据库再结合剪枝策略。理论分析及实验证明该方法在时间性能和空间复杂度上都优于传统方法。
关键词
频繁项集
数据挖掘
精简表示
生成器
FP树
Keywords
frequent itemset, data mining, concise representation, generator, FP tree
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
题名 应用FP树快速生成无关集算法
被引量:1
3
作者
许普乐
纪允
张勤
机构
芜湖职业技术学院教务处
中国移动通信集团安徽有限公司铜陵分公司
安徽林业职业技术学院信息与艺术系
出处
《安庆师范学院学报(自然科学版)》
2016年第2期60-65,共6页
基金
安徽省高等学校省级一般教学研究项目(20101264)
文摘
δ无关集的引入可解决数据挖掘领域中挖掘出来的频繁项集数量过大以及在实际应用中获取准确项集支持度代价过大的问题。针对传统方法生成无关集生成效率过低等问题,本文提出了一种在FP树上快速生成、结合一定的剪枝策略的快速挖掘算法FMINEX。实验效果证明,该算法在挖掘过程中,时间和空间性能都比较好。
关键词
数据挖掘
频繁项集
δ无关集
FP树
剪枝策略
Keywords
data mining
frequent item sets
free sets
FP tree
pruning strategy
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
题名 带可变长度通配符的模式匹配算法
4
作者
沈璐
纪允
纪冬宝
李萍
机构
合肥工业大学计算机与信息学院
芜湖职业技术学院电气系
安徽现代电视技术有限公司
安徽林业职业技术学院信息与艺术系
出处
《计算机工程与应用》
CSCD
北大核心
2015年第15期43-47,55,共6页
基金
安徽省高等学校省级一般教学研究项目(No.20101264)
文摘
针对目前已有的算法在计算带有可变长度通配符的模式在文本中的出现次数问题时,需要的时间是多项式级别,而且受文本长度、模式长度和通配符间距的影响比较大。提出了一种基于Aho-Corasick自动机的AAI(pAttern mAtching with wIldcards)算法,计算中采用了动态规划思想和有效的修剪技术。AAI算法的时间复杂度和空间复杂度分别为O(n+m+α)和O(m+B),其中n和m分别表示文本和模式的长度,α是所有子模式在文本中出现的数目,B是模式中通配符间距下限的总和。通过真实数据和人工数据的实验结果表明,AAI算法与同类算法相比具备显著的优势。
关键词
模式匹配
通配符
动态规划
Aho-Corasick自动机
Keywords
pattern matching
wildcards
dynamic programming
Aho-Corasick automaton
分类号
TP39
[自动化与计算机技术—计算机应用技术]
题名 一种快速挖掘生成器算法
5
作者
许普乐
纪允
机构
芜湖职业技术学院教务处
中国移动通信集团安徽有限公司铜陵分公司
出处
《绍兴文理学院学报》
2016年第7期63-68,共6页
基金
安徽省高等教育振兴计划重大教学改革研究项目"职业院校信息化教学改革的研究与实践"(项目编号2014zdjy198)
安徽省高校优秀青年人才支持计划重点项目"职业院校教育信息化发展路径研究-以安徽省为例"(项目编号:gxyqZD2016591)
文摘
生成器是频繁项集精简表示中的一个经典模型,但其传统挖掘算法存在重复生成候选项集,反复扫描数据库得到支持度,需要遍历所有直接子集等缺点,导致生成效率低下.基于此,一种快速挖掘生成器算法FMG,该算法采用Rymon枚举树作为搜索空间,提出的判断生成器定理对候选项集进行快速判断,以及特定的剪枝策略.通过这些方法快速的挖掘生成器.实验结果证明,该算法不仅比传统的算法要快,而且比最新提出的快速挖掘算法还要快.
关键词
数据挖掘
频繁项集
精简表示
Rymon枚举树
生成器
Keywords
data mining
frequent itemset
concise representation
Rymon setenumeration tree
generator
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
题名 一种海关监管视频要素提取设计方法
被引量:1
6
作者
毛柯
纪允
孙帆
机构
杭州海关科技处
出处
《计算机时代》
2023年第3期116-118,共3页
基金
海关总署科研项目-基于“边缘计算”的海关监管视频结构化处理和联网应用研究(2021HK267)。
文摘
引入边缘计算方法,借鉴软件工程中的V字模型理论,在海关内部搭建一套云边融合架构,进而形成海关监管视频数据要素提取与应用的方法体系,取得一定的实践效果,为实现海关监管视频的智能应用奠定基础。
关键词
海关
监管视频
非结构化数据
边缘计算
V字
要素
Keywords
customs
surveillance video
unstructured data
edge computing
V-shaped model
elements
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
题名 基于CDP技术的地市级烟草公司通用型灾备系统方案
被引量:1
7
作者
周强
赵海峰
纪允
田卫东
机构
安徽省烟草专卖局
中国联合网络通信有限公司安徽省分公司
合肥工业大学
出处
《计算机安全》
2012年第10期79-84,共6页
基金
安徽省烟草公司2010年度科技项目计划"安徽烟草商业信息系统风险评估及灾备方案研究"
文摘
连续数据保护技术是灾难备份与恢复领域近年来出现的新技术。针对安徽省烟草地市级子公司具有相同信息系统拓扑结构的特点,基于连续数据保护技术,设计了一种通用的异地灾难备份技术方案。该方案不仅能提供本地灾备功能,还具备异地灾备功能,且仅使用2M带宽就能实现远程数据复制。灾难发生时,能够保证对任意时间点数据的恢复。技术测试和方案在阜阳的应用实证,表明本方案是可行的。
关键词
连续数据保护
业务连续性
灾难备份
异地灾备
Keywords
continuous data protection
business continuity
disaster backup and recovery
bi-base backup model
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
题名 一种基于Rymon枚举树的快速挖掘无关集算法
8
作者
许普乐
纪允
机构
芜湖职业技术学院教务处
浙江出入境检验检疫局信息化管理处
出处
《轻工学报》
CAS
2017年第5期103-108,共6页
基金
安徽高校自然科学研究重点项目(KJ2017A552)
高校优秀青年人才支持计划重点项目(gxyq ZD2016591)
文摘
针对传统的挖掘算法在挖掘δ无关集时存在重复生成候选项集、遍历子项集等导致挖掘效率过低的问题,提出一个无关集判断定律,进而给出一种快速挖掘无关集算法FMFS.该算法利用Rymon枚举树作为搜索空间,结合一定的剪枝策略,再利用这个无关集判断定律对候选项集进行快速筛选.实验结果表明,该算法不仅能够挖掘出所有的无关集,且挖掘过程中的时间消耗优于目前已有算法.
关键词
数据挖掘
频繁项集
精简表示
δ无关集
Rymon枚举树
剪枝策略
Keywords
data mining
frequent itemsets
concise representation
δ free sets
Rymon setenumeration tree
pruning strategy
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
题名 一种基于FP树快速挖掘非可推导项集算法
9
作者
许普乐
纪允
机构
芜湖职业技术学院教务处
杭州海关
出处
《淮南师范学院学报》
2019年第2期116-121,共6页
基金
安徽高校自然科学研究重点项目(KJ2017A552)
高校优秀青年人才支持计划重点项目(gxyq ZD2016591)
文摘
频繁项集的精简表示是数据挖掘领域中一个研究热点,非可推导项集模型利用了容斥原理压缩频繁项集的数量。传统的挖掘算法在挖掘的过程中,存在多次扫描数据库、重复生成候选项集等效率低下的问题。文章提出一种新的算法MNDIBFP,该算法利用利用FP树压缩数据库,同时结合一定的剪枝策略,达到快速挖掘非可推导项集的目的。实验效果证明,该算法在时间消耗和空间消耗均优于传统算法。
关键词
频繁项集
精简表示
非可推导项集
容斥原理
FP树
剪枝策略
Keywords
frequent itemset
concise representation
non-derivable itemset
inclusion-exclusion identities
FP tree
pruning strategy
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
题名 基于多层次数据协同应用的海关数据安全机制研究
10
作者
纪允
孙建明
夏涛
吴子良
叶旭琪
机构
杭州海关
出处
《中国口岸科学技术》
2024年第5期27-34,共8页
基金
海关总署科研项目(2022HK114)。
文摘
为了建设更加完善的数据协同体系和安全保障体系,形成清晰的数据安全责任边界,亟待对数据管理流程、技术管理方法进行优化,保障数据在流动中的安全。本文借鉴零信任理念、层级制管理模式,设计了一套上下级联动、三种数据流程、双安全保障的“2+3+2”多层级数据协同应用的海关数据安全机制架构,并应用到海关的日常数据管理中,取得了一定的效果。从实践结果看,本文提出的数据安全机制是有效的,为海关的云边数据安全保障提供了一定的参考。
关键词
数据安全
数据协同
云边管理
Keywords
data security
data synergy
cloud-edge management
分类号
TP309.2
[自动化与计算机技术—计算机系统结构]