期刊文献+
共找到12篇文章
< 1 >
每页显示 20 50 100
数据流上的约束跨层级高效用项集挖掘
1
作者 刘淑娟 韩萌 +2 位作者 高智慧 穆栋梁 李昂 《计算机工程与应用》 CSCD 北大核心 2024年第13期287-300,共14页
传统的高效用项集挖掘算法无法发现不同抽象层级类别之间的关系。因此,有研究者提出了跨层级的高效用项集挖掘算法。针对当前跨层级的高效用项集挖掘算法仅能处理静态数据并且无法控制挖掘层级范围的问题,提出了一种动态类别列表结构DTU... 传统的高效用项集挖掘算法无法发现不同抽象层级类别之间的关系。因此,有研究者提出了跨层级的高效用项集挖掘算法。针对当前跨层级的高效用项集挖掘算法仅能处理静态数据并且无法控制挖掘层级范围的问题,提出了一种动态类别列表结构DTUL存储并维护窗口内的项集效用和类别信息。基于此结构,首次提出了基于滑动窗口的约束跨层级高效用项集挖掘算法,包括自下而上挖掘的CCLHM_DTU算法和自上而下挖掘的CCLHM_UTD算法。在含有类别信息的数据集上进行了大量实验,实验结果表明提出的算法能够有效处理数据流并灵活约束项集的层级范围。 展开更多
关键词 高效用项集挖掘 跨层级高效用项 数据流 滑动窗口 效用列表
下载PDF
HHUIM:一种新的启发式高效用项集挖掘方法
2
作者 高智慧 韩萌 +2 位作者 李昂 刘淑娟 穆栋梁 《计算机应用研究》 CSCD 北大核心 2024年第1期94-101,共8页
针对基于启发式的高效用项集挖掘算法在挖掘过程中可能丢失大量项集的问题,提出一种新的启发式高效用项集挖掘算法HHUIM。HHUIM利用哈里斯鹰优化算法进行种群更新,能够有效减少项集丢失。提出并设计了鹰的替换策略,解决了搜索空间较大... 针对基于启发式的高效用项集挖掘算法在挖掘过程中可能丢失大量项集的问题,提出一种新的启发式高效用项集挖掘算法HHUIM。HHUIM利用哈里斯鹰优化算法进行种群更新,能够有效减少项集丢失。提出并设计了鹰的替换策略,解决了搜索空间较大的问题,降低了适应度函数值低于最小效用阈值的鹰的数量。此外,提出存储回溯策略,可有效防止算法因收敛过快陷入局部最优。大量的实验表明,所提算法优于目前最先进的启发式高效用项集挖掘算法。 展开更多
关键词 哈里斯鹰优化算法 高效用项集挖掘 启发式算法 智能优化算法
下载PDF
基于统计显著性检验的高效用项集挖掘算法
3
作者 吴军 魏丹丹 +1 位作者 欧阳艾嘉 王亚 《计算机应用研究》 CSCD 北大核心 2024年第10期2970-2977,共8页
针对传统高效用项集挖掘算法在具有不同类型标签事务中报告假阳性高效用项集的问题,提出两个基于统计显著性检验的高效用项集挖掘算法——FHUI和PHUI算法。这两个算法首先找到所有待检验高效用项集并依据项集长度进行分组;然后,FHUI算... 针对传统高效用项集挖掘算法在具有不同类型标签事务中报告假阳性高效用项集的问题,提出两个基于统计显著性检验的高效用项集挖掘算法——FHUI和PHUI算法。这两个算法首先找到所有待检验高效用项集并依据项集长度进行分组;然后,FHUI算法根据项集自身的频率分布生成零分布,PHUI算法根据事务内置换策略或事务间置换策略构造置换事务集合来生成零分布。最后,FHUI和PHUI算法从零分布中计算出p值并运用错误发现率剔除假阳性高效用项集。基准事务集合实验结果显示FHUI和PHUI算法能够剔除大量的假阳性高效用项集,在后续分类任务中取得了更高的正确率;仿真事务集合实验结果显示FHUI和PHUI算法报告的项集中假阳性高效用项集数量占比低于4.8%且平均效用高于39000。实验结果证明,在具有不同类型的标签事务中,FHUI和PHUI算法报告的统计显著高效用项集可靠性和实用性更强。 展开更多
关键词 数据挖掘 高效用项集挖掘 统计显著性检验 Fisher检验 置换检验
下载PDF
基于快速高效用项集挖掘的大规模消息流预测算法研究与应用 被引量:1
4
作者 穆晓芳 邓红霞 +1 位作者 郭虎升 赵鹏 《计算机应用与软件》 北大核心 2019年第11期243-249,共7页
为了提高大规模消息流话题预测的准确性与效率,提出基于高效用项集挖掘的消息流话题预测算法.计算时间窗口中词汇的内部效用与外部效用,根据会话内所有词汇的效用计算最小效用值;采用高效用项集挖掘算法产生候选话题模式集,随之提取最... 为了提高大规模消息流话题预测的准确性与效率,提出基于高效用项集挖掘的消息流话题预测算法.计算时间窗口中词汇的内部效用与外部效用,根据会话内所有词汇的效用计算最小效用值;采用高效用项集挖掘算法产生候选话题模式集,随之提取最终的话题模式.为了提高高效用项集挖掘的时间效率与存储效率,设计三角项集效用树保存项集的效用信息,设计话题搜索树保存候选话题模式集.最终基于真实消息流数据集进行实验,结果显示该算法有效地提高了话题预测的准确率,并且实现了较快的响应时间. 展开更多
关键词 高效用项集挖掘 频繁项挖掘 数据流 话题预测 大数据 网络安全
下载PDF
基于数据索引结构的跨级高效用项集挖掘算法 被引量:1
5
作者 蒋华 李星 +1 位作者 王慧娇 韦静海 《计算机应用》 CSCD 北大核心 2023年第7期2200-2208,共9页
针对现有的跨级高效用项集挖掘(HUIM)算法非常耗时且占用大量内存的问题,提出一种基于数据索引结构的跨级高效用项集挖掘算法(DISCH)。首先,为了高效存储和快速检索到搜索空间中的所有项集,拓展带有分类信息和索引信息的效用链表为数据... 针对现有的跨级高效用项集挖掘(HUIM)算法非常耗时且占用大量内存的问题,提出一种基于数据索引结构的跨级高效用项集挖掘算法(DISCH)。首先,为了高效存储和快速检索到搜索空间中的所有项集,拓展带有分类信息和索引信息的效用链表为数据索引结构(DIS);然后,为了提高内存利用率,对不满足条件的效用链表所占的内存进行回收再分配;最后,在构建效用链表时使用提前结束策略,以减少效用链表的产生。基于真实零售数据集和合成数据集进行的实验结果表明,与CLH-Miner(Cross-Level High utility itemsets Miner)算法相比,DISCH在运行时间上平均降低了77.6%,同时在内存消耗上平均降低了73.3%,可见该算法能高效完成跨级高效用项集的搜索,并且降低算法的内存消耗。 展开更多
关键词 数据挖掘 高效用项集挖掘 分类关系 索引链表 重用内存
下载PDF
基于长度约束的蝙蝠高效用项集挖掘算法 被引量:1
6
作者 袁泉 唐成亮 徐雲鹏 《计算机应用》 CSCD 北大核心 2023年第5期1473-1480,共8页
为了挖掘满足用户特殊需求,如含指定项目数量的高效用项集(HUI),提出一种基于长度约束的蝙蝠高效用项集挖掘算法(HUIM-LC-BA)。该算法融合蝙蝠算法(BA)和长度约束构建高效用项集挖掘(HUIM)模型,首先将数据库转换为位图矩阵,实现高效的... 为了挖掘满足用户特殊需求,如含指定项目数量的高效用项集(HUI),提出一种基于长度约束的蝙蝠高效用项集挖掘算法(HUIM-LC-BA)。该算法融合蝙蝠算法(BA)和长度约束构建高效用项集挖掘(HUIM)模型,首先将数据库转换为位图矩阵,实现高效的效用计算和数据库扫描;其次,采用重新定义的事务加权效用(RTWU)策略缩减搜索空间;最后,对项集进行长度修剪,使用深度优先搜索和轮盘赌注选择法确定修剪项目。在4个数据集的仿真实验中,当最大长度为6时,与HUIM-BA相比,HUIM-LC-BA挖掘的模式数量分别减少了91%、98%、99%与97%,同时运行时间也少于HUIM-BA;且在不同长度约束条件下,与FHM+(Faster High-utility itemset Ming plus)算法相比运行时间更稳定。实验结果表明,HUIM-LC-BA能有效挖掘具有长度约束的HUI,并减少挖掘模式的数量。 展开更多
关键词 高效用项集挖掘 蝙蝠算法 长度约束 位图矩阵 轮盘赌注选择法
下载PDF
基于DBP的Top-k高效用项集挖掘算法 被引量:1
7
作者 蒋华 路昕宇 +1 位作者 王慧娇 宋佳璐 《计算机工程与设计》 北大核心 2021年第6期1631-1637,共7页
针对Top-k高效用项集挖掘算法在挖掘过程中忽略内存管理的问题,提出基于DBP的Top-k高效用项集挖掘算法TKBPH(Top-k buffer pool high utility itemsets mining),采用数据缓冲池(DBP)结构存储效用链表,并由索引链表记录效用链表在DBP的... 针对Top-k高效用项集挖掘算法在挖掘过程中忽略内存管理的问题,提出基于DBP的Top-k高效用项集挖掘算法TKBPH(Top-k buffer pool high utility itemsets mining),采用数据缓冲池(DBP)结构存储效用链表,并由索引链表记录效用链表在DBP的位置。数据缓冲池根据挖掘过程情况在数据缓冲池尾部动态插入和删除效用链表,通过索引链表直接读取效用链表避免项集搜索时频繁的比较操作,有效减少内存空间和运行时间消耗。不同类型数据集上的实验结果表明,TKBPH算法在挖掘过程中执行速度更快、内存消耗更少。 展开更多
关键词 数据挖掘 高效用项集挖掘 数据缓冲池 索引链表 TOP-K
下载PDF
基于智能优化算法的高效用项集挖掘方法综述 被引量:2
8
作者 高智慧 韩萌 +2 位作者 刘淑娟 李昂 穆栋梁 《计算机应用》 CSCD 北大核心 2023年第6期1676-1686,共11页
高效用项集挖掘(HUIM)能够挖掘事务数据库中具有重要意义的项集,从而帮助用户更好地进行决策。针对智能优化算法的应用能够显著提高海量数据中高效用项集的挖掘效率这一现状,对基于智能优化算法的HUIM方法进行了综述。首先,以智能优化... 高效用项集挖掘(HUIM)能够挖掘事务数据库中具有重要意义的项集,从而帮助用户更好地进行决策。针对智能优化算法的应用能够显著提高海量数据中高效用项集的挖掘效率这一现状,对基于智能优化算法的HUIM方法进行了综述。首先,以智能优化算法的类别为角度,从基于群智能优化、基于进化以及基于其他智能优化算法的方法这3个方面对基于智能优化算法的HUIM方法进行了详细的分析与总结。同时,从粒子更新方式的角度对基于粒子群优化(PSO)的HUIM方法进行了详细梳理,包括基于传统更新策略、基于sigmoid函数、基于贪心、基于轮盘赌以及基于集合的方法。另外,从种群更新方法、对比算法、参数设置、优缺点等角度对比分析了基于群智能优化算法的HUIM方法。然后,从遗传和仿生两个方面对基于进化的HUIM方法进行总结概括。最后,针对目前基于智能优化算法的HUIM方法所存在的问题,提出了下一步的研究方向。 展开更多
关键词 高效用项集挖掘 智能优化算法 粒子群优化算法 进化算法 启发式算法
下载PDF
基于马尔可夫优化的高效用项集挖掘算法
9
作者 钟新成 刘昶 赵秀梅 《计算机应用》 CSCD 北大核心 2023年第12期3764-3771,共8页
基于树型和链表结构的高效用项集挖掘(HUIM)算法通常需要指数量级的搜索空间,而基于进化类型的挖掘算法未能充分考虑变量间的相互作用,因此提出一种基于马尔可夫优化的HUIM算法(HUIM-MOA)。首先,采用位图矩阵表示数据库和使用期望向量编... 基于树型和链表结构的高效用项集挖掘(HUIM)算法通常需要指数量级的搜索空间,而基于进化类型的挖掘算法未能充分考虑变量间的相互作用,因此提出一种基于马尔可夫优化的HUIM算法(HUIM-MOA)。首先,采用位图矩阵表示数据库和使用期望向量编码,以实现对数据库的快速扫描和效用值的高效计算;其次,通过计算优势个体间的互信息估计马尔可夫网络(MN)结构,并根据它们的局部特性使用吉布斯采样以产生新的种群;最后,为防止算法过快陷入局部最优和减少高效用项集的缺失,分别采用种群多样性保持策略和精英策略。在真实数据集上的实验结果表明,相较于次优的基于粒子群优化(PSO)的生物启发式HUI框架(Bio-HUIF-PSO)算法,在给定较大最小阈值的情况下,HUIM-MOA可以找到全部的高效用项集(HUI),收敛速度平均提升12.5%,挖掘HUI数平均提高2.85个百分点,运行时间平均减少14.6%。HUIM-MOA较进化型HUIM算法有更强的搜索性能,能有效减少搜索时间和提高搜索质量。 展开更多
关键词 高效用项集挖掘 马尔可夫网络 位图矩阵 吉布斯采样 精英策略
下载PDF
同类项的频繁高效用项集挖掘算法 被引量:2
10
作者 王斌 吕瑞瑞 周炜 《计算机工程与设计》 北大核心 2019年第11期3142-3150,共9页
现有高效用项集挖掘算法没有考虑分类挖掘的情况,针对这一不足,提出基于同类项的频繁高效用项集挖掘算法CMFHUI。把数据库中的所有项进行分类,给每一类赋予一个最小效用阈值,在这个基础上加上支持度约束,使得最终挖掘的项集既是频繁项... 现有高效用项集挖掘算法没有考虑分类挖掘的情况,针对这一不足,提出基于同类项的频繁高效用项集挖掘算法CMFHUI。把数据库中的所有项进行分类,给每一类赋予一个最小效用阈值,在这个基础上加上支持度约束,使得最终挖掘的项集既是频繁项集又是高效用项集。为进一步提高算法的挖掘效率,提出改进算法CMFHUI+。利用Mushroom和T10I4D100K数据集,结合4种不同的剪枝性质进行仿真实验,验证了这两种算法的有效性和可行性。 展开更多
关键词 高效用项 同类项 多最小效用阈值 支持度约束 频繁高效用项集挖掘
下载PDF
基于高效用项集挖掘和词义归纳的新闻推荐系统 被引量:1
11
作者 朱亚进 《计算机应用与软件》 北大核心 2021年第7期182-189,201,共9页
新闻平台新发布的新闻均不存在用户阅读、评论和推介记录,导致新闻推荐系统具有严重的冷启动问题,为此提出一种基于高效用项集挖掘和词义归纳的新闻推荐算法。基于点击量数据集学习推荐规则集,根据应用目标计算新闻正文内容的效用;通过... 新闻平台新发布的新闻均不存在用户阅读、评论和推介记录,导致新闻推荐系统具有严重的冷启动问题,为此提出一种基于高效用项集挖掘和词义归纳的新闻推荐算法。基于点击量数据集学习推荐规则集,根据应用目标计算新闻正文内容的效用;通过词汇嵌入将词义信息建模为复杂网络,通过社区检测算法将复杂网络分簇,对标题的词汇进行词义归纳处理,设计标题概率模型从语料库推理出潜在的标题;综合新闻正文内容的效用和标题的效用产生最终的推荐列表。实验结果表明,该算法明显提高了新闻推荐的准确率、多样性、响应速度。 展开更多
关键词 新闻应用 推荐系统 高效用项集挖掘 复杂网络 社区检测 词义归纳
下载PDF
基于滑动窗口的数据流高效用模糊项集挖掘 被引量:1
12
作者 单芝慧 韩萌 韩强 《南京师大学报(自然科学版)》 CAS 北大核心 2023年第1期120-129,共10页
高效用项集挖掘可以提供有趣的结果集,但并不能提供单个项的数量,因此,本文提出了高效用模糊项集.但是,现实世界的数据是不断出现的,需要实时处理新到来的数据.为解决当前高效用模糊项集不能处理数据流的问题,又提出了模糊效用列表(fuzz... 高效用项集挖掘可以提供有趣的结果集,但并不能提供单个项的数量,因此,本文提出了高效用模糊项集.但是,现实世界的数据是不断出现的,需要实时处理新到来的数据.为解决当前高效用模糊项集不能处理数据流的问题,又提出了模糊效用列表(fuzzy utility list,FUL)结构用于存储当前窗口中项的批次号、项在事务中的事务标识符、项的模糊效用以及项的剩余模糊效用,该结构能有效的对批次进行插入和删除操作.最后,基于FUL提出了数据流高效用模糊项集挖掘算法.对真实数据集和合成数据集进行了广泛的实验,结果证实了算法的效率及可行性. 展开更多
关键词 数据流挖掘 滑动窗口 高效用项集挖掘 模糊效用 效用列表
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部