期刊文献+
共找到534篇文章
< 1 2 27 >
每页显示 20 50 100
Frequent item sets mining from high-dimensional dataset based on a novel binary particle swarm optimization 被引量:2
1
作者 张中杰 黄健 卫莹 《Journal of Central South University》 SCIE EI CAS CSCD 2016年第7期1700-1708,共9页
A novel binary particle swarm optimization for frequent item sets mining from high-dimensional dataset(BPSO-HD) was proposed, where two improvements were joined. Firstly, the dimensionality reduction of initial partic... A novel binary particle swarm optimization for frequent item sets mining from high-dimensional dataset(BPSO-HD) was proposed, where two improvements were joined. Firstly, the dimensionality reduction of initial particles was designed to ensure the reasonable initial fitness, and then, the dynamically dimensionality cutting of dataset was built to decrease the search space. Based on four high-dimensional datasets, BPSO-HD was compared with Apriori to test its reliability, and was compared with the ordinary BPSO and quantum swarm evolutionary(QSE) to prove its advantages. The experiments show that the results given by BPSO-HD is reliable and better than the results generated by BPSO and QSE. 展开更多
关键词 粒子群算法 频繁项集 数据集 二进制 挖掘 高维 APRIORI 初始粒子
下载PDF
Finding Recently Frequent Items over Online Data Streams
2
作者 尹志武 黄上腾 《Journal of Donghua University(English Edition)》 EI CAS 2006年第6期53-56,共4页
In this paper, a new algorithm HCOUNT+ is proposed to find frequent items over data stream based on the HCOUNT algorithm. The new algorithm adopts aided measures to improve the precision of HCOUNT greatly. In addition... In this paper, a new algorithm HCOUNT+ is proposed to find frequent items over data stream based on the HCOUNT algorithm. The new algorithm adopts aided measures to improve the precision of HCOUNT greatly. In addition, HCOUNT+ is introduced to time critical applications and a novel sliding windows-based algorithm SL-HCOUNT+ is proposed to mine the most frequent items occurring recently. This algorithm uses limited memory (nB·(1+α)·eε·ln-M/lnρ(α<1) counters), requires constant processing time per packet (only (1+α)·ln·-M/lnρ(α<1) counters are updated), makes only one pass over the streaming data, and is shown to work well in the experimental results. 展开更多
关键词 计算机技术 网络 在线数据 计算方法
下载PDF
基于知识的目标关系分析挖掘技术
3
作者 王峰 赵伟伟 +3 位作者 马培博 康彦肖 王澜涛 周炜昊 《计算机与网络》 2024年第3期268-271,共4页
在战场目标价值分析和打击目标排序分析过程中,为了构建敌方作战目标体系,需要分析战场目标间的关联关系。轨迹和部署数据中隐藏大量信息,提出了一种从轨迹和部署数据中挖掘出感兴趣的目标关系类型信息的方法,所提方法对轨迹部署数据进... 在战场目标价值分析和打击目标排序分析过程中,为了构建敌方作战目标体系,需要分析战场目标间的关联关系。轨迹和部署数据中隐藏大量信息,提出了一种从轨迹和部署数据中挖掘出感兴趣的目标关系类型信息的方法,所提方法对轨迹部署数据进行时空聚类,从聚类结果提取目标;对聚类目标使用频繁项挖掘算法分析挖掘满足一定支持度的有关联关系的目标,再根据构建的关系类型知识库或关系规则,分析目标间的具体关系类型。所提方法能对积累的目标历史轨迹部署数据分析挖掘出目标间的关联关系,挖掘出目标潜在的关系类型可为后续构建目标体系提供关系数据。 展开更多
关键词 关联关系 时空聚类 轨迹数据 频繁项挖掘 关系规则
下载PDF
基于隐结构模型和频繁项集的针刺治疗慢性前列腺炎辨证取穴规律
4
作者 胡创政 孙自学 +4 位作者 张宸铭 樊立鹏 华众 付晓君 门波 《世界中医药》 CAS 北大核心 2024年第8期1182-1187,共6页
目的:探讨针刺治疗慢性前列腺炎的辨证取穴规律,为临床治疗慢性前列腺炎提供帮助。方法:检索国家知识基础设施数据库(CNKI)、中文科技期刊数据库(CCD)等数据库中关于针刺辨证论治慢性前列腺炎的文献,构建包含症状、证型、穴位处方的慢... 目的:探讨针刺治疗慢性前列腺炎的辨证取穴规律,为临床治疗慢性前列腺炎提供帮助。方法:检索国家知识基础设施数据库(CNKI)、中文科技期刊数据库(CCD)等数据库中关于针刺辨证论治慢性前列腺炎的文献,构建包含症状、证型、穴位处方的慢性前列腺炎病历数据库,运用隐结构模型分析、频繁项集等方法,分析针刺治疗慢性前列腺炎的辨证取穴规律。结果:共纳入文献64篇,涉及穴位91个,症状248项。高频穴位如三阴交、中极等;高频症状包括舌体瘀点瘀斑、苔黄腻、滴白、尿急等;构建隐结构模型,得出慢性前列腺炎主要证型有湿热下注、肾阳不足等;挖掘出症状-穴位频繁项集、症状-证型-穴位频繁项集各4项。症状-穴位频繁项集如“尿急+滴白+阳痿+早泄+肾俞+足三里”,症状-证型-穴位频繁项集如“尿频+尿急+苔黄腻+滴白+舌体瘀点瘀斑+湿热瘀阻+三阴交+会阴”,提示治疗时可根据相应症状判定证型及选择对应穴位。结论:针刺治疗慢性前列腺炎多以三阴交、中极、关元等为主要穴位,穴位配伍依据临床情况辨证选穴,此可为临床治疗慢性前列腺炎提供参考。 展开更多
关键词 隐结构模型 频繁项集 慢性前列腺炎 数据挖掘 辨证取穴规律 针刺 穴位 APRIORI算法
下载PDF
基于隐结构模型联合频繁项集的针灸治疗弱精子症不育患者的辨证取穴规律
5
作者 何瑞宣 孙自学 +3 位作者 华众 张芳 张迪 胡创政 《世界中医药》 CAS 北大核心 2024年第14期2185-2190,共6页
目的:探讨针灸治疗弱精子症不育患者的辨证取穴规律,为临床治疗弱精子症不育患者提供帮助。方法:检索国家知识基础设施数据库(CNKI)、中国生物医学文献数据库(CBM)、中国学术期刊数据库(CSPD)及中文科技期刊数据库(CCD)等数据库有关针... 目的:探讨针灸治疗弱精子症不育患者的辨证取穴规律,为临床治疗弱精子症不育患者提供帮助。方法:检索国家知识基础设施数据库(CNKI)、中国生物医学文献数据库(CBM)、中国学术期刊数据库(CSPD)及中文科技期刊数据库(CCD)等数据库有关针灸治疗弱精子症的相关文献,提取症状、取穴处方信息构建医案数据库,采用隐结构模型、频繁项集的数据挖掘方法,分析针灸治疗弱精子症的辨证取穴规律。结果:纳入文献35篇,涉及症状62种,穴位49个。高频症状包括腰酸、神疲乏力等,高频腧穴包括关元、肾俞等。对症状、腧穴、证型进行频繁项集分析,挖掘出症状-腧穴频繁项集4项,包括耳鸣+头晕+腰酸+关元+肾俞等;证型-症状频繁项集4项,包括肾精亏虚证+健忘+性欲淡漠+神疲乏力+脉细等;证型-症状-腧穴频繁项集4项,包括肾精亏虚证+性欲淡漠+神疲乏力+头发易脱+关元等。结论:针灸治疗弱精子症多以关元、肾俞、足三里为主穴。 展开更多
关键词 隐结构模型 频繁项集 弱精子症 辨证取穴规律 数据挖掘 Apriori算法 穴位 针灸
下载PDF
基于隐结构模型与频繁项集探讨特发性肺纤维化的辨证用药规律
6
作者 侯超峰 李亚兰 +2 位作者 杜一杰 陈珂 陈乾 《山东中医杂志》 2024年第2期133-138,152,共7页
目的:探讨中医治疗特发性肺纤维化(IPF)的辨证用药规律,为临床治疗IPF提供参考。方法:在中国知网、万方数据知识服务平台、PubMed、Embase等数据库中,检索建库至2021年8月8日辨证应用中药汤剂治疗IPF的相关文献,提取证型、症状及中药处... 目的:探讨中医治疗特发性肺纤维化(IPF)的辨证用药规律,为临床治疗IPF提供参考。方法:在中国知网、万方数据知识服务平台、PubMed、Embase等数据库中,检索建库至2021年8月8日辨证应用中药汤剂治疗IPF的相关文献,提取证型、症状及中药处方信息,构建IPF医案数据库,采用隐结构模型、频繁项集等数据挖掘方法分析中药汤剂内服治疗IPF的辨证用药规律。结果:共纳入文献39篇,包含病例1497例。纳入文献共包含症状163个,如咳嗽、乏力、气短等,将频次3的53个症状作为显变量构建IPF的隐结构模型,该模型提示气虚血瘀是IPF的常见证型。纳入文献包含的处方中共涉及中药163味,其中高频药物包括黄芪、甘草、丹参、当归、党参等;挖掘出“症状-中药”频繁项集5项,如“胸痛乏力+舌有瘀斑+脉沉细+丹参+桃仁+党参”;“证型-症状-中药”频繁项集4项,如“气虚血瘀+胸闷乏力+舌有瘀斑+黄芪+丹参+当归”。结论:气虚血瘀是IPF的临床常见证型,中药汤剂治疗IPF多以黄芪、甘草、丹参为主要药物,药物配伍根据临床辨证选择。 展开更多
关键词 特发性肺纤维化 数据挖掘 隐结构模型 频繁项集 辨证 用药规律 肺痿
下载PDF
动员需求关联规则挖掘模型
7
作者 高春梅 魏勇 《指挥信息系统与技术》 2024年第1期82-86,共5页
关联规则挖掘是一种成熟的基于规则的数据挖掘算法,已广泛用于发掘数据中感兴趣的关联关系。提出了一种动员需求关联规则模型,并描述了规则挖掘算法实现原理及评价方法。动员需求关联规则模型既可用于辅助快速提报动员需求,又可作为动... 关联规则挖掘是一种成熟的基于规则的数据挖掘算法,已广泛用于发掘数据中感兴趣的关联关系。提出了一种动员需求关联规则模型,并描述了规则挖掘算法实现原理及评价方法。动员需求关联规则模型既可用于辅助快速提报动员需求,又可作为动员需求评估的辅助手段,从而为相关信息系统构建提供参考。 展开更多
关键词 动员需求 关联规则挖掘 频繁项集
下载PDF
基于邻接比特压缩表的频繁闭项集挖掘算法
8
作者 杨博超 吴美璇 +1 位作者 胡浩 朱敏 《计算机仿真》 2024年第1期415-424,共10页
频繁闭项集(Frequent Closed Items,FCI)是一种表示事物之间关联关系的有效方式,它能克服频繁项集(Frequent Items,FI)信息冗余的缺点。FCI挖掘算法研究旨在以更优的时空效率,在原始数据集中找到所有的FCI。相关研究成果重在关注时间效... 频繁闭项集(Frequent Closed Items,FCI)是一种表示事物之间关联关系的有效方式,它能克服频繁项集(Frequent Items,FI)信息冗余的缺点。FCI挖掘算法研究旨在以更优的时空效率,在原始数据集中找到所有的FCI。相关研究成果重在关注时间效率的提升,但空间效率欠佳。提出一种高空间压缩率数据结构——邻接比特压缩表(Compressed Adjacency Byte table,Cab-table),将项集与交易集压缩到剔除全部0之后的比特表中,使空间高度压缩。基于此数据结构的频繁闭项集挖掘算法(Cab-Miner),采用运算栈与检索栈来实现非递归方式的频繁闭项集挖掘,相较于之前普遍采用递归方式的算法,在理论上可使空间占用率由O(L*N+M)降为O(3N)。基于公开数据集与真实数据集的实验表明,上述算法在原始数据集压缩,以及运算内存消耗上,都有较优的表现,尤其在处理真实数据集时,空间表现极佳。另外在某些属性的数据集上也表现出优越的时间效率。 展开更多
关键词 频繁闭项集 邻接比特压缩表 非递归算法 高空间效率
下载PDF
基于大数据与关联规则的考评进度动态跟踪系统设计
9
作者 张瑞 张维建 +1 位作者 张新峰 刘颖 《微型电脑应用》 2024年第4期153-156,共4页
为了提高考评进度动态跟踪效果,设计一个基于大数据与关联规则的考评进度动态跟踪系统。在系统硬件部分设计了微控制器、通信模块、存储器模块与信号采集模块;在系统软件部分,采用大数据挖掘技术挖掘员工相关数据,采用关联规则挖掘数据... 为了提高考评进度动态跟踪效果,设计一个基于大数据与关联规则的考评进度动态跟踪系统。在系统硬件部分设计了微控制器、通信模块、存储器模块与信号采集模块;在系统软件部分,采用大数据挖掘技术挖掘员工相关数据,采用关联规则挖掘数据的频繁项集,构建FP树,计算数据的最小支持度和最小置信度,对数据分类,获得员工绩效的关联信息,并整合信息,完成考评进度动态跟踪系统的设计。实验结果表明,该方法能够准确地对员工绩效打分,并在多并发用户访问与多条数量处理上,有效提高了考评进度动态跟踪效果。 展开更多
关键词 大数据 关联规则 考评进度 动态跟踪 频繁项集 最小支持度
下载PDF
基于RS_Hash频繁项集的卫星载荷关联规则算法
10
作者 贾澎涛 温滋 《国外电子测量技术》 北大核心 2023年第2期9-15,共7页
遥测数据是反映卫星健康状态的重要依据,对遥测载荷数据进行关联性分析,在一定程度上能反映出卫星的整体运行情况的好坏。针对传统关联规则算法存在效率低下、占用内存过多的问题,提出一种基于RS_Hash频繁项集的卫星载荷关联规则算法。... 遥测数据是反映卫星健康状态的重要依据,对遥测载荷数据进行关联性分析,在一定程度上能反映出卫星的整体运行情况的好坏。针对传统关联规则算法存在效率低下、占用内存过多的问题,提出一种基于RS_Hash频繁项集的卫星载荷关联规则算法。首先对事务数据库使用动态随机抽样的方法获取样本数据,设计抽样误差和抽样停止规则来确定最优的样本容量;其次将抽取出的样本使用哈希桶来存储频繁项集,进而减少占用的内存,提高算法的运行效率;最后使用3个与载荷数据相似的公开数据集和卫星载荷数据集进行实验,结果表明,在公共数据集上取得了良好的效果,尤其是在具有大数据量级的卫星载荷数据集上效果明显,在不同事务长度和支持度的情况下,相较于Apriori、PCY、SON、FP-Growth、RCM_Apriori和Hash_Cumulate算法,RS_Hash算法在平均时间效率上分别提高了75.81%、49.10%、59.38%、50.22%、40.16%和39.22%。 展开更多
关键词 卫星载荷分析 关联规则 频繁项集 动态随机抽样算法 哈希桶
下载PDF
面向代码审查的细粒度代码变更溯源方法
11
作者 王敏 潘兴禄 +1 位作者 邹艳珍 谢冰 《软件学报》 EI CSCD 北大核心 2023年第10期4705-4723,共19页
代码审查是现代软件分布式并行开发过程中的重要机制.在代码评审时,帮助代码评审者快速查看某一段源代码的演化过程,可以让评审者快速理解此段代码变更的原因和必要性,从而有效提升代码评审的效率与质量.现有工作虽然提供了一些类似的... 代码审查是现代软件分布式并行开发过程中的重要机制.在代码评审时,帮助代码评审者快速查看某一段源代码的演化过程,可以让评审者快速理解此段代码变更的原因和必要性,从而有效提升代码评审的效率与质量.现有工作虽然提供了一些类似的代码提交历史回溯方法及对应工具,但缺乏从历史数据中进一步提取辅助代码评审相关辅助信息的能力.为此,提出一个面向代码评审的细粒度代码变更溯源方法C2Tracker.给定一段方法(函数)级别的细粒度代码变更,C2Tracker能够自动追溯到历史开发过程中修改该段代码相关的代码提交,并在此基础上进一步挖掘其中与该段代码频繁共现修改的代码元素以及相关的变更片段,辅助代码评审者对当前代码变更的理解与决策.在10个著名开源项目的数据集下进行实验验证.实验结果表明,C2Tracker在追溯历史提交的准确率上达到97%,在挖掘频繁共现代码元素任务上的准确率达到95%,在追溯相关代码变更片段任务上的准确率达到97%;相比现有评审方式,C2Tracker在具体案例的代码评审效率和质量上均有较大提升,在绝大多数的代码评审案例中被评审者认为能提供“明显帮助”或“很大帮助”. 展开更多
关键词 代码评审 历史溯源 频繁项集挖掘 相关代码变更
下载PDF
基于层次梯度挖掘的数据智能调度算法仿真
12
作者 周晓晶 谷钰 《计算机仿真》 北大核心 2023年第4期358-361,381,共5页
针对当前的数据调度算法存在执行费用较高、调度耗时较长且数据资源负载不均衡的问题,提出层次梯度挖掘的数据智能调度算法。采用挖掘主题数据库和层次梯度两者构建层次业务数据库,挖掘数据局部频繁项。根据数据挖掘结果,建立执行时间... 针对当前的数据调度算法存在执行费用较高、调度耗时较长且数据资源负载不均衡的问题,提出层次梯度挖掘的数据智能调度算法。采用挖掘主题数据库和层次梯度两者构建层次业务数据库,挖掘数据局部频繁项。根据数据挖掘结果,建立执行时间、执行费用和负载均衡为智能调度目标,构建数据智能调度模型。利用自适应遗传蚁群优化算法对模型求解,最终实现数据智能调度。仿真结果表明:所提算法下数据资源负载结果更均衡,同时还能够有效降低执行费用和调度时长。由此可得结论:本研究具有理想的应用效果。 展开更多
关键词 层次梯度挖掘 数据智能调度 自适应遗传蚁群优化算法 局部频繁项
下载PDF
一种考虑气象因素的配电网设备故障关联挖掘模型
13
作者 李丰君 王子欣 +2 位作者 孙芊 彭磊 苗世洪 《现代电力》 北大核心 2023年第4期605-613,共9页
电网结构日益复杂,故障监测与防范的成本随之增大,而强对流天气的频繁出现使得设备故障与外界条件关联更加紧密,因此挖掘故障设备与故障因素间的关联关系,并对具有较高关联度的设备进行重点监测与防范,对电力系统的安全稳定运行具有重... 电网结构日益复杂,故障监测与防范的成本随之增大,而强对流天气的频繁出现使得设备故障与外界条件关联更加紧密,因此挖掘故障设备与故障因素间的关联关系,并对具有较高关联度的设备进行重点监测与防范,对电力系统的安全稳定运行具有重要意义。基于模糊频繁项挖掘算法,提出了1种考虑气象因素的配电网设备故障关联挖掘模型。该模型首先从多元信息库中提取故障特征数据,采用Relief-F算法排除相关程度较小的冗余特征,通过数据预处理与数据整合,构建包含气象因素的故障关联特征库。其次,以故障关联特征库为基础,引入模糊集理论,提出基于模糊频繁项集挖掘算法的故障因素与故障设备关联模型构建方法。最后,基于故障关联模型进行了算例分析,结果验证了所提方法的正确与有效性。 展开更多
关键词 关联规则 气象因素 模糊频繁项挖掘 配电网 Relief-F算法
下载PDF
基于关联规则算法的网络安全隐患数据挖掘研究 被引量:1
14
作者 林丹生 曾智勇 +1 位作者 李祥林 梁智强 《自动化仪表》 CAS 2023年第9期71-75,81,共6页
网络安全隐患数据具有海量化、复杂化、多元化的特点,因此在对网络安全隐患数据进行挖掘时存在执行时间长、挖全率低、内存消耗量大的问题。为了优化网络安全隐患数据挖掘效果,研究了基于关联规则算法的网络安全隐患数据挖掘模型。计算... 网络安全隐患数据具有海量化、复杂化、多元化的特点,因此在对网络安全隐患数据进行挖掘时存在执行时间长、挖全率低、内存消耗量大的问题。为了优化网络安全隐患数据挖掘效果,研究了基于关联规则算法的网络安全隐患数据挖掘模型。计算关联权值和平均值,由此获取数据项集关联度的准确性。通过判别关联程度,完成数据预处理。采用Apriori算法对预处理后的数据进行量化处理,抽取、挖掘、记录可应用数据信息。利用亲和度函数建立目标函数,以获取隐患数据。建立关联规则,以确保隐患数据差异。以可信度结果为基础,构建网络安全隐患数据挖掘模型,实现网络安全隐患数据挖掘。试验结果表明,采用此模型后,执行时间较短、挖全率较高、数据挖掘过程中占用的内存较少。该研究可为网络安全隐患数据挖掘系统设计提供有效支持。 展开更多
关键词 关联规则算法 网络安全隐患 数据挖掘 最小支持度 频繁项集 目标函数 关联权值 亲和度函数
下载PDF
应用基于密度聚类的频繁模式增长算法进行煤层气产能分析
15
作者 吕茵 王杨 高永伟 《科技资讯》 2023年第16期181-184,共4页
由于传统的煤层气产能分析算法存在影响因素不够全面,运行效率低和人为设置聚类参数缺乏说服力的问题。因此,该文在煤层气产能分类的基础上,对分类结果进行回溯,挖掘煤层气产能影响因素的规律,将基于密度聚类算法(Density-Based Spatial... 由于传统的煤层气产能分析算法存在影响因素不够全面,运行效率低和人为设置聚类参数缺乏说服力的问题。因此,该文在煤层气产能分类的基础上,对分类结果进行回溯,挖掘煤层气产能影响因素的规律,将基于密度聚类算法(Density-Based Spatial Clustering of Application with Noise,DBSCAN)与频繁模式增长算法(Frequent-Pattern Growth,FP-Growth)关联度分析算法优化结合,提出新的基于DBSCAN的FP-growth煤层气产能分析模型,找出影响煤层气产能的关键因素及其对应的参数范围。该文是深度学习与煤层气开发交叉学科的应用与研究,致力于煤层气产能分析评价体系的构建,为提高煤层气单井产气量,提升措施选井的决策效率有积极影响。 展开更多
关键词 煤层气产量 DBSCAN聚类 FP-Growth关联度分析算法 频繁项集 措施选井
下载PDF
关联规则挖掘方法在输送线烟箱缺条智能检测中的应用 被引量:1
16
作者 宋煜 江志凌 刘艳超 《微型电脑应用》 2023年第4期202-204,208,共4页
针对输送线烟箱缺条检测时存在的检测精度较低、抗噪性较差问题,探讨关联规则挖掘方法在输送线烟箱缺条智能检测中的应用。以关联规则挖掘概念为依据,结合特征匹配度概念,获取输送线烟箱全部特征后构建烟箱缺条特征库;采用烟箱缺条关联... 针对输送线烟箱缺条检测时存在的检测精度较低、抗噪性较差问题,探讨关联规则挖掘方法在输送线烟箱缺条智能检测中的应用。以关联规则挖掘概念为依据,结合特征匹配度概念,获取输送线烟箱全部特征后构建烟箱缺条特征库;采用烟箱缺条关联分析模型,挖掘特征库中的烟箱缺条特征,获取烟箱缺条的极大频繁项集,输入所有待检测的烟箱,通过特征匹配和关联规则获取智能检测结果,完成烟箱缺条智能检测。测试结果表明该方法具备较好的数据挖掘性能和效率,在支持度和置信度均为最小值时,可准确完成烟箱缺条特征匹配,在不同噪声条件下,均具备较好检测结果,应用性较好。 展开更多
关键词 关联规则 挖掘方法 输送线 烟箱缺条 极大频繁项集
下载PDF
基于关联规则的工业控制系统运维数据挖掘方法
17
作者 李军 《微型电脑应用》 2023年第9期167-170,共4页
大型工业控制系统中存在海量的运维数据,为了降低高维数据最大频繁项集对数据挖掘结果的影响,提升控制系统性能和环境安全,在关联规则的基础上,提出了一种新的数据挖掘方法。在给定的事务数据库中,通过不断改变数值,使得支持度和置信度... 大型工业控制系统中存在海量的运维数据,为了降低高维数据最大频繁项集对数据挖掘结果的影响,提升控制系统性能和环境安全,在关联规则的基础上,提出了一种新的数据挖掘方法。在给定的事务数据库中,通过不断改变数值,使得支持度和置信度始终保持最小值,保证关联规则为强关联;经过预处理,将数据转换为离散型数据,运用Apriori算法和DLG算法产生频繁项目集,构建关联图得到频繁项集。当不再产生新的项集时终止计算,所得项集即为最终的数据挖掘结果。在TEP仿真系统上展开实验,结果表明,所提方法可以准确挖掘到控制系统运行过程中的异常数据,并以明显的波动提醒工作人员及时查看。 展开更多
关键词 关联规则 大型工业控制系统 DLG算法 散型数据 频繁项目集
下载PDF
一种有效的挖掘数据流近似频繁项算法 被引量:33
18
作者 王伟平 李建中 +1 位作者 张冬冬 郭龙江 《软件学报》 EI CSCD 北大核心 2007年第4期884-892,共9页
数据流频繁项是指在数据流中出现频率超出指定阈值的数据项.查找数据流频繁项在网络故障监测、流数据分析以及流数据挖掘等多个领域有着广泛的应用.在数据流模型下,算法只能一遍扫描数据,并且可用的存储空间远远小于数据流的规模,因此,... 数据流频繁项是指在数据流中出现频率超出指定阈值的数据项.查找数据流频繁项在网络故障监测、流数据分析以及流数据挖掘等多个领域有着广泛的应用.在数据流模型下,算法只能一遍扫描数据,并且可用的存储空间远远小于数据流的规模,因此,挖掘出所有准确的数据流频繁项通常是不可能的.提出一种新的挖掘数据流近似频繁项的算法.该算法的空间复杂性为O(ε^(-1)),每个数据项的平均处理时间为O(1),输出结果的频率误差界限为ε(1-s+ε)N,在目前已有的同类算法中均为最优. 展开更多
关键词 数据流 数据挖掘 频繁项 ε-近似
下载PDF
多尺度数据挖掘方法 被引量:28
19
作者 柳萌萌 赵书良 +3 位作者 韩玉辉 苏东海 李晓超 陈敏 《软件学报》 EI CSCD 北大核心 2016年第12期3030-3050,共21页
多尺度理论已被引入到数据挖掘领域,但人们对其研究仍不够深入和完善,缺乏普适性理论与方法.随着大数据处理应用的不断深入,其研究变得更加迫切.针对上述问题,进行了普适的多尺度数据挖掘理论和方法的研究.首先,基于概念分层理论给出了... 多尺度理论已被引入到数据挖掘领域,但人们对其研究仍不够深入和完善,缺乏普适性理论与方法.随着大数据处理应用的不断深入,其研究变得更加迫切.针对上述问题,进行了普适的多尺度数据挖掘理论和方法的研究.首先,基于概念分层理论给出了数据尺度划分和数据尺度的定义以及多尺度数据集之间的上下层尺度数据集关系;其次,阐明了多尺度数据挖掘的定义、研究实质和方法分类;最后,提出了多尺度数据挖掘算法框架,给出其理论基础,并将此框架应用于关联规则挖掘,提出了多尺度关联规则挖掘算法MSARMA(multi-scale association rules mining algorithm),实现了多尺度数据集之间知识的跨尺度推导.利用IBM T10I4D100K数据集和H省全员人口真实数据集对MSARMA算法进行了实验和分析,实验结果表明:算法具有较高的覆盖率、精确度和较低的支持度估计误差,是可行且有效的. 展开更多
关键词 多尺度 频繁项集 关联规则 尺度转换 多尺度关联规则挖掘
下载PDF
满足均匀分布的不确定数据关联规则挖掘算法 被引量:18
20
作者 陈爱东 刘国华 +3 位作者 费凡 周宇 万小妹 貟慧 《计算机研究与发展》 EI CSCD 北大核心 2013年第S1期186-195,共10页
云计算为大数据提供了展示和共享的平台.为了防止隐私泄露,这些数据中往往包含人为添加的不确定因素,如何挖掘这些不确定数据是大数据共享亟待解决的问题.在用于共享的大数据中,不确定数据通过对精确数据的泛化处理来实现,具有均匀分布... 云计算为大数据提供了展示和共享的平台.为了防止隐私泄露,这些数据中往往包含人为添加的不确定因素,如何挖掘这些不确定数据是大数据共享亟待解决的问题.在用于共享的大数据中,不确定数据通过对精确数据的泛化处理来实现,具有均匀分布特性,这一特性不利于精确查询,但可为关联规则的挖掘提供便利条件.首先,依据泛化值之间可能的相交或包含关系,将泛化值进行分层聚类,为了保存与不确定数据集挖掘相关的重要信息,给出了构建不确定频繁模式树的算法,在此基础上,提出了频繁项集挖掘子算法(data mining algorithm for uncertain frequent item-sets,UFI-DM)和关联规则生成子算法(algorithm for generating association rules,GAR),分别用于挖掘频繁项集和生成关联规则,最后,通过理论分析和实验比对,论证了算法的可行性和有效性. 展开更多
关键词 大数据 均匀分布不确定数据 数据挖掘 关联规则 频繁项集
下载PDF
上一页 1 2 27 下一页 到第
使用帮助 返回顶部