期刊文献+
共找到135篇文章
< 1 2 7 >
每页显示 20 50 100
An Overview of Data Mining and Knowledge Discovery 被引量:8
1
作者 范建华 李德毅 《Journal of Computer Science & Technology》 SCIE EI CSCD 1998年第4期348-368,共21页
With massive amounts of data stored in databases, mining information and knowledge in databases has become an important issue in recent research. Researchers in many different fields have shown great interest in data ... With massive amounts of data stored in databases, mining information and knowledge in databases has become an important issue in recent research. Researchers in many different fields have shown great interest in data mining and knowledge discovery in databases. Several emerging applications in information providing services, such as data warehousing and on-line services over the Internet, also call for various data mining and knowledge discovery techniques to understand user behavior better, to improve the service provided, and to increase the business opportunities. In response to such a demand, this article is to provide a comprehensive survey on the data mining and knowledge discovery techniques developed recently, and introduce some real application systems as well. In conclusion, this article also lists some problems and challenges for further research. 展开更多
关键词 knowledge discovery in databases data mining machine learning association rule CLASSIFICATION data clustering data generalization pattern searching
原文传递
Elicitation of Association Rules from Information on Customs Offences on the Basis of Frequent Motives
2
作者 Bi Bolou Zehero Etienne Soro +2 位作者 Yake Gondo Pacome Brou Olivier Asseu 《Engineering(科研)》 2018年第9期588-605,共18页
The fight against fraud and trafficking is a fundamental mission of customs. The conditions for carrying out this mission depend both on the evolution of economic issues and on the behaviour of the actors in charge of... The fight against fraud and trafficking is a fundamental mission of customs. The conditions for carrying out this mission depend both on the evolution of economic issues and on the behaviour of the actors in charge of its implementation. As part of the customs clearance process, customs are nowadays confronted with an increasing volume of goods in connection with the development of international trade. Automated risk management is therefore required to limit intrusive control. In this article, we propose an unsupervised classification method to extract knowledge rules from a database of customs offences in order to identify abnormal behaviour resulting from customs control. The idea is to apply the Apriori principle on the basis of frequent grounds on a database relating to customs offences in customs procedures to uncover potential rules of association between a customs operation and an offence for the purpose of extracting knowledge governing the occurrence of fraud. This mass of often heterogeneous and complex data thus generates new needs that knowledge extraction methods must be able to meet. The assessment of infringements inevitably requires a proper identification of the risks. It is an original approach based on data mining or data mining to build association rules in two steps: first, search for frequent patterns (support >= minimum support) then from the frequent patterns, produce association rules (Trust >= Minimum Trust). The simulations carried out highlighted three main association rules: forecasting rules, targeting rules and neutral rules with the introduction of a third indicator of rule relevance which is the Lift measure. Confidence in the first two rules has been set at least 50%. 展开更多
关键词 data mining Customs Offences Unsupervised Method Principle of Apriori Frequent Motive Rule of association Extraction of knowledge
下载PDF
Method and Application of Comprehensive Knowledge Discovery
3
作者 SHAZongyao BIANFuling 《Geo-Spatial Information Science》 2003年第3期48-55,共8页
This paper proposes the principle of comprehensive knowledge discovery. Unlike most of the current knowledge discovery methods, the comprehensive knowledge discovery considers both the spatial relations and attributes... This paper proposes the principle of comprehensive knowledge discovery. Unlike most of the current knowledge discovery methods, the comprehensive knowledge discovery considers both the spatial relations and attributes of spatial entities or objects. We introduce the theory of spatial knowledge expression system and some concepts including comprehensive knowledge discovery and spatial union information table (SUIT). In theory, SUIT records all information contained in the studied objects, but in reality, because of the complexity and varieties of spatial relations, only those factors of interest to us are selected. In order to find out the comprehensive knowledge from spatial databases, an efficient comprehensive knowledge discovery algorithm called recycled algorithm (RAR) is suggested. 展开更多
关键词 comprehensive knowledge discovery knowledge discovery algorithm spatialassociation rule knowledge expression system data mining
下载PDF
An efficient algorithm for mining closed itemsets 被引量:1
4
作者 刘君强 潘云鹤 《Journal of Zhejiang University Science》 CSCD 2004年第1期8-15,共8页
This paper presents a new efficient algorithm for mining frequent closed itemsets. It enumerates the closed set of frequent itemsets by using a novel compound frequent itemset tree that facilitates fast growth and eff... This paper presents a new efficient algorithm for mining frequent closed itemsets. It enumerates the closed set of frequent itemsets by using a novel compound frequent itemset tree that facilitates fast growth and efficient pruning of search space. It also employs a hybrid approach that adapts search strategies, representations of projected transaction subsets, and projecting methods to the characteristics of the dataset. Efficient local pruning, global subsumption checking, and fast hashing methods are detailed in this paper. The principle that balances the overheads of search space growth and pruning is also discussed. Extensive experimental evaluations on real world and artificial datasets showed that our algorithm outperforms CHARM by a factor of five and is one to three orders of magnitude more efficient than CLOSET and MAFIA. 展开更多
关键词 knowledge discovery data mining Frequent closed patterns association rules
下载PDF
A Study on Associated Rules and Fuzzy Partitions for Classification
5
作者 Yeu-Shiang Huang Jyi-Feng Yao 《Intelligent Information Management》 2012年第5期217-224,共8页
The amount of data for decision making has increased tremendously in the age of the digital economy. Decision makers who fail to proficiently manipulate the data produced may make incorrect decisions and therefore har... The amount of data for decision making has increased tremendously in the age of the digital economy. Decision makers who fail to proficiently manipulate the data produced may make incorrect decisions and therefore harm their business. Thus, the task of extracting and classifying the useful information efficiently and effectively from huge amounts of computational data is of special importance. In this paper, we consider that the attributes of data could be both crisp and fuzzy. By examining the suitable partial data, segments with different classes are formed, then a multithreaded computation is performed to generate crisp rules (if possible), and finally, the fuzzy partition technique is employed to deal with the fuzzy attributes for classification. The rules generated in classifying the overall data can be used to gain more knowledge from the data collected. 展开更多
关键词 data mining Fuzzy PARTITION PARTIAL CLASSIFICATION association RULE knowledge discovery.
下载PDF
关联规则挖掘驱动的盾构机刀盘健康评估方法 被引量:2
6
作者 刘尧 陈改革 +2 位作者 刘振国 孔宪光 常建涛 《中国机械工程》 EI CAS CSCD 北大核心 2023年第11期1326-1334,1342,共10页
传统机理建模研究与实际施工环境误差较大,而数据驱动建模多采用黑箱模型,不利于知识发现与理解,为此提出一种基于知识挖掘的盾构机刀盘健康评估方法。针对盾构掘进数据维数众多、海量异构、强噪声干扰等特点,结合盾构掘进领域知识与机... 传统机理建模研究与实际施工环境误差较大,而数据驱动建模多采用黑箱模型,不利于知识发现与理解,为此提出一种基于知识挖掘的盾构机刀盘健康评估方法。针对盾构掘进数据维数众多、海量异构、强噪声干扰等特点,结合盾构掘进领域知识与机器学习算法提出针对性的数据预处理、特征筛选以及连续特征离散化方法,以此建立知识挖掘数据集。在此基础上,利用关联规则挖掘算法提取关键特征与不同刀盘健康状态之间的映射关系,采用融合可靠度、完整度与简洁度的综合评价指标适应度准则对原始规则进行评价排序,最终实现盾构机刀盘健康评估。基于厦门地铁3号线某掘进区间的实际工程数据对所提方法进行了应用验证。研究结果表明,所挖掘的知识规则与实际数据分布具有良好的吻合度(平均值93%以上),验证了该方法的有效性。 展开更多
关键词 盾构机刀盘 健康评估 关联规则 数据挖掘 知识挖掘
下载PDF
KDD中规则提取的收敛网络方法及其应用 被引量:3
7
作者 熊范纶 邓超 《软件学报》 EI CSCD 北大核心 2000年第12期1635-1641,共7页
提出一种新的基于神经网络的规则提取方法 .提出的网络由一个主网络及其映射网络组成 ,具有二次收敛过程 .通过主网络的学习 (第 1次收敛 )完成知识学习和网络构造 ,在此基础上构造了其网络映射 ,通过该映射网络的收敛过程实现规则的提... 提出一种新的基于神经网络的规则提取方法 .提出的网络由一个主网络及其映射网络组成 ,具有二次收敛过程 .通过主网络的学习 (第 1次收敛 )完成知识学习和网络构造 ,在此基础上构造了其网络映射 ,通过该映射网络的收敛过程实现规则的提取 .该方法在规则提取时无须遍历解空间 ,从而很好地提高了搜索效率 ,降低了计算复杂度 .同时 ,还提出估计规则数下限的信度差方法 . 展开更多
关键词 KDD(knowledge discovery and data mining) 规则提取 神经网络 收敛网络 信度差
下载PDF
基于知识图谱的智能电网多维数据关联挖掘方法 被引量:4
8
作者 许中平 赵恩来 +2 位作者 张鹤译 牟玮 丁玉星 《电子设计工程》 2023年第11期84-87,92,共5页
为提高智能电网多维数据关联挖掘方法的准确性,提出了基于知识图谱的智能电网多维数据关联挖掘方法。按照动态图谱的框架结构,抽取关键电网数据,再根据数据的清洗与转换原理,完成基于知识图谱的电网数据关联性预测。在此基础上,划分关... 为提高智能电网多维数据关联挖掘方法的准确性,提出了基于知识图谱的智能电网多维数据关联挖掘方法。按照动态图谱的框架结构,抽取关键电网数据,再根据数据的清洗与转换原理,完成基于知识图谱的电网数据关联性预测。在此基础上,划分关联区间,根据知识图谱结构,建立多维关联规则,得到挖掘置信度的具体计算数值,完成智能电网多维数据关联挖掘方法的设计与应用。实验结果表明,在知识图谱作用下,电网数据关联规则挖掘准确度在低维度、中维度、高维度三种传输环境下,实验组的关联规则挖掘准确度在0.910以上,而对照组的关联规则挖掘精度均低于0.900,该文具有较高的准确性,更符合实际应用需求。 展开更多
关键词 知识图谱 电网数据 关联挖掘 多维关联规则 置信度
下载PDF
关联规则挖掘技术及发展动向 被引量:40
9
作者 朱绍文 王泉德 +2 位作者 黄浩 彭清涛 陆玉昌 《计算机工程》 EI CAS CSCD 北大核心 2000年第9期4-6,共3页
介绍了关联规则挖掘的主要内容和最新进展,对关联规则的各种挖掘算法进行比较,分析了关联规则挖掘的各种扩展和改进模型.
关键词 知识发现 数据挖掘 关联规则
下载PDF
数据挖掘发展研究 被引量:25
10
作者 张伟 刘勇国 +2 位作者 彭军 廖晓峰 吴中福 《计算机科学》 CSCD 北大核心 2001年第7期79-81,94,共4页
Mining knowledge from database has been thought as a key research issue in database system. Great mterest has been paid in data mining by researchers in different fields. In this paper,data mining techniques are intro... Mining knowledge from database has been thought as a key research issue in database system. Great mterest has been paid in data mining by researchers in different fields. In this paper,data mining techniques are introduced broadly including its definition,purpose,characteristic, principal processes and classifications. As an example,the studies on the mining association rules are illustrated. At last,some data mining prototypes are provided and several research trends on the data mining are discussed. 展开更多
关键词 数据挖掘 知识发现 数据库 机器学习
下载PDF
挖掘最大频繁模式的新方法 被引量:15
11
作者 刘君强 孙晓莹 +1 位作者 王勋 潘云鹤 《计算机学报》 EI CSCD 北大核心 2004年第10期1328-1334,共7页
由于其内在的计算复杂性 ,挖掘密集型数据集的频繁模式完全集非常困难 ,解决方案之一是挖掘最大频繁模式集 .该文在频繁模式完全集挖掘算法OpportuneProject基础上 ,提出了挖掘最大频繁模式的新算法MOP .它采用宽度与深度优先相结合的... 由于其内在的计算复杂性 ,挖掘密集型数据集的频繁模式完全集非常困难 ,解决方案之一是挖掘最大频繁模式集 .该文在频繁模式完全集挖掘算法OpportuneProject基础上 ,提出了挖掘最大频繁模式的新算法MOP .它采用宽度与深度优先相结合的混合搜索策略 ,能恰当地选择不同的支持集表示和投影方法 ,将闭合性剪裁和一般性剪裁相结合 ,并适时前窥 ,实现搜索与剪裁效率最优化 .实验表明 ,MOP效率是MaxMiner的 2~ 8倍 ,比MAFIA高 2个数量级以上 . 展开更多
关键词 知识发现 数据挖掘 最大频繁模式 关联规则 混合搜索策略 完全集挖掘算法 MOP
下载PDF
基于滑动窗口的数据流闭合频繁模式的挖掘 被引量:26
12
作者 刘学军 徐宏炳 +2 位作者 董逸生 钱江波 王永利 《计算机研究与发展》 EI CSCD 北大核心 2006年第10期1738-1743,共6页
频繁闭合模式集惟一确定频繁模式完全集并且数量小得多,然而,如何挖掘滑动窗口中的频繁闭合模式集是一个很大的挑战.根据数据流的特点,提出了一种发现滑动窗口中频繁闭合模式的新方法DSCFI.DSCFI算法将滑动窗口分割为若干个基本窗口,以... 频繁闭合模式集惟一确定频繁模式完全集并且数量小得多,然而,如何挖掘滑动窗口中的频繁闭合模式集是一个很大的挑战.根据数据流的特点,提出了一种发现滑动窗口中频繁闭合模式的新方法DSCFI.DSCFI算法将滑动窗口分割为若干个基本窗口,以基本窗口为更新单位,利用已有的频繁闭合模式挖掘算法计算每个基本窗口的潜在频繁闭合项集,将它们及其子集存储到一种新的数据结构DSCFItree中,DSCFItree能够增量更新,利用DSCFItree可以快速地挖掘滑动窗口中的所有频繁闭合模式.最后,通过实验验证了这种方法的有效性. 展开更多
关键词 数据流 闭合频繁项集 滑动窗口 关联规则 知识发现
下载PDF
挖掘转移规则:一种新的数据挖掘技术 被引量:11
13
作者 肖利 王能斌 +1 位作者 徐宏炳 金远平 《计算机研究与发展》 EI CSCD 北大核心 1998年第10期902-906,共5页
文中提出一种新的数据挖掘技术:挖掘转移规则.文中首先分析关联规则的不足,然后给出转移规则的形式模型和模板算法,最后讨论挖掘转移规则的应用和发展.
关键词 数据挖掘 知识发现 转移规则 关联规则 数据库
下载PDF
基于多维标度的快速挖掘关联规则算法 被引量:16
14
作者 肖利 金远平 +1 位作者 徐宏炳 王能斌 《软件学报》 EI CSCD 北大核心 1999年第7期749-753,共5页
挖掘关联规则是数据挖掘研究的一个重要方面.文章在分析其基本模型和研究多维标度基本性质的基础上,提出一个新的基于多维标度的挖掘关联规则算法.该算法以数据项间的关联度量为依据,将各个数据项投影到多维空间上,进行降维处理。
关键词 数据挖掘 关联规则 多维标度法 数据库 算法
下载PDF
关联规则的增量式更新算法 被引量:227
15
作者 冯玉才 冯剑琳 《软件学报》 EI CSCD 北大核心 1998年第4期301-306,共6页
关联规则的开采是一个重要的数据开采问题.目前已经提出了许多算法用于高效地发现大规模数据库中的关联规则,而对关联规则维护问题的研究工作却很少.在用户开采关联规则的交互过程中,为了找到真正令其感兴趣的规则,用户将需要不断... 关联规则的开采是一个重要的数据开采问题.目前已经提出了许多算法用于高效地发现大规模数据库中的关联规则,而对关联规则维护问题的研究工作却很少.在用户开采关联规则的交互过程中,为了找到真正令其感兴趣的规则,用户将需要不断调整两个描述用户兴趣程度的阈值:最小支持度和最小可信度.本文提出了两种增量式更新算法——IUA(incrementalupdatingalgorithm)和PIUA(paralelincre-mentalupdatingalgorithm),用来解决这一关联规则高效维护问题. 展开更多
关键词 数据开采 知识发现 关联规则 增量式更新 数据库
下载PDF
部分数据缺失环境下的知识发现方法 被引量:18
16
作者 王清毅 蔡智 +1 位作者 邹翔 蔡庆生 《软件学报》 EI CSCD 北大核心 2001年第10期1516-1524,共9页
介绍了目前的不完全数据环境下的知识发现研究工作 ,分两个部分提出了一个不完全数据库中的知识发现方法 .首先具体讨论了如何猜测丢失的数据 ,给出了基于距离的关联规则的定义及挖掘方法 .然后在此基础上详细描述了一个不完全数据库中... 介绍了目前的不完全数据环境下的知识发现研究工作 ,分两个部分提出了一个不完全数据库中的知识发现方法 .首先具体讨论了如何猜测丢失的数据 ,给出了基于距离的关联规则的定义及挖掘方法 .然后在此基础上详细描述了一个不完全数据库中的知识发现算法 ,分析了算法的复杂度 ,并给出了相应的实验结果 .最后 。 展开更多
关键词 知识发现 聚类 关联规则 数据库 数据缺失
下载PDF
数据采掘与知识发现:回顾和展望 被引量:32
17
作者 郑之开 张广凡 邵惠鹤 《信息与控制》 CSCD 北大核心 1999年第5期357-365,共9页
如何从大规模数据库中发掘深层次的知识和信息,而不仅仅是那些从传统数据库查询方法所获得的平凡内容,这方面的研究正受到越来越多的关注.作为一门独立于应用的研究课题,它已成为众多研究领域的热点内容,已经有相当多的应用报道并... 如何从大规模数据库中发掘深层次的知识和信息,而不仅仅是那些从传统数据库查询方法所获得的平凡内容,这方面的研究正受到越来越多的关注.作为一门独立于应用的研究课题,它已成为众多研究领域的热点内容,已经有相当多的应用报道并取得了丰硕的成果.本文试就数据采掘和知识发现的各方面内容:如采掘过程、方法、算法和应用等,作一个完整的回顾,文章也讨论了这一领域未来的工作和挑战. 展开更多
关键词 数据采掘 知识发现 机器学习 关联规则 数据库
下载PDF
知识发现的若干问题及应用研究 被引量:34
18
作者 王清毅 陈恩红 蔡庆生 《计算机科学》 CSCD 北大核心 1997年第5期73-77,共5页
知识发现是一个众多学科诸如人工智能、机器学习、模式识别、统计学、数据库和知识库数据可视化等相互交叉、融合所形成的一个新兴的且具有广阔应用前景的领域。
关键词 知识发现 数据库 人工智能
下载PDF
关联规则挖掘技术研究的新进展 被引量:18
19
作者 刘君强 孙晓莹 潘云鹤 《计算机科学》 CSCD 北大核心 2004年第1期110-113,共4页
在数据库中发现频繁模式和关联规则是数据挖掘领域的最基本、最重要的问题。自从Agrawal的开创性工作以来,有关研究从未停止过。然而由于其内在的计算复杂性,这一问题并未完全解决。本文对关联规则的基本概念和类型、重要挖掘算法、特... 在数据库中发现频繁模式和关联规则是数据挖掘领域的最基本、最重要的问题。自从Agrawal的开创性工作以来,有关研究从未停止过。然而由于其内在的计算复杂性,这一问题并未完全解决。本文对关联规则的基本概念和类型、重要挖掘算法、特别是近年来相关研究的新进展做了全面综述与深入分析,并指出了未来的研究方向。 展开更多
关键词 数据库 关联规则 数据挖掘 可信度 频集
下载PDF
国际上关联规则发现研究述评 被引量:22
20
作者 欧阳为民 郑诚 蔡庆生 《计算机科学》 CSCD 北大核心 1999年第3期41-44,共4页
1.引言近年来,数据发掘(Data Mining),亦称数据库中的知识发现(Knowledge Discovery in Databases,简称KDD),受到当今国际人工智能与数据库界的广泛重视。关联规则是KDD研究中的一个重要研究课题。该问题是R.Agrawal等人提出的,目的是... 1.引言近年来,数据发掘(Data Mining),亦称数据库中的知识发现(Knowledge Discovery in Databases,简称KDD),受到当今国际人工智能与数据库界的广泛重视。关联规则是KDD研究中的一个重要研究课题。该问题是R.Agrawal等人提出的,目的是要在交易数据库中发现各项目之间的关系。例如,有这样一条关联规则:黄油,牛奶面包(30%,2%)。其含义是购买了黄油和牛奶的顾客还将购买面包,30%、2%分别是该规则的信任度和支持度。 展开更多
关键词 关联规则 知识发现 人工智能
下载PDF
上一页 1 2 7 下一页 到第
使用帮助 返回顶部