摘要
一、引言随着数据库技术和机器学习技术的发展,在数据库中发现新颖的、具有潜在效用的知识,简称KDD(Knowledge Discovery in Database)是近年来的一个新兴研究领域。KDD中的关联规则是描述数据库中数据项(属性,变量)之间所存在的(潜在)关系的规则。我们作如下形式化定义: 令I={i1,i2……,im}为项目集(itemset),D为事务数据库,其中每个事务T是一个项目子集(TI),并具有一个唯一的标识符ID。关联规则是形如XY的逻辑蕴含式,其中XT,YT,且X∩Y=φ。有两个因子与这条规则相关;如果事务数据库中有s%的事务包含X∪Y,那么我们说关联规则XY的支持度(support)为s;如果事务数据库里包含X的事务中有c%的事务同时也包含Y,那么我们说关联规则XY的置信度(confidence)为c。
In this paper, we introduce the technique of mining quantitative association rules in KDD. We apply it on an agriculture database to find some unknown useful knowledge.
出处
《计算机科学》
CSCD
北大核心
1999年第8期71-73,共3页
Computer Science
基金
国家自然科学基金
关键词
数据库
关联规则
机器学习
知识发现
Association rule
Quantitative association rule
Frequent itemset