-
题名基于项目属性的相联规则提取
被引量:3
- 1
-
-
作者
李雄飞
苑森淼
王爱军
郇丹丹
-
机构
吉林大学计算机科学与技术学院
-
出处
《计算机学报》
EI
CSCD
北大核心
2002年第12期1421-1427,共7页
-
基金
国家自然科学基金 ( 6 98730 19)
吉林省自然科学基金 ( 19990 5 2 8)资助
-
文摘
相联规则是数据库知识发现领域的重要方法之一 ,用于发现满足用户指定最小支持度和最小信任度阈值的规则 .其中 ,最小支持度阈值确定了研究数据集的规模 ,最小信任度阈值用来衡量一个规则可靠性 .在通常的支持度 /信任度框架下 ,用户只能给出一对最小支持度和最小信任度阈值 ,因此 ,对于所有数据项均采用统一标准处理 .但是 ,实际数据库中的数据项目具有各自的特点 ,该文旨在根据项目的属性特征 ,通过模糊综合评判 ,决定项目合理的最小支持度阈值 ,进而确定各个项目的支持度区间 ,达到在一次数据挖掘中同时发现频繁规则和稀有规则的目的 .由于基于最小信任度的规则提取具有冗余性 ,文中提出规则前件和后件的重要程度对比的思想 ,借助主观判断去除冗余规则 ,从而挖掘出尽可能接近自然的完全规则 .
-
关键词
项目属性
相联规则提取
重要度
频度
对比度
支持度区间
超市
数据库
-
Keywords
association rules, importance, frequency, contrast, support scopes
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名一种改进的相联规则提取算法
被引量:8
- 2
-
-
作者
王曙光
施小英
-
机构
上海交通大学计算机系
-
出处
《计算机工程与应用》
CSCD
北大核心
2002年第15期173-174,208,共3页
-
文摘
相联规则的提取是数据挖掘的一个重要方面。Apriori算法是提取相联规则的经典算法,效率较高。AprioriPro算法是对Apriori算法的改进,它利用大项集生成过程中的中间结果对数据库进行过滤,从而加快候选项集的计数速度,提高了整个算法的效率。该文在AprioriPro算法的基础上,首先对其基本理论进行扩展并加以证明,提出了AprioriPro2算法。该算法相对于AprioriPro算法能更多地去掉数据库中的无效元组,从而进一步提高了算法的效率。
-
关键词
相联规则提取算法
数据挖掘
知识发现
数据库
APRIORI算法
计算机
-
Keywords
data mining,association rule,knowledge discovery in database
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-