-
题名关联规则兴趣度度量方法的比较研究
被引量:14
- 1
-
-
作者
谭学清
罗琳
周洞汝
-
机构
武汉大学信息管理学院
武汉大学计算机学院
-
出处
《情报学报》
CSSCI
北大核心
2007年第2期266-270,共5页
-
文摘
关联规则挖掘是数据挖掘中重要的研究课题,已有许多有效的实现算法。然而,这些算法找到的关联规则数目太多,用户无法对其进行分析。为了克服这个问题,出现了一些关联规则衡量标准来分析规则的有趣性,在本文里我们在给出的实例上比较分析了一些关联规则客观兴趣度度量指标,提出了使用关联规则客观兴趣度度量指标的一些建议。
-
关键词
数据挖掘
关联规则
兴趣度度量
-
Keywords
data mining, association rules, interesting measure
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名一个新的关联规则兴趣度度量方法
被引量:10
- 2
-
-
作者
李永立
吴冲
王崑声
-
机构
中国航天工程咨询中心
哈尔滨工业大学管理学院
-
出处
《情报学报》
CSSCI
北大核心
2011年第5期503-507,共5页
-
基金
国家自然科学基金项目(60979016)
-
文摘
联规则挖掘是数据挖掘和知识发现领域的重要课题,但就判定关联规则是否成立的依据,即兴趣度的度量方法问题,学术界没有一致的标准。既有的兴趣度度量方法包括支持度-置信度方法,提升度方法,卡方分析方法等。这些传统的兴趣度度量方法存在各自的局限,表现为缺乏客观标准,缺少统计依据,只能度量正向关系等方面。为了克服这些问题,本文提出了一种基于统计推断的新的兴趣度度量方法,并对该方法与传统的方法进行了比较,证明了该度量公式的渐进分布形式,指出了新方法的优点,实证了新方法的特征属性。该方法用于关联规则挖掘,在判断规则成立的标准上是客观的,可以判定正负关联两种类型,在实际应用上是方便的,具有可操作性,较之原有方法有一定的优势。
-
关键词
数据挖掘
关联规则
兴趣度度量
统计推断
-
Keywords
data mining
association rules
interesting measure
statistical inference
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于兴趣度度量的正负关联规则挖掘方法研究
被引量:3
- 3
-
-
作者
马彦勤
武彤
邓烜堃
-
机构
贵州大学计算机科学与技术学院
-
出处
《计算机技术与发展》
2018年第5期38-41,46,共5页
-
基金
贵州省科技计划项目(黔科合GY字[2010]3061)
-
文摘
传统的Apriori算法通过支持度阈值和置信度阈值的筛选来挖掘强关联规则,所挖掘出来的强关联规则并不都是有趣的,也忽略了负关联规则的挖掘,失去了负关联规则在决策分析中的重要作用。为了过滤强关联规则中的无趣规则,挖掘有趣的正负关联规则,引入了兴趣度的概念,对现有的几种兴趣度度量进行了研究,利用兴趣度度量的相关性质,提出了一种新的兴趣度度量。根据支持度、置信度、兴趣度的相关性质提出了相关定理并进行证明,用以挖掘有趣的正负关联规则。在新的兴趣度度量的基础上进行了算法设计,并采用真实数据集进行算法验证。结果显示,以提出的兴趣度度量为基础进行正负关联规则的挖掘是可行的,其结果比经典的Apriori算法挖掘方法更实用更有效。
-
关键词
支持度
置信度
兴趣度度量
正负关联规则
数据挖掘
-
Keywords
support
confidence
interestingness measurement
positive and negative association rules
data mining
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-
-
题名基于信息熵的兴趣度规则挖掘算法
被引量:5
- 4
-
-
作者
金洲
王儒敬
-
机构
中国科学院合肥智能机械研究所仿生计算与智能决策实验室
中国科学技术大学自动化系
-
出处
《模式识别与人工智能》
EI
CSCD
北大核心
2014年第6期524-532,共9页
-
基金
国家自然科学基金项目(No.31171456)资助
-
文摘
传统关联规则挖掘方法通常产生海量杂乱的规则,它们对用户而言是冗余的.为解决该问题,文中提出一种基于信息熵的兴趣度规则挖掘算法.通过变量相关性分析剔除原始规则集中虚假、错误的规则,并在信息熵的基础上提出度量关联规则兴趣度的框架.该算法不依赖用户先验知识,能无偏地表达数据包含的信息.在真实和仿真数据集上的实验验证该算法能有效挖掘兴趣度规则,且性能比传统算法更优.
-
关键词
知识发现
关联规则
兴趣度度量
信息熵
-
Keywords
Knowledge Discovery, Association Rule, Interestingness Measure, Information Entropy
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于影响度的统计显著序列模式挖掘算法
被引量:1
- 5
-
-
作者
吴军
欧阳艾嘉
张琳
-
机构
遵义师范学院信息工程学院
-
出处
《计算机应用》
CSCD
北大核心
2022年第9期2713-2721,共9页
-
基金
国家自然科学基金资助项目(62066049)
遵义市联合资金项目(遵市科合HZ字(2022)123)。
-
文摘
针对传统序列模式挖掘算法中支持度不能如实体现序列模式兴趣度以及未对报告的序列模式进行质量评估的问题,提出一个基于影响度的统计显著序列模式挖掘算法ISSPM。首先,递归地挖掘出所有满足兴趣度约束的序列模式;然后,使用项集置换方法构建这些序列模式的置换检验零分布;最后,通过该零分布计算出被评估的序列模式的统计度量值,并从上述序列模式中找到所有统计显著序列模式。真实序列记录集合上的实验结果表明,ISSPM算法相较于PSPM、SPDL和PSDSP算法挖掘到的序列模式数量更少但兴趣度更强;仿真序列记录集合上的实验结果表明,ISSPM算法报告的结果中假阳性序列模式数量平均占比为3.39%,且该算法的嵌入模式的发现率均不低于66.7%,明显优于上述3个对比算法。可见,ISSPM算法报告的统计显著序列模式能够体现序列记录集合中更有价值的信息,同时根据这些信息做出的进一步分析和决策也更加可靠。
-
关键词
数据挖掘
序列模式挖掘
兴趣度度量
统计显著模式
置换检验
-
Keywords
data mining
sequential pattern mining
interestingness measure
statistically significant pattern
permutation test
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-
-
题名多数据库中例外模式挖掘方法研究
被引量:1
- 6
-
-
作者
王日凤
唐培和
刘浩
张师超
-
机构
广西工学院计算机工程系
悉尼科技大学信息技术学院
-
出处
《计算机应用研究》
CSCD
北大核心
2008年第2期382-385,共4页
-
基金
澳大利亚ARC资助项目(DP0559536,DP0667060)
国家自然科学基金重大资助项目(60496327)
国家自然科学基金资助项目(60463003)
-
文摘
首先比较了现有的两种挖掘方法,提出了一种改进技术。综合考虑例外的局部和全局兴趣度,剔除非真正有趣的局部例外;增加两种客观度量并按模式重要度排序。实验表明该方法不仅可以有效挖掘多数据库中例外模式,而且还大大减少了用户负担。
-
关键词
多数据库挖掘
例外模式
低选票例外
兴趣度度量
-
Keywords
multi-databases mining
exception pattern
lower voting exception
interestingness measure
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-