期刊文献+

基于概率模型的概率频繁项集挖掘方法

A Probability Model-Based Approach of Mining Probabilistic Frequent Itemsets
下载PDF
导出
摘要 在很多应用中,数据本身就包括不确定性,如基于位置的服务,传感器监控系统和数据融合等等。为了解决大量的不精确信息,提出了不确定数据库的概念。在不确定数据库中挖掘概率频繁项集是一个重要的研究内容,但是,由于不确定数据库是用可能世界来解释的,会产生指数级的可能世界,使得挖掘方法效率不高。本文采用泊松二项分布来对不确定数据库的可能世界进行建模,在挖掘过程中,不计算具体的频繁概率,通过计算与最小频繁概率对应的期望支持度,用频繁概率的近似值实现概率频繁项集的挖掘,提高了概率频繁项集挖掘算法的效率,仿真实验也证明该方法具有较好的效果。 Data uncertainty is inherent in emerging applications such as location -based services, sensor mo- nitoring systems, and data integration. To handle a large amount of imprecise information, uncertain databases have been recently developed. Mining probabilistic frequent itemsets is an important research problem in un- certain database management. Since an uncertain database contains an exponential number of possible worlds, the efficiency of mining algorithms is not effective. In this paper, the mining process is modeled as a Poisson binomial distribution. In the process of mining, the exact frequent probability is not calculated. By computing expected support through minsup, the approximation of frequent probability is used to mine probabilistic fre- quent itemsets. An extensive evaluation on synthetic databases is performed to validate this method.
作者 陈凤娟
出处 《安阳师范学院学报》 2017年第2期57-60,100,共5页 Journal of Anyang Normal University
关键词 近似算法 频繁概率 概率频繁项集 Approximate Algorithm Frequentness Probability Probabilistic Frequent Itemset
  • 相关文献

参考文献15

二级参考文献283

  • 1刘殷雷,刘玉葆,陈程.不确定性数据流上频繁项集挖掘的有效算法[J].计算机研究与发展,2011,48(S3):1-7. 被引量:14
  • 2颜跃进,李舟军,陈火旺.基于FP-Tree有效挖掘最大频繁项集[J].软件学报,2005,16(2):215-222. 被引量:68
  • 3倪巍伟,孙志挥,陆介平.k-LDCHD——高维空间k邻域局部密度聚类算法[J].计算机研究与发展,2005,42(5):784-791. 被引量:18
  • 4卓月明.基于聚类技术的XML文件代表性结构获取[J].吉首大学学报(自然科学版),2011,32(6):55-58. 被引量:4
  • 5李建中 于戈 周傲英.不确定性数据管理的要求与挑战[J].中国计算机学会通讯,2009,5(4):6-14.
  • 6张晓峰 王丽珍 陆叶.一种基于属性加权的不确定K-means聚类算法.计算机研究与发展,2009,:504-508.
  • 7Pei H J, Yin Y. Mining frequent patterns without candidate ge- neration[C3//International Conference of SIGMOD. 2000.
  • 8Chui C, Kao B, Hung E. Mining frequent itemsets from uncer- tain dataC]//International Conference of Pacific-Asia Know- ledge Discovery and Data Mining. 2007.
  • 9Chui C, Kao B. A decremental approach for mining frequent itemsets from uncertain dataC]//International Conference of Pacific-Asia Knowledge Discovery and Data Mining. 2008.
  • 10Leung C, Matco M A F, Brajczuk D A. A tree-based approach for frequent pattern mining from uncertain data[C]//Interna- tional Conference of PacificAsia Knowledge Discovery and Data Mining. 2008.

共引文献86

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部