基于商品分类信息的关联规则聚类被引量：17

Association Rule Clustering Based on Taxonomy Information

下载PDF

导出

摘要关联规则挖掘经常产生大量的规则 ,为了帮助用户做探索式分析 ,需要对规则进行有效的组织聚类是一种有效的组织方法已有的规则聚类方法在计算规则间距离时都需要扫描原始数据集 ,效率很低 ,而且聚类结果是固定数目的簇 ,不利于探索式分析针对这些问题 ,提出了一种新的方法它基于商品分类信息度量规则间的距离 ,避免了耗时的原始数据集扫描 ;然后用OPTICS聚类算法产生便于探索式分析的聚类结构最后用某个零售业公司的实际交易数据做了实验 ,并通过可视化工具演示了聚类效果 Association rule mining often produces a large number of rules. To facilitate exploratory analysis, structuring of rules is needed. A useful method for structuring rules is clustering. All of the existing methods for clustering rules suffer from the costly scan of the original dataset for determining the distances between rules. Moreover, the result of these methods is a fixed number of clusters that makes exploratory analysis difficult. A new method is proposed to overcome these problems. Taxonomy information is used to measure the distances between rules and the expensive scan of the original dataset is avoided. A Clustering algorithm, OPTICS, is applied to generate the clustering structure suitable for exploratory analysis. Finally, an experiment is conducted on a real-life dataset and the experimental result is presented via a visualization tool, which shows that the method is practical and effective.

作者阮备军朱扬勇

机构地区复旦大学计算机与信息技术系

出处《计算机研究与发展》 EI CSCD 北大核心 2004年第2期352-360,共9页 Journal of Computer Research and Development

基金国家"八六三"高技术研究发展计划基金项目 ( 2 0 0 1AA113 181)

关键词数据挖掘关联规则聚类可视化 data mining association rule clustering visualization

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献14

1E G Hetzler, W M Harris, S Harvre et al. Visualizing the full spectrum of document relationships. In: Proc of the 5th Int'l Society for Knowledge Organization Conference. Würzburg: Ergon, 1998. 168～175
2P C Wong, P Whitney, J Thomas. Visualizing association rules for text mining. In: Proc of IEEE Symposium on Information Visualization(INFOVIS'99). San Francisco: IEEE Computer Society, 1999. 120～123
3M Hao, M Hsu, U Dayal et al. Market basket analysis visualization on a spherical surface. HP Labs, Technical Report: HPL-2001-3, 2001
4H Toivonen, M Klemettinen, P Ronkainen et al. Pruning and grouping discovered association rules. The ECML-95 Workshop on Statistics, Machine Learning, and Knowledge Discovery in Databases, Heraklion, 1995
5G K Gupta, A Strehl, J Ghosh. Distance based clustering of association rules. In: Proc of ANNIE, St. Louis, Missouri: ASME Press, 1999. 759～764
6M Ankerst, M Breunig, H P Kriegel et al. OPTICS: Ordering points to identify the clustering structure. In: Proc of 1999 ACM-SIGMOD Int'l Conf Management of Data (SIGMOD'99). Philadephia: ACM Press, 1999. 49～60
7J Han, Y Fu. Discovery of multiple level association rules from large databases. In: Proc of the 21st Int'l Conf on Very Large Databases(VLDB'95). Zurich: Morgan Kaufmann, 1995. 420～431
8R Srikant, R Agrawal. Mining generalized association rules.In:Proc of the 21st Int'l Conf on Very Large Databases(VLDB'95). Zurich: Morgan Kaufmann, 1995. 407～419
9A Savasere, E Omiecinski, S Navathe. Mining for strong negative associations in a large database of customer transactions. In: Proc of the 14th Int'l Conf on Data Engineering. Orlando: IEEE Computer Society, 494～502
10B Lent, A N Swami, J Widom. Clustering association rules. In: Proc of the 13th Int'l Conf on Data Engineering. Birmingham: IEEE Computer Society, 1997. 220～231

同被引文献129

1蔺一帅,李青山,陆鹏浩,孙雨楠,王亮,王颖芝.智能仓储货位规划与AGV路径规划协同优化算法[J].软件学报,2020,31(9):2770-2784. 被引量：27
2刘云峰 ,齐欢 ,HU Xiang'en ,CAI Zhiqiang ,代建民 .基于潜在语义空间维度特性的多层文档聚类[J].清华大学学报（自然科学版）,2005(S1):1783-1786. 被引量：11
3李善平,尹奇韡,胡玉杰,郭鸣,付相君.本体论研究综述[J].计算机研究与发展,2004,41(7):1041-1052. 被引量：275
4孙宏林,俞士汶.浅层句法分析方法概述[J].当代语言学,2000,2(2):74-83. 被引量：38
5卢娇丽,郑家恒.基于粗糙集的文本分类方法研究[J].中文信息学报,2005,19(2):66-70. 被引量：16
6谌志群,张国煊.文本挖掘研究进展[J].模式识别与人工智能,2005,18(1):65-74. 被引量：49
7袁毓林.用动词的论元结构跟事件模板相匹配——一种由动词驱动的信息抽取方法[J].中文信息学报,2005,19(5):37-43. 被引量：22
8韦素云,吉根林,曲维光.关联规则的冗余删除与聚类[J].小型微型计算机系统,2006,27(1):110-113. 被引量：15
9彭仪普,熊拥军.关联规则挖掘AprioriTid算法优化研究[J].计算机工程,2006,32(5):55-57. 被引量：24
10于娟,王贱珍,马金平,李永.基于课程体系的OWL知识表示方法研究[J].现代图书情报技术,2006(3):51-54. 被引量：2

引证文献17

1彭小娟,郑冬花.寿险事务数据库挖掘关联规则的分析和设计[J].科技资讯,2008,6(16):232-233.
2蔡红,陈荣耀,陈波.关联规则挖掘最小支持度阀值设定的优化算法研究[J].微型电脑应用,2011(6):33-36. 被引量：9
3韦素云,吉根林,曲维光.关联规则的冗余删除与聚类[J].小型微型计算机系统,2006,27(1):110-113. 被引量：15
4梁敏,阮备军,朱扬勇.基于分类信息的关联规则间距离函数的改进[J].计算机应用与软件,2006,23(3):7-9. 被引量：1
5鲁增秋,陈玉哲,王殿升.一种改进的基于商品分类信息的多层关联规则挖掘算法[J].科技情报开发与经济,2006,16(14):137-139. 被引量：3
6赵永尊,张谧,赵卫东,李银胜.基于品类聚类的关联规则优化算法[J].计算机应用与软件,2007,24(1):140-142. 被引量：1
7谌志群,张国煊.文本挖掘与中文文本挖掘模型研究[J].情报科学,2007,25(7):1046-1051. 被引量：51
8何丽,严冬梅.电子学习系统中的知识表示与知识发现模型研究[J].计算机工程与应用,2007,43(34):233-235. 被引量：1
9田宏,王亚伟,王毅.改进的基于距离的关联规则聚类[J].计算机工程与设计,2009,30(5):1204-1206. 被引量：3
10宋威,高磊,李晋宏.一种基于闭项集的无冗余关联规则挖掘方法[J].北京交通大学学报,2009,33(6):91-96. 被引量：2

二级引证文献97

1沈昕怡,柯艺璐,徐成龙.基于文本挖掘的我国全民健身政策量化评价[J].体育视野,2023(24):6-8.
2杨越越,董祥军,翟延富.冗余关联规则删减技术研究综述[J].山东轻工业学院学报（自然科学版）,2007,21(4):31-33.
3刘路,李弼程,张先飞.基于向量相似度修正策略的命名实体关联分析[J].计算机工程与应用,2008,44(2):179-181.
4肖建国.试论文本挖掘及其应用[J].图书馆学研究,2008(4):22-24. 被引量：10
5化柏林.数据挖掘与知识发现关系探析[J].情报理论与实践,2008,31(4):507-510. 被引量：31
6黄振国,沈夏炯.无冗余关联规则在财政收支分析中的应用[J].现代计算机,2008,14(11):73-76.
7蒋欣,李伟华,史豪斌,潘炜.基于距离的关联规则相关性分析优化方法[J].计算机工程与应用,2009,45(7):138-140. 被引量：3
8田宏,王亚伟,王毅.改进的基于距离的关联规则聚类[J].计算机工程与设计,2009,30(5):1204-1206. 被引量：3
9黄凤爱,蒋永平,文艳华.基于本体的专业资源库语义模型研究[J].现代情报,2009,29(5):52-55. 被引量：2
10唐晓波,樊静.基于客户聚类的商品推荐[J].情报杂志,2009,28(6):143-146. 被引量：15

1梁敏,阮备军,朱扬勇.基于分类信息的关联规则间距离函数的改进[J].计算机应用与软件,2006,23(3):7-9. 被引量：1
2纪祥敏,戴英侠,连一峰,刘青普.一种基于二叉树结构的入侵检测研究[J].计算机应用研究,2005,22(8):94-96. 被引量：1
3房华蓉.数据挖掘在零售业中应用研究[J].福建电脑,2013,29(1):86-89.
4田宏,王亚伟,王毅.改进的基于距离的关联规则聚类[J].计算机工程与设计,2009,30(5):1204-1206. 被引量：3
5汪云飞,毕笃彦,刘华伟,刘凌,赵晓林.一种局部受限的规则聚类超像素算法[J].西安电子科技大学学报,2016,43(3):95-100. 被引量：3
6邱洋.基于网格和密度的保险业务投资风险规则聚类[J].电子测试,2013,24(3):160-162. 被引量：1
7王天召,徐克虎,黄大山.基于联合概率数据关联和粒子滤波的多目标跟踪算法[J].计算机与数字工程,2013,41(1):30-32.
8刘振名,赵可新,刘振亮.多维数量关联规则聚类挖掘研究[J].煤炭技术,2011,30(6):184-185.
9文静,顾勋梅.一种度量软件需求的功能点方法[J].微电子学与计算机,2011,28(10):75-78. 被引量：3
10邓小龙,谢剑英,杨煜普.基于交互式多模型的粒子滤波算法[J].系统仿真学报,2005,17(10):2360-2362. 被引量：19

计算机研究与发展

2004年第2期

浏览历史

内容加载中请稍等...

基于商品分类信息的关联规则聚类被引量：17

参考文献14

同被引文献129

引证文献17

二级引证文献97

相关作者

相关机构

相关主题

浏览历史

基于商品分类信息的关联规则聚类 被引量：17

参考文献14

同被引文献129

引证文献17

二级引证文献97

相关作者

相关机构

相关主题

浏览历史

基于商品分类信息的关联规则聚类被引量：17