基于已发现序列模式的序列聚类研究

Clustering sequences using sequential patterns

下载PDF

导出

摘要文章研究了利用序列模式的挖掘结果对序列数据库进行再发现的问题,提出一种利用已发现序列模式对数据库中的数据序列进行聚类的方法SPSC。该方法利用发现的序列模式定义了数据序列之间相似度函数和数据序列分组的平均值,使得经典聚类方法k-means可以应用于序列型数据,实现了对包含相似模式的数据序列进行聚类;理论分析和实验表明,与已有的序列聚类方法相比,该文所提出的方法不仅可以得到更加优化的聚类,而且效率更高。 The paper deals with the problem of farther discovering in the sequence database on the basis of the results of sequential pattern mining, and a sequence clustering method using sequential patterns achieved is proposed. The definition of the similarity of data sequences and the mean of the data sequence cluster are given, so that the k-means method can be applied to the sequence data and a set of high quality data sequence clusters with similar sequential patterns can be discovered. Theoretic analysis and experiments prove that the method not only generates optimal clusters but also exhibits good efficiency.

作者胡学钢张圆圆

机构地区合肥工业大学计算机与信息学院

出处《合肥工业大学学报（自然科学版）》 CAS CSCD 北大核心 2008年第1期9-12,共4页 Journal of Hefei University of Technology：Natural Science

基金安徽省自然科学基金资助项目(050420207) 合肥工业大学科研发展基金资助项目(050504F)

关键词数据挖掘序列模式聚类 data mining sequential pattern cluster

分类号 TP182 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献8

1Agrawal A,Srikant R.Mining sequential patterns[C]//Proc of the 11st Int Conf on Data Engineering.Taipei,1995:3-14.
2Aggarwal C C,Wolf J L,Yu P S.A new method for similarity indexing of market basket data[C]//Proc of 1999ACM SIGMOD Int Conf on Management of Data.1999:407-418.
3Wang K,Xu C,Liu B.Clustering transactions using large items[C]//ACM CIKM International Conference on Information and Knowledge Management.1999:483-490.
4赵奕,施鹏飞.最大频繁集的数据聚类方法[J].计算机工程与应用,2000,36(11):35-37. 被引量：4
5陈宁,陈安,周龙骧,CHEN Ning.大规模交易数据库的一种有效聚类算法(英文)[J].软件学报,2001,12(4):475-484. 被引量：17
6Han E,Karypis G,Kumar V,et al.Hypergraph based clustering in high-dimensional data sets:a summary of results[J].Bulletin of the IEEE Computer Society Technical Committee on Data Engineering,1998,21(1):15-22.
7Ramkumar G D,Swami A.Clustering data without distance functions[J].Bulletin of the IEEE Computer Society Technical Committee on Data Engineering,1998,21(1):9-14.
8Morzy T,Wojciechowski M,Zakrzewicz M.Scalable hierar-chical clustering method for sequences of categorical values[C]//Proc of the 5th Pacific-Asia Conference on Knowledge Discovery and Data Mining (PAKDD),Lecture Notes in Computer Science 2035.Springer-Verlag,2001:282-293.

二级参考文献6

1Lang S D，Proc SPIE Data Mining Knowledge Discovery:Theory Toolsand Technology …，1999年，31页
2Aggarwal C C，Proc the ACMSIGMOD Int Conference on Management of Data，1999年，407页
3Han E，Bulletin IEEE Computer Society Technical Committee Data Engineering，1998年，21卷，1期，15页
4Zhang T，Proc the ACMSIGMOD Int Conference on Management of Data，1996年，103页
5Cheung D W，Distributed and Parallel Databases
6赵奕,施鹏飞,熊范纶.概念格递增修正关联规则挖掘方法[J].上海交通大学学报,2000,34(5):684-687. 被引量：3

共引文献19

1张菊英,查干花,李力,蒋永光.脾胃方配伍规律统计方法探讨[J].四川中医,2004,22(6):93-94. 被引量：1
2Ai-BoSong,Mao-XianZhao,Zuo-PengLiang,Yi-ShengDong,Jun-ZhouLuo.Discovering User Profiles for Web Personalized Recommendation[J].Journal of Computer Science & Technology,2004,19(3):320-328. 被引量：2
3李玉鑑.分层子树合并聚类算法[J].北京工业大学学报,2006,32(5):442-446. 被引量：4
4李玉鑑.基于最小树切割的自适应聚类方法[J].北京工业大学学报,2007,33(3):331-336. 被引量：2
5宋殿霞,王艳,邹光辉.空间数据挖掘聚类算法研究[J].滨州学院学报,2006,22(6):43-48.
6沈洁,赵雷,杨季文,李榕.一种基于划分的层次聚类算法[J].计算机工程与应用,2007,43(31):175-177. 被引量：13
7周迎春,骆嘉伟.基于分层的平衡迭代规约聚类分析算法研究[J].科学技术与工程,2008,8(10):2579-2583. 被引量：1
8许涛,徐彬.概念格在客户群聚类中的应用[J].现代计算机,2008,14(6):70-73. 被引量：1
9秦昆,李振宇,杜鹢.基于概念分析的空间数据挖掘研究进展[J].地球信息科学,2009,11(1):10-17. 被引量：8
10王晓燕.浅析数据挖掘技术[J].办公自动化（综合月刊）,2009(5):38-39. 被引量：1

1康美林,刘军万.基于双聚类模型的协同过滤推荐引擎设计[J].电脑编程技巧与维护,2013(2):10-11.
2王太雷.个性化推荐系统中相似模式聚类研究[J].计算机工程,2005,31(10):156-158. 被引量：3
3付小青,张爱明.基于SOM的入侵检测算法的特征选择[J].华中科技大学学报（自然科学版）,2007,35(7):5-7. 被引量：3
4李正欣,张凤鸣,张晓丰,陈继成,李超.多元时间序列相似性搜索研究综述[J].控制与决策,2017,32(4):577-583. 被引量：12
5梁锦.模拟旋转深入探究[J].数理化解题研究（初中版）,2011(12):25-27.
6Douglas Toombs,臧铁军(译者).超级管理员——DNS解析——深入学习DNS，提高解决问题的能力[J].Windows IT Pro Magazine（国际中文版）,2006(3):12-20.
7DouglasToombs 臧铁军(译).DNS解析深入学习DNS，提高解决问题的能力[J].Windows IT Pro Magazine（国际中文版）,2007(C00):21-27.
8一项计算机基础课程改革的启示(二)[J].计算机教育,2008(3):54-56. 被引量：2
9一项计算机基础课程改革的启示[J].计算机教育,2008(1):34-37. 被引量：3
10赵家石,杨静,张健沛.一种隐私保护的在线相似轨迹挖掘方法[J].哈尔滨工业大学学报,2013,45(11):101-105. 被引量：1

合肥工业大学学报（自然科学版）

2008年第1期

浏览历史

内容加载中请稍等...

基于已发现序列模式的序列聚类研究

参考文献8

二级参考文献6

共引文献19

相关作者

相关机构

相关主题

浏览历史