-
题名基于数据挖掘的符号序列聚类相似度量模型
被引量:3
- 1
-
-
作者
郑宏珍
初佃辉
战德臣
徐晓飞
-
机构
哈尔滨工业大学智能计算中心
-
出处
《计算机工程》
CAS
CSCD
北大核心
2009年第1期178-179,194,共3页
-
基金
国家"863"计划基金资助项目"CIMS模型驱动的智能化软构件与软件生成技术"(2006AA01Z167)
-
文摘
为了从消费者偏好序列中发现市场细分结构,采用数据挖掘领域中的符号序列聚类方法,提出一种符号序列聚类的研究方法和框架,给出RSM相似性度量模型。调整RSM模型参数,使得RSM可以变为与编辑距离、海明距离等价的相似性度量。通过RSM与其他序列相似性度量的比较,表明RSM具有更强的表达相似性概念的能力。由于RSM能够表达不同的相似性概念,从而使之能适用于不同的应用环境,并在其基础上提出自组织特征映射退火符号聚类模型,使得从消费者偏好进行市场细分结构研究的研究途径在实际应用中得以实现。
-
关键词
符号序列聚类
数据挖掘
相似性模型
-
Keywords
symbolic sequence clustering
data mining
similarity model
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于隐马尔可夫模型的符号序列自组织聚类
被引量:3
- 2
-
-
作者
吕昱
程代杰
-
机构
重庆大学计算机学院
-
出处
《计算机科学》
CSCD
北大核心
2006年第8期210-212,共3页
-
文摘
本文提出一种基于模型的、适合变长符号序列的自组织聚类算法。隐马尔可夫模型被用于表达各个聚类,批处理自组织特征被用于符号序列的聚类过程。实验结果表明该算法能有效发现变长符号序列中的聚类模式。
-
关键词
批处理自组织特征映射
隐马尔可夫模型
符号序列聚类
-
Keywords
Batch map, SOM, Hidden markov model, Symbolic sequence clustering
-
分类号
TP31
[自动化与计算机技术—计算机软件与理论]
-
-
题名适用于区间数据的基于相互距离的相似性传播聚类
被引量:8
- 3
-
-
作者
谢信喜
王士同
-
机构
江南大学信息工程学院
-
出处
《计算机应用》
CSCD
北大核心
2008年第6期1441-1443,1493,共4页
-
基金
国家863计划项目(2007AA1Z1582006AA10Z313)
国家自然科学基金资助项目(60773206/F02010660704047/F030304)
+2 种基金
2004年教育部跨世纪优秀人才支持计划基金项目(NCET-04-0496)
2005年教育部科学研究重点基金项目(105087)
中国科学院自动化所模式识别国家重点实验室开放课题
-
文摘
符号聚类是对传统聚类的重要扩展,而区间数据是一类常见的符号数据。传统聚类中使用的对称性度量不一定适用于度量区间数据,且算法初始化也一直是干扰聚类的严重问题。因此,提出了一种适用于区间数据的度量——相互距离,并在此度量的基础上采用了一种全新的聚类方法——相似性传播聚类,解决了初始化干扰问题,从而得出了适用于区间数据的基于相互距离的相似性传播聚类。通过理论阐述和实验比较,说明了该算法比基于欧氏聚类的K-均值算法要好。
-
关键词
符号聚类
区间数据
相互距离
相似性传播
K-均值
-
Keywords
clustering of symbol
interval data
mutual distance
affinity propagation
K-means
-
分类号
TP301
[自动化与计算机技术—计算机系统结构]
-
-
题名基于数据挖掘的供应链产品优化配置
被引量:2
- 4
-
-
作者
初佃辉
郑宏珍
-
机构
哈尔滨工业大学(威海)企业智能与服务计算中心
-
出处
《计算机工程》
CAS
CSCD
北大核心
2010年第4期276-278,共3页
-
基金
国家"863"计划基金资助项目(2008AA04Z101)
山东省科技攻关基金资助重大项目(2008GG10004010)
山东省自然科学基金资助重点项目(2007ZRA1000)
-
文摘
针对供应链的特点,以客户偏好序列数据为切入点,提出客户偏好取向与客户特征属性间的关联关系模型,借鉴数据挖掘的符号序列聚类方法,研究符号类型序列数据对应的性质,从形式化和实例化2个方向讨论符号序列相似性问题,对偏好符号序列聚类问题的本质进行分析,研究如何应用自组织特征映射作为符号序列的聚类算法,并对聚类模型进行比较,使得从消费者偏好进行市场细分结构研究的研究途径在实际应用中得以实现。
-
关键词
供应链
数据挖掘
优化配置
符号序列聚类
-
Keywords
supply chain
data mining
optimal configurations
symbolic sequence clustering
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-