-
题名基于置换检验的聚类结果评估
被引量:1
- 1
-
-
作者
谷飞洋
田博
张思萌
陈征
何增有
-
机构
大连理工大学软件学院
-
出处
《智能系统学报》
CSCD
北大核心
2016年第3期301-309,共9页
-
基金
国家自然科学基金项目(61572094)
-
文摘
对聚类结果,传统的评估方法不能从统计意义上对结果评估。ECP是一种新颖的基于置换检验的评估算法。ECP直接对聚类结果进行置换检验从而计算出p-value。为了测试ECP的效果,利用了UCI中的iris,wine,yeast数据集对算法进行评测。实验结果表明,ECP可以在能够接受的时间内运算出比较准确的实验结果。
-
关键词
聚类
聚类评估
统计检验
置换检验
-
Keywords
clustering
clustering evaluation
statistical test
permutation test
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名去冗余Top-k对比序列模式挖掘
被引量:1
- 2
-
-
作者
江冰
谷飞洋
何增有
-
机构
大连理工大学软件学院
-
出处
《智能系统学报》
CSCD
北大核心
2018年第5期680-686,共7页
-
基金
国家自然科学基金项目(61572094)
大学生创新创业训练计划项目(2017101410901010382)
-
文摘
对比序列模式可以用来表征不同类别数据集之间的差异。在生物信息、物流管理、电子商务等领域,对比序列模式有着广泛的应用。Top-k对比序列模式挖掘的目标是发现数据集中对比度最高的前k个序列模式。在Top-k对比序列模式挖掘中,可能挖掘出冗余的序列模式。目前,虽然有Top-k对比序列模式发现算法被提出,但这些算法并未考虑冗余序列模式的问题。为此,本文提出了基于广度优先生成树的去冗余Top-k对比序列模式挖掘算法BFM(breadth-first miner)。使用BFM算法可以有效地解决冗余问题,得到去冗余的Top-k对比序列模式。在BFM算法的基础上,提出了性能更好的算法PBFM(pruning breadth-first miner)。通过在真实数据集上的实验分析与对比,验证了本文算法的有效性。
-
关键词
对比序列模式
广度优先
冗余序列模式
模式挖掘
TOP-K
-
Keywords
distinguishing sequential pattern
breadth-first
redundant sequential patterns
pattern mining
Top-k
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-