-
题名一种时序组合模式挖掘算法
- 1
-
-
作者
董家麒
汤春蕾
鲁轶奇
-
机构
复旦大学计算机科学技术学院
-
出处
《微型电脑应用》
2013年第7期15-20,共6页
-
文摘
序列模式挖掘是发现特征的重要方法之一。目前运用于时间序列模式的方法有两类,一种是基于相对时间的离散化模式查询,另一种是基于连续时间的原始时间模式查找。结合目前两种主流算法,提出了频繁同类异构模式算法和频繁异类组合模式算法,并使用图挖掘算法和聚类算法执行快速收敛。实验结果表明,提出的算法运行效率高,同时能够找到扩展性更强,适用性更广的频繁时间序列模式。
-
关键词
序列模式
时间序列
数据挖掘
-
Keywords
Sequential Pattern
Time Series
Data Mining
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于LSH的时间子序列查询算法
被引量:6
- 2
-
-
作者
汤春蕾
董家麒
-
机构
复旦大学计算机科学技术学院
-
出处
《计算机学报》
EI
CSCD
北大核心
2012年第11期2228-2236,共9页
-
基金
上海市重点学科建设基金(B114)资助~~
-
文摘
子序列的相似性查询是时间序列数据集中的一种重要操作,包括范围查询和k近邻查询.现有的大多算法是基于欧几里德距离或者DTW距离的,缺点在于查询效率低下.文中提出了一种新的基于LSH的距离度量方法,可以在保证查询结果质量的前提下,极大提高相似性查询的效率;在此基础上,给出一种DS-Index索引结构,利用距离下界进行剪枝,进而还提出了两种优化的OLSH-Range和OLSH-kNN算法.实验是在真实的股票序列集上进行的,数据结果表明算法能快速精确地找出相似性查询结果.
-
关键词
相似性查询
时间序列数据库
子序列
LSH
索引
-
Keywords
similarity query
time-series databases
subsequence
Locality Sensitive Hash (LSH)
index
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名一种基于增长模式的交易序列聚类算法
被引量:1
- 3
-
-
作者
汤春蕾
董家麒
朱博雅
戴东波
-
机构
复旦大学计算机科学技术学院
上海大学计算机工程与科学学院
-
出处
《模式识别与人工智能》
EI
CSCD
北大核心
2013年第5期467-473,共7页
-
基金
上海市重点学科建设基金资助项目(No.B114)
-
文摘
对交易序列进行各种挖掘分析能为商家制定营销策略提供量化依据.文中从销售量及变化趋势角度研究交易序列数据集的内在结构,定义了一种反映价格变化趋势的增长模式及其错位组合距离和角度向量距离两种相似性度量,在此基础上设计一个考虑时限约束的目标函数进行聚类研究.实验数据采用真实的商品交易序列集,结果表明,在时限约束的条件下,增长模式这种特征提取方式及其模式间的两种距离函数能较好地产生聚类结果,且这些聚类结果能得到较好地解释.
-
关键词
聚类
交易序列
时限约束
增长模式
-
Keywords
Clustering, Transaction Sequence, Time Constraint, Growth Pattern
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名一种序列模式的相似性查询算法
- 4
-
-
作者
汤春蕾
董家麒
戴东波
朱扬勇
-
机构
复旦大学计算机科学技术学院
上海大学计算机工程与科学学院
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2011年第S3期132-139,共8页
-
基金
国家自然科学基金项目(60903075)
上海市重点学科建设基金项目(B114)
-
文摘
数值型序列在很多应用中存在,如超市的POS销售记录和证券交易所的股票买卖数据等.在此类数据中查询与给定序列模式相似的子模式具有重要的现实意义.提出一种趋势融合的序列相似性查询算法NSS_QA,首先对所有序列进行单调区间的"融合"处理,然后根据各区间的长度比例和幅度比例产生序列模式的候选集,最后定义了一种新的相似性度量来计算并返回查询结果.该查询算法能找到与给定序列模式"放大"或"缩小"的模式结果.实验结果表明,提出的算法能找到在总体形状上与给定序列模式相似的所有模式,且在时间上具有较好的伸缩性能.
-
关键词
序列模式
相似性查询
相似性度量
-
Keywords
sequential pattern
similarity query
similarity measure
-
分类号
TP3
[自动化与计算机技术—计算机科学与技术]
-