针对基于shapelets转换的时间序列分类方法中候选shapelets存在较大相似性的问题,提出一种基于多样化top-k shapelets转换的分类方法 Div Top KShapelet。该方法采用多样化top-k查询技术,去除相似shapelets,并筛选出最具代表性的k个shap...针对基于shapelets转换的时间序列分类方法中候选shapelets存在较大相似性的问题,提出一种基于多样化top-k shapelets转换的分类方法 Div Top KShapelet。该方法采用多样化top-k查询技术,去除相似shapelets,并筛选出最具代表性的k个shapelets集合,最后以最优shapelets集合为特征对数据集进行转换,达到提高分类准确率及时间效率的目的。实验结果表明,Div Top KShapelet分类方法不仅比传统分类方法具有更高的准确率,而且与使用聚类筛选的方法(Cluster Shapelet)和shapelets覆盖的方法(Shapelet Selection)相比,分类准确率最多提高了48.43%和32.61%;同时在所有15个数据集上均有计算效率的提升,最少加速了1.09倍,最高可达到287.8倍。展开更多
针对现有shapelets分类方法不能解决不平衡时间序列分类的问题,提出了基于多样化top-k shapelets转换的时间序列分类方法,用不平衡数据分类评价指标曲线下面积(Area Under Curve,AUC)代替传统的信息熵,作为衡量shapelets的标准,并利用...针对现有shapelets分类方法不能解决不平衡时间序列分类的问题,提出了基于多样化top-k shapelets转换的时间序列分类方法,用不平衡数据分类评价指标曲线下面积(Area Under Curve,AUC)代替传统的信息熵,作为衡量shapelets的标准,并利用多样化top-k shapelets对训练集进行转换,最后使用SMOTE方法对转换后的训练集进行过采样。该方法利用AUC值对不平衡数据不敏感的特性,提高shapelets特征评估分类的准确性,不仅可以有效提取时间序列特征,还能在特征的基础上进行数据集的平衡处理。展开更多
文摘针对基于shapelets转换的时间序列分类方法中候选shapelets存在较大相似性的问题,提出一种基于多样化top-k shapelets转换的分类方法 Div Top KShapelet。该方法采用多样化top-k查询技术,去除相似shapelets,并筛选出最具代表性的k个shapelets集合,最后以最优shapelets集合为特征对数据集进行转换,达到提高分类准确率及时间效率的目的。实验结果表明,Div Top KShapelet分类方法不仅比传统分类方法具有更高的准确率,而且与使用聚类筛选的方法(Cluster Shapelet)和shapelets覆盖的方法(Shapelet Selection)相比,分类准确率最多提高了48.43%和32.61%;同时在所有15个数据集上均有计算效率的提升,最少加速了1.09倍,最高可达到287.8倍。
文摘针对现有shapelets分类方法不能解决不平衡时间序列分类的问题,提出了基于多样化top-k shapelets转换的时间序列分类方法,用不平衡数据分类评价指标曲线下面积(Area Under Curve,AUC)代替传统的信息熵,作为衡量shapelets的标准,并利用多样化top-k shapelets对训练集进行转换,最后使用SMOTE方法对转换后的训练集进行过采样。该方法利用AUC值对不平衡数据不敏感的特性,提高shapelets特征评估分类的准确性,不仅可以有效提取时间序列特征,还能在特征的基础上进行数据集的平衡处理。