期刊文献+
共找到97篇文章
< 1 2 5 >
每页显示 20 50 100
基于机器学习的聚类序列离群点数据挖掘算法
1
作者 王彩霞 陶健 舒升 《通化师范学院学报》 2024年第8期28-34,共7页
由于聚类序列离群点数据具有时序依赖性特征,难以精准检测离群点,导致数据挖掘效果不理想.针对该问题,提出了基于机器学习的聚类序列离群点数据挖掘算法,利用机器学习方法进行聚类序列离群点数据聚类处理,计算离群点离群指数;通过机器... 由于聚类序列离群点数据具有时序依赖性特征,难以精准检测离群点,导致数据挖掘效果不理想.针对该问题,提出了基于机器学习的聚类序列离群点数据挖掘算法,利用机器学习方法进行聚类序列离群点数据聚类处理,计算离群点离群指数;通过机器学习聚合数据,分配离群点数据;遍历数据样本特征序列,计算特征区间适用度,分析特征与目标变量之间关系;将数据分类挖掘问题转换为线性可分问题,避免出现过拟合;设计数据挖掘过程,根据记录每个数据点出现的时间戳,实现数据挖掘.实验结果表明:该算法只是在PSLG数据集与实际离群点占比出现了1%的误差,其余均一致,数据挖掘范围与标定范围一致,具有精准挖掘效果. 展开更多
关键词 机器学习 聚类序列 离群点 数据挖掘
下载PDF
基于动态编程匹配的聚类序列数据挖掘算法 被引量:1
2
作者 曾铮 《计算机应用与软件》 北大核心 2022年第11期257-263,323,共8页
针对共现聚类挖掘算法忽略共现事件的发生顺序和时间间隔,且推理精度受限等问题,提出一种基于动态编程匹配的聚类序列数据挖掘算法。利用贝叶斯推理来推断时间间隔的概率密度函数从而提高对不确定性的鲁棒性,并且同时考虑了空间接近性... 针对共现聚类挖掘算法忽略共现事件的发生顺序和时间间隔,且推理精度受限等问题,提出一种基于动态编程匹配的聚类序列数据挖掘算法。利用贝叶斯推理来推断时间间隔的概率密度函数从而提高对不确定性的鲁棒性,并且同时考虑了空间接近性和时间间隔接近性;利用动态编程匹配的思想来获取事件之间发生的内在关系,从而提高时间间隔概率密度函数的推断准确性。通过使用合成数据进行的实验,验证了该算法在不确定情况下良好的推理精度,并将该算法应用于燃料电池损伤分析中,其能够准确地确定损伤模式,进一步验证了算法的有效性。 展开更多
关键词 共现挖掘 动态编程 聚类序列数据挖掘 概率密度函数 损伤性分析
下载PDF
基于2dSVD和高斯混合模型的多变量时间序列聚类
3
作者 杨秋颖 翁小清 《计算机应用与软件》 北大核心 2024年第3期283-289,327,共8页
针对多变量时间序列(MTS)存在时间和变量两个维度,以及传统主成分分析(PCA)方法在MTS数据表示上的局限性,提出一种基于二维奇异值分解(2dSVD)和高斯混合模型(GMM)的MTS聚类算法。该文计算MTS的行-行和列-列协方差矩阵的特征向量,从时间... 针对多变量时间序列(MTS)存在时间和变量两个维度,以及传统主成分分析(PCA)方法在MTS数据表示上的局限性,提出一种基于二维奇异值分解(2dSVD)和高斯混合模型(GMM)的MTS聚类算法。该文计算MTS的行-行和列-列协方差矩阵的特征向量,从时间和变量两个维度提取特征矩阵;用GMM从概率分布角度对特征矩阵进行聚类。数值实验结果表明,该方法对多变量时间序列具有更好的聚类效果。 展开更多
关键词 二维奇异值分解 高斯混合模型 多变量时间序列
下载PDF
基于对比学习的时间序列聚类方法
4
作者 杨博 罗嘉琛 +2 位作者 宋艳涛 吴宏涛 彭甫镕 《计算机科学》 CSCD 北大核心 2024年第2期63-72,共10页
现有深度聚类方法严重依赖于复杂的特征提取网络和聚类算法,难以直观地定义时间序列的相似性。使用对比学习的方法可以从正负样本数据的角度定义时间序列的区间相似性,并对特征提取和聚类进行联合优化。基于对比学习的思想,提出了一种... 现有深度聚类方法严重依赖于复杂的特征提取网络和聚类算法,难以直观地定义时间序列的相似性。使用对比学习的方法可以从正负样本数据的角度定义时间序列的区间相似性,并对特征提取和聚类进行联合优化。基于对比学习的思想,提出了一种不依赖于复杂表示网络的时间序列聚类模型。同时,为解决现有时间序列数据增强方法难以描述时间序列的变换不变性的问题,提出了一种基于时间序列形状特征的数据增强方法,在忽略数据时域特征情况下捕捉序列的相似性。模型通过设置不同的形状转换参数构造正负样本对,学习特征表示并投影到特征空间,在实例级对比和聚类级对比层面利用交叉熵损失最大化正样本对相似性,最小化负样本对相似性,实现了端到端的联合学习表示和聚类分配。在32个UCR中的数据集上进行了大量实验,结果表明该模型可以在不依赖于特定表示学习网络的情况下得到与现有方法相当或优于现有方法的聚类结果。 展开更多
关键词 时间序列 对比学习 数据增强 表示学习 联合优化
下载PDF
基于Edlib的启发式生物序列聚类算法
5
作者 卫泽刚 陈旭 +2 位作者 张小丹 胡婉靖 刘飞 《宝鸡文理学院学报(自然科学版)》 CAS 2024年第3期50-55,共6页
目的提出一种基于Edlib的启发式序列聚类算法:EdClust,以降低目前启发式序列聚类算法普遍存在的聚类数量过估计和聚类种子序列质量低的问题。方法EdClust首先读取第一条序列并作为第一个聚类单元的种子;然后读取下一条序列,通过Edlib计... 目的提出一种基于Edlib的启发式序列聚类算法:EdClust,以降低目前启发式序列聚类算法普遍存在的聚类数量过估计和聚类种子序列质量低的问题。方法EdClust首先读取第一条序列并作为第一个聚类单元的种子;然后读取下一条序列,通过Edlib计算序列与种子序列的相似性,如果相似性大于给定阈值,则对其进行聚类,否则,创建一个新的聚类单元并作为其种子序列;重复以上步骤,直到所有序列完成聚类。结果2组实验测试表明,EdClust在聚类数量和种子序列质量上均取得较好效果。结论EdClust采用Edlib进行序列比对,可以快速得到待比对序列与种子序列间的相似性,提高了聚类种子质量,降低了聚类数量过估计。 展开更多
关键词 序列 启发式 质量 高通量测序
下载PDF
基于改进TS-DTW距离度量的时间序列聚类
6
作者 张艳 何腾松 彭鼎 《统计学与应用》 2024年第5期1690-1700,共11页
基于不同相似性度量的方法对时间序列进行聚类,比较改进TS-DTW距离与其他距离度量相似性在聚类结果上的效果。结果表明基于改进TS-DTW距离度量的聚类结果比其他方法更有效。利用上海证券交易所50指数成分股进行实证研究,采用改进TS-DTW... 基于不同相似性度量的方法对时间序列进行聚类,比较改进TS-DTW距离与其他距离度量相似性在聚类结果上的效果。结果表明基于改进TS-DTW距离度量的聚类结果比其他方法更有效。利用上海证券交易所50指数成分股进行实证研究,采用改进TS-DTW距离进行聚类,聚类结果表明不同类别的股票后续仍具有一定时效性,基于此构建投资组合,得到的时间序列聚类模型有助于降低投资组合的波动风险。Clustering time series based on different similarity metrics compares the effect of improved TS-DTW distance with other distance metrics of similarity in clustering results. The results show that the clustering results based on the improved TS-DTW distance metric are more effective than other methods. An empirical study is carried out using the constituent stocks of Shanghai Stock Exchange 50 Index, and the clustering results using the improved TS-DTW distance indicate that the follow-up of different categories of stocks is still time-sensitive, based on which the investment portfolios are constructed, and the obtained time-series clustering model helps to reduce the volatility risk of the investment portfolios. 展开更多
关键词 时间序列 改进TS-DTW 投资组合构建 风险控制
下载PDF
基于时间序列相似性聚类的应用研究综述 被引量:27
7
作者 陈湘涛 李明亮 陈玉娟 《计算机工程与设计》 CSCD 北大核心 2010年第3期577-581,共5页
在综合分析近年来时间序列数据挖掘相关文献的基础上从时间序列分割、相似性度量、时间序列聚类等方面对时间序列数据挖掘进行了综述,简要分析了基于时间序列相似性聚类的研究现状,对比较流行的算法进行了比较分析,对当前一些未解决的... 在综合分析近年来时间序列数据挖掘相关文献的基础上从时间序列分割、相似性度量、时间序列聚类等方面对时间序列数据挖掘进行了综述,简要分析了基于时间序列相似性聚类的研究现状,对比较流行的算法进行了比较分析,对当前一些未解决的问题进行了简要介绍,并在此基础上对未来的发展趋势进行了展望,为研究者了解最新的基于时间序列相似性聚类研究动态、新技术及发展趋势提供了参考。 展开更多
关键词 线性分割 滑动窗口 时间窗 小波变换 序列 序列
下载PDF
时间序列数据挖掘中的聚类研究综述 被引量:21
8
作者 李海林 张丽萍 《电子科技大学学报》 EI CAS CSCD 北大核心 2022年第3期416-424,共9页
鉴于时间序列数据的高维性和复杂性给数据挖掘带来的困扰以及聚类分析在时间序列数据挖掘领域中的重要性,对目前该领域国内外相关时间序列数据聚类研究的状况进行综述。时间序列聚类总体上可分为整体时间序列聚类、子序列聚类和时间点聚... 鉴于时间序列数据的高维性和复杂性给数据挖掘带来的困扰以及聚类分析在时间序列数据挖掘领域中的重要性,对目前该领域国内外相关时间序列数据聚类研究的状况进行综述。时间序列聚类总体上可分为整体时间序列聚类、子序列聚类和时间点聚类3种,分别从特征表示、相似性度量、聚类算法和簇原型等方面来研究,同时也结合了具体的应用分析。根据时间序列数据挖掘中聚类存在的主要问题,提出了部分未来值得关注和研究的内容和方向,以便更好地促进时间序列数据聚类分析的研究与发展。 展开更多
关键词 分析 数据挖掘 高维性 时间序列 时间序列
下载PDF
基于数据挖掘的符号序列聚类相似度量模型 被引量:3
9
作者 郑宏珍 初佃辉 +1 位作者 战德臣 徐晓飞 《计算机工程》 CAS CSCD 北大核心 2009年第1期178-179,194,共3页
为了从消费者偏好序列中发现市场细分结构,采用数据挖掘领域中的符号序列聚类方法,提出一种符号序列聚类的研究方法和框架,给出RSM相似性度量模型。调整RSM模型参数,使得RSM可以变为与编辑距离、海明距离等价的相似性度量。通过RSM与其... 为了从消费者偏好序列中发现市场细分结构,采用数据挖掘领域中的符号序列聚类方法,提出一种符号序列聚类的研究方法和框架,给出RSM相似性度量模型。调整RSM模型参数,使得RSM可以变为与编辑距离、海明距离等价的相似性度量。通过RSM与其他序列相似性度量的比较,表明RSM具有更强的表达相似性概念的能力。由于RSM能够表达不同的相似性概念,从而使之能适用于不同的应用环境,并在其基础上提出自组织特征映射退火符号聚类模型,使得从消费者偏好进行市场细分结构研究的研究途径在实际应用中得以实现。 展开更多
关键词 符号序列 数据挖掘 相似性模型
下载PDF
邻域种子的启发式454序列聚类方法 被引量:3
10
作者 陈伟 程咏梅 +1 位作者 张绍武 潘泉 《软件学报》 EI CSCD 北大核心 2014年第5期929-938,共10页
随着二代测序技术的发展,产生了海量16S rRNA基因序列数据.如何有效地挖掘这些数据中隐藏的基因组学信息,是当前研究的热点与难点.序列聚类研究如何将来源于同一物种的序列合并在一起,其构成了物种多样性、结构及功能多样性研究的基础.... 随着二代测序技术的发展,产生了海量16S rRNA基因序列数据.如何有效地挖掘这些数据中隐藏的基因组学信息,是当前研究的热点与难点.序列聚类研究如何将来源于同一物种的序列合并在一起,其构成了物种多样性、结构及功能多样性研究的基础.针对454测序误差的来源特点,提出一种基于邻域种子序列的启发式序列聚类算法(NbHClust).实验结果表明,该算法具有良好的鲁棒性能.与传统启发式序列聚类算法相比,该算法能够降低操作分类单元(operational taxonomy unit,简称OTU)过估计问题,提高聚类精度,有效地进行操作分类单元计算. 展开更多
关键词 二代测序技术 操作分单元 物种多样性 16S RRNA基因 序列
下载PDF
基于时间序列聚类的主题发现与演化分析研究 被引量:19
11
作者 李海林 邬先利 《情报学报》 CSSCI CSCD 北大核心 2019年第10期1041-1050,共10页
针对现有研究对文献主题发现和演化分析方法的单一性,本文提出了基于时间序列聚类的主题发现与演化分析方法。该方法首先通过共词分析找出文献数据集中高频关键词的共现矩阵,利用Ochiia系数计算方法将共现矩阵转换为相似性矩阵,然后使... 针对现有研究对文献主题发现和演化分析方法的单一性,本文提出了基于时间序列聚类的主题发现与演化分析方法。该方法首先通过共词分析找出文献数据集中高频关键词的共现矩阵,利用Ochiia系数计算方法将共现矩阵转换为相似性矩阵,然后使用近邻传播聚类算法发现文献主题。同时,再将主题在某段时间内的研究热度进行分析并转化为反映主题热度时间序列数据,结合时间序列聚类方法对各主题进行分类以及演化趋势的分析。实验结果表明,通过对中国知网中2000—2018年与创新管理相关的期刊文献进行数据处理与挖掘,提出的方法能有效地发现期刊的研究主题,并且能较好地分析这些主题的演化趋势。 展开更多
关键词 AP 时间序列 主题发现 主题演化
下载PDF
基于隐马尔可夫模型的符号序列自组织聚类 被引量:3
12
作者 吕昱 程代杰 《计算机科学》 CSCD 北大核心 2006年第8期210-212,共3页
本文提出一种基于模型的、适合变长符号序列的自组织聚类算法。隐马尔可夫模型被用于表达各个聚类,批处理自组织特征被用于符号序列的聚类过程。实验结果表明该算法能有效发现变长符号序列中的聚类模式。
关键词 批处理自组织特征映射 隐马尔可夫模型 符号序列
下载PDF
标度曲线拟合与金融时间序列聚类 被引量:4
13
作者 袁铭 《计算机应用》 CSCD 北大核心 2014年第11期3344-3347,3352,共5页
针对金融时间序列具有的多重分形特征,提出基于标度曲线测度沪深300指标股之间的相似性并实现聚类。该方法首先使用多标度退势波动分析(MSDFA)拟合不同自相关阶数下收益率序列的标度曲线,然后抽取其分布或形态特征构造模式向量。聚类通... 针对金融时间序列具有的多重分形特征,提出基于标度曲线测度沪深300指标股之间的相似性并实现聚类。该方法首先使用多标度退势波动分析(MSDFA)拟合不同自相关阶数下收益率序列的标度曲线,然后抽取其分布或形态特征构造模式向量。聚类通过含权K-means算法实现,最优类别数根据分类适确性指标(DBI)确定。结果显示,基于标度曲线的聚类能够揭示出股市的行业聚集性和板块间的关联性,在此基础上构造的投资组合可以显著降低风险,并且效果优于基于原始序列线性趋势特征的聚类。 展开更多
关键词 时间序列 多重分形 多标度退势波动分析 K均值算法 均值-方差模型
下载PDF
差异序列聚类算法在四膜虫遗传分析中的应用
14
作者 高崇明 李益勋 +1 位作者 程乾生 周小波 《北京大学学报(自然科学版)》 CAS CSCD 北大核心 1998年第6期765-769,共5页
用差异序列聚类算法分析了上海四膜虫三株克隆间期细胞大核DNA含量变动规律,讨论了调节大核DNA量在一定阈值内的可能机制。
关键词 序列算法 四膜虫 DNA 遗传分析 纤毛虫
下载PDF
基于思维序列聚类的思维主题发现方法 被引量:1
15
作者 陈学昌 《中国管理信息化》 2012年第12期52-54,共3页
本文针对数据挖掘应用中分析主题确定问题,基于认知心理学中"概念"与"思维"的阐释,模拟人的思维过程,提出了一种思维(分析)主题发现的方法,该方法分为思维序列构建和主题发现两部分。
关键词 思维流程 主题发现 思维序列 序列
下载PDF
基于序列聚类的相似代码检测算法 被引量:5
16
作者 于世英 袁雪梅 +2 位作者 卢海涛 任家东 李硕 《智能系统学报》 CSCD 北大核心 2013年第1期52-57,共6页
为了提高源程序代码之间相似性的检测效率,提出一种基于序列聚类的相似代码检测算法.算法首先把源代码按照其自身的结构进行分段提取,然后对各个分段进行部分代码变换,再以带权重的编辑距离为相似度量标准对这些符号进行序列聚类,得到... 为了提高源程序代码之间相似性的检测效率,提出一种基于序列聚类的相似代码检测算法.算法首先把源代码按照其自身的结构进行分段提取,然后对各个分段进行部分代码变换,再以带权重的编辑距离为相似度量标准对这些符号进行序列聚类,得到相似的程序代码片段,以达到对源程序进行相似功能检测的目的.使用多个真实和仿真程序对上述算法进行了实验,实验结果验证了算法的有效性和可伸缩性. 展开更多
关键词 序列 权重编辑距离 相似代码检测
下载PDF
一种基于Normal矩阵的时间序列聚类方法 被引量:5
17
作者 姜荣 赵凤霞 +1 位作者 谢福鼎 张永 《计算机应用研究》 CSCD 北大核心 2010年第8期2926-2928,共3页
提出了一种基于Normal矩阵的时间序列聚类方法。该算法首先对时间序列数据进行向量形式转换,计算出各个时间序列间的相似度并构建复杂网络,然后利用基于Normal矩阵的方法进行复杂网络社团划分,同一类的时间序列被划分到一个社团,即实现... 提出了一种基于Normal矩阵的时间序列聚类方法。该算法首先对时间序列数据进行向量形式转换,计算出各个时间序列间的相似度并构建复杂网络,然后利用基于Normal矩阵的方法进行复杂网络社团划分,同一类的时间序列被划分到一个社团,即实现对时间序列数据的聚类。为了验证该方法的可行性和有效性,将其应用于股票时间序列数据聚类分析中,并在两个实际的数据集上与其他方法相比较,取得了较好的实验结果。 展开更多
关键词 时间序列 社团结构 复杂网络 Normal矩阵 相似度
下载PDF
基于互相关的二阶段时间序列聚类方法 被引量:4
18
作者 高启航 杨卫东 《计算机工程与应用》 CSCD 北大核心 2016年第19期12-18,共7页
提出了一种高效的时间序列聚类方法,以互相关函数为基础,通过二阶段的方法实现更低时间复杂度下的时间序列聚类。第一步以时间序列符号化为基础,通过设计符号化序列特征抽取算法,抽取特征时间段;第二步以互相关函数为基础,通过改进的互... 提出了一种高效的时间序列聚类方法,以互相关函数为基础,通过二阶段的方法实现更低时间复杂度下的时间序列聚类。第一步以时间序列符号化为基础,通过设计符号化序列特征抽取算法,抽取特征时间段;第二步以互相关函数为基础,通过改进的互相关函数步骤,实现更快速的时间序列聚类。实验结果表明,该方法可以适应稀疏及密集的时间序列数据抽取,同时与传统的聚类距离公式相比,处理速度更快,对时间序列形状的缩放有更好的表示效果,并能保持较高准确性。 展开更多
关键词 时间序列 特征时间段抽取 互相关函数
下载PDF
CuMen:基于最大频繁序列模式的聚类算法及其在基因拼接中的应用 被引量:4
19
作者 黄东 唐俊 +1 位作者 汪卫 施伯乐 《计算机科学》 CSCD 北大核心 2005年第10期149-153,共5页
基因组序列拼接的主流方法是将整条序列随机打断成小片段,然后根据片段间重叠关系连接成长序列。由于较多噪音存在,算法复杂度高,加之生物数据的海量增长,序列拼接处理导致巨大的时空开销而无法完成。本文提出一种基于最大频繁序列模式... 基因组序列拼接的主流方法是将整条序列随机打断成小片段,然后根据片段间重叠关系连接成长序列。由于较多噪音存在,算法复杂度高,加之生物数据的海量增长,序列拼接处理导致巨大的时空开销而无法完成。本文提出一种基于最大频繁序列模式的聚类算法,将整个数据集分成若干个子集,分别高效地处理,实现了一个基因拼接网格系统、透明动态的资源管理,大大扩展了基因拼接计算能力。基于最大频繁序列模式聚类算法及挖掘算法,针对生物数据的特性做出了优化。 展开更多
关键词 最大频繁序列模式 序列 序列拼接 网格 基因组序列 序列模式 拼接处理 算法 应用 生物数据 算法复杂度 网格系统 资源管理
下载PDF
基于时间序列聚类的轨迹停留点检测算法 被引量:4
20
作者 兰志辉 陈莉 段治州 《计算机应用研究》 CSCD 北大核心 2020年第12期3557-3560,共4页
针对采样不规则轨迹的停留点检测准确性不高的问题,提出了一种基于时间序列聚类的停留点检测算法。首先基于数据场理论设计了一种综合考虑时空特性的混合特征密度测量方法,然后根据停留点中心密度比入口大的特性,采用过滤—精炼策略提... 针对采样不规则轨迹的停留点检测准确性不高的问题,提出了一种基于时间序列聚类的停留点检测算法。首先基于数据场理论设计了一种综合考虑时空特性的混合特征密度测量方法,然后根据停留点中心密度比入口大的特性,采用过滤—精炼策略提取停留点。在过滤阶段,将时间连续且满足最小密度阈值的点作为候选停留点。在精炼阶段,通过最大阈值筛选出实际停留点。实验结果表明,该方法能够有效检测采样不规则轨迹中的停留点,相较于已有方法具有较高的准确性和较低的时间消耗。 展开更多
关键词 轨迹数据 停留点 数据场 时间序列
下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部