-
题名基于时间序列聚类的主题发现与演化分析研究
被引量:18
- 1
-
-
作者
李海林
邬先利
-
机构
华侨大学工商管理学院
-
出处
《情报学报》
CSSCI
CSCD
北大核心
2019年第10期1041-1050,共10页
-
基金
国家自然科学基金项目“高维时间序列数据聚类分析及应用研究”(71771094)
福建省社会科学规划项目“基于时间序列数据挖掘的期刊参考文献和引证文献分析研究”(FJ2017B065)
-
文摘
针对现有研究对文献主题发现和演化分析方法的单一性,本文提出了基于时间序列聚类的主题发现与演化分析方法。该方法首先通过共词分析找出文献数据集中高频关键词的共现矩阵,利用Ochiia系数计算方法将共现矩阵转换为相似性矩阵,然后使用近邻传播聚类算法发现文献主题。同时,再将主题在某段时间内的研究热度进行分析并转化为反映主题热度时间序列数据,结合时间序列聚类方法对各主题进行分类以及演化趋势的分析。实验结果表明,通过对中国知网中2000—2018年与创新管理相关的期刊文献进行数据处理与挖掘,提出的方法能有效地发现期刊的研究主题,并且能较好地分析这些主题的演化趋势。
-
关键词
AP聚类
时间序列聚类
主题发现
主题演化
-
Keywords
AP clustering
time series clustering
themes discovery
topic evolution
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
O211.61
[理学—概率论与数理统计]
-
-
题名基于频繁模式发现的时间序列异常检测方法
被引量:11
- 2
-
-
作者
李海林
邬先利
-
机构
华侨大学信息管理系
-
出处
《计算机应用》
CSCD
北大核心
2018年第11期3204-3210,共7页
-
基金
国家自然科学基金资助项目(71771094
61300139)
+1 种基金
福建省社会科学规划项目(FJ2017B065)
福建省高等学校新世纪优秀人才支持计划项目(Z1625112)~~
-
文摘
针对传统异常片段检测方法在处理增量式时间序列时效率低的问题,提出一种基于频繁模式发现的时间序列异常检测(TSAD)方法。首先,将历史输入的时间序列数据进行符号转化;其次,利用符号化特征找出历史序列数据集中的频繁模式;最后,结合最长公共子序列匹配方法度量频繁模式与当前新增加时间序列数据之间的相似度,从而发现新增加数据中的异常模式。与基于滑动窗口预测的水文时间序列异常检测方法(TSOD)和基于扩展符号聚集近似的水文时间序列异常挖掘方法(ESAA)相比,对于实验选择的三种类型的时间序列数据,TSAD的检测率都超过90%;TSOD对规则性较强的序列检测率较高,能达到99%,但对噪声干扰较大的序列检测率较低,对数据偏向性较强;ESAA对三种类型的数据检测率均不超过70%。实验结果表明,TSAD在时间序列异常检测中能够较好地发现异常片段。
-
关键词
时间序列
符号集合近似
频繁模式
异常检测
检测率
-
Keywords
time series
Symbolic Aggregation Approximation(SAX)
frequent pattern
anomaly detection
detection rate
-
分类号
TP393.08
[自动化与计算机技术—计算机应用技术]
TP391.5
[自动化与计算机技术—计算机应用技术]
-