一种基于信息熵的时间序列分段线性表示方法被引量：13

Piecewise linear representation based on information entropy of time series

下载PDF

导出

摘要针对部分时间序列具有高维、大数据量及数据更新速度较快的特点,导致在原始时间序列上难以进行数据挖掘的问题,提出一种基于信息熵的时间序列分段线性表示方法———PLR_IE。该算法利用信息熵作为评判重要点数量的性能指标,从序列中提取重要分段点的数量分布情况,利用重要点组成的序列重新拟合原始时间序列,为下一步数据挖掘提供基础。实验结果表明,该方法能高效地提取出序列主要特征、拟合原始序列。 For some time series with high dimension, large amount of data and data renewal speed characteristics, resulting in the original time series data mining on difficult problems, this paper presented a method piecewise linear representation of time series method based on information entropy, which was the piecewise linear representation of time series algorithm PLR_IE. The algorithm used the information entropy as an evaluation of important points of performance indicators, from sequence to ex- tract important segment, the important point consisted of a sequence of fitting the original time series. Experiments show that this method can efficiently extract sequence, main characteristics, fitting the original sequence.

作者赵建秀王洪国邵增珍张岳丁艳辉

机构地区山东师范大学信息科学与工程学院山东省分布式计算机软件新技术重点实验室

出处《计算机应用研究》 CSCD 北大核心 2013年第8期2391-2394,共4页 Application Research of Computers

基金山东省自然科学基金资助项目(ZR2011FQ029 ZR2011FL026) 山东省科技发展计划资助项目(2011YD01099 2011YD01100) 山东省高等学校科技计划资助项目(J11LG32)

关键词时间序列信息熵分段线性表示压缩率拟合误差 time series information entropy piecewise linear representation compression ratio fitting error

分类号 TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献10

1潘定,沈钧毅.时态数据挖掘的相似性发现技术[J].软件学报,2007,18(2):246-258. 被引量：41
2KEOGH E. Fast similarity search in the presence of longitudinal scal- ing in time series databases[ C]//Proc of the 9th IEEE International Conference on Tools with Aritificial Intelligence. Washington DC: IEEE Computer Society, 1997:578- 587.
3KEOGH E, CHU S, HART D, et al. Segmenting time - series : a survey and novel approach[ M]. Data Mining in Time-series Databases. [ S. 1. ] :World Scientific,1993:1-22.
4KEOGH E, CHAKRABARTI K, PAZZANI M J, et al. Dimensionality reduction for fast similarity search in large time series databases [ J ]. Knowledge and Information Systems ,2008,3 ( 3 ) :263- 286.
5詹艳艳,徐荣聪,陈晓云.基于斜率提取边缘点的时间序列分段线性表示方法[J].计算机科学,2006,33(11):139-142. 被引量：45
6尚福华,孙达辰.基于时间序列趋势转折点的分段线性表示[J].计算机应用研究,2010,27(6):2075-2077. 被引量：21
7CHUNG F L, FU T C, LUK R,et al. Time series pattern matching based on perceptually important points [ C ]//Proc of the IJCAI Work- shop on Learning from Temporal and Spatial Data. 2001:1-7.
8周大镯,李敏强.基于序列重要点的时间序列分割[J].计算机工程,2008,34(23):14-16. 被引量：24
9王保山,邵明星,丁爱亮,徐炳振.证券市场信息熵技术指标构建与应用[J].宁波大学学报（理工版）,2012,25(3):79-82. 被引量：2
10陈然,戴齐.基于重要点的时间序列固定分段数分段算法[J].计算机技术与发展,2011,21(9):103-106. 被引量：10

二级参考文献44

1周黔,吴铁军.基于重要点的时间序列趋势特征提取方法[J].浙江大学学报（工学版）,2007,41(11):1782-1787. 被引量：19
2Jia-WeiHan,JianPei,Xi-FengYan.From Sequential Pattern Mining to Structured Pattern Mining： A Pattern-Growth Approach[J].Journal of Computer Science & Technology,2004,19(3):257-279. 被引量：18
3张军,马志民.基于时间序列的相似子模式发现算法[J].计算机技术与发展,2006,16(1):140-142. 被引量：6
4詹艳艳,徐荣聪,陈晓云.基于斜率提取边缘点的时间序列分段线性表示方法[J].计算机科学,2006,33(11):139-142. 被引量：45
5潘定,沈钧毅.时态数据挖掘的相似性发现技术[J].软件学报,2007,18(2):246-258. 被引量：41
6杜奕,卢德唐,李道伦,查文舒.基于层次聚类的时间序列在线划分算法[J].模式识别与人工智能,2007,20(3):415-420. 被引量：8
7Keogh E, Chakrabarti K, Pazzani M, et al. Dimensionality Reduction for Fast Similarity Search in Large Time Series Databases[J]. Journal of Knowledge and Information Systems, 2001, 3(3): 263-286.
8Qu Yunyao, Wang Changzhou. Supporting Fast Search in Time Series for Movement Patterns in Multiples Scales[C]//Proc. of the 7th ACM CIKM Int'l Conference on Information and Knowledge Management. Bethesda, USA: [s. n.], 1998.
9Keogh E, Pazzani M. An Enhanced Representation of Time Series Which Allows Fast and Accurate Classification, Clustering and Relevance Feedback[C]//Proc. of the 4th Int'l Conference on Knowledge Discovery and Data Mining. New York, USA: [s. n.], 1998.
10Park S, Lee D. Fast Retrieval of Similar Subsequences in Long Sequence Databases[C]//Proc. of the 3rd IEEE Knowledge and Data Engineering Exchange Workshop. Chicago, USA: [s. n.], 1999.

共引文献101

1王玲,徐培培,彭开香.基于因子模型和动态规划的多元时间序列分段方法[J].控制与决策,2020,35(1):35-44. 被引量：6
2刘春柳,张征.城市用水量曲线聚类算法的研究与实现[J].中国科技论文在线精品论文,2020(2):212-220.
3刘佳宝,梁奕,徐漫江.一种过程数据趋势特征提取方法[J].化工自动化及仪表,2012,39(7):850-853. 被引量：1
4孙梅玉,唐漾,方建安.一种基于MBR的高效的时间序列表示方法[J].计算机工程与应用,2008,44(16):135-138. 被引量：2
5曲明成,廖明宏,吴翔虎,刘志强.一种文档自动生成模型的构建及其应用[J].计算机集成制造系统,2008,14(7):1297-1305. 被引量：5
6宁慧,李红宇,吴培莲.Web日志中时态约束浏览模式挖掘算法研究[J].哈尔滨工业大学学报,2008,40(9):1474-1480. 被引量：3
7张鹏,李学仁,张建业,张宗麟.时间序列的夹角距离及相似性搜索[J].模式识别与人工智能,2008,21(6):763-767. 被引量：17
8张娜,李莉娟.时间序列分段线性表示的几种算法比较[J].中国西部科技,2009,8(14):80-81. 被引量：4
9陈卓,杨炳儒,周法国,李琳娜.基于时态逻辑的多时间序列挖掘模型[J].辽宁工程技术大学学报（自然科学版）,2009,28(4):604-607. 被引量：2
10吴枫,仲妍,吴泉源,贾焰,杨树强.基于适应性分段估计的数据流相似性搜索[J].软件学报,2009,20(10):2867-2884. 被引量：4

同被引文献129

1周黔,吴铁军.基于重要点的时间序列趋势特征提取方法[J].浙江大学学报（工学版）,2007,41(11):1782-1787. 被引量：19
2徐艺文,陈忠辉,李雷,魏宏安.基于DFT的2FSK信号解调自适应门限同步检测算法[J].四川大学学报（工程科学版）,2011,43(S1):169-173. 被引量：3
3董永贵,孙照焱,贾惠波.时间序列中异常值检测的负向选择算法[J].机械工程学报,2004,40(10):30-34. 被引量：15
4肖辉,胡运发.基于分段时间弯曲距离的时间序列挖掘[J].计算机研究与发展,2005,42(1):72-78. 被引量：59
5王少江,殷志山.长周期形变波与慢地震[J].地壳形变与地震,1989,9(3):1-10. 被引量：9
6刘建夏.一种混沌伪随机序列的设计及其应用[J].计算机工程,2005,31(18):150-152. 被引量：12
7苏桂平,刘争春,姚旭初,殷学文.一种信息安全系统中序列随机性检验方法[J].计算机工程,2006,32(8):153-154. 被引量：12
8徐蓉,姜峰,姚鸿勋.流形学习概述[J].智能系统学报,2006,1(1):44-51. 被引量：67
9詹艳艳,徐荣聪,陈晓云.基于斜率提取边缘点的时间序列分段线性表示方法[J].计算机科学,2006,33(11):139-142. 被引量：45
10李和平,胡占义,吴毅红,吴福朝.基于半监督学习的行为建模与异常检测[J].软件学报,2007,18(3):527-537. 被引量：30

引证文献13

1谢婷玉,徐德刚,阳春华,桂卫华.基于重要点双重评价的时间序列趋势提取[J].信息与控制,2018,47(6):730-736. 被引量：5
2张胜,施荣华,赵颖,周芳芳.信息熵时序和树图用于NetFlow可视化的研究[J].高技术通讯,2014,24(9):903-909.
3黄秋萍,陈巨灿,范雅静,李金清.光滑曲线去噪算法在分段线性拟合时间序列中的应用研究[J].科技资讯,2015,13(1):216-217. 被引量：1
4毛祥华,邓艳,董莹,陈梦妮,徐艳春,魏春,唐烨榕.云南省输入性疟疾病例时间分布特征分析[J].中国血吸虫病防治杂志,2017,29(4):445-448. 被引量：8
5杨德贺,袁静,王秀英,申旭辉,滕海涛,李文静,谭巧,卫清.形变观测数据的多异常形态统一识别[J].地球物理学报,2017,60(12):4623-4632. 被引量：7
6陶洋,沈敬红,李鹏亮,熊炫睿.时间序列高阶分段表示方法[J].计算机工程与设计,2018,39(1):103-107.
7崔玉娇,许勇.短波突发FSK信号解调技术研究[J].电子设计工程,2018,26(2):102-107. 被引量：1
8林意,孔斌强.基于多尺度的时间序列固定分段数线性表示[J].计算机工程与应用,2016,52(21):81-87. 被引量：8
9胡珉,白雪,徐伟,吴秉键.多维时间序列异常检测算法综述[J].计算机应用,2020,40(6):1553-1564. 被引量：26
10徐伟,孙向阳,邸泽雷坤.改进DCA算法用于工程时序数据异常检测[J].四川职业技术学院学报,2020,30(4):154-160. 被引量：1

二级引证文献59

1王晨阳,张子新,黄昕,许祺航.地下工程多时间序列监测数据异常检测算法[J].现代隧道技术,2022,59(S01):171-179. 被引量：2
2段美然,赵辉,谷松原,徐伟峰,王洪涛.基于深度迁移学习的多变量时间序列异常检测[J].中国电子科学研究院学报,2023,18(2):138-145.
3江艺羡,张岐山.近似非齐次无偏GM(1,1)模型的递推解法及应用[J].控制与决策,2015,30(12):2199-2204. 被引量：7
4江艺羡,张岐山.基于灰色方法与结构距离的飓风轨迹聚类算法[J].系统工程理论与实践,2017,37(4):1046-1055. 被引量：1
5王小丽.三维图像绘制过程优化处理方法研究与仿真[J].计算机仿真,2017,34(4):327-330. 被引量：10
6江珊,吕京国,李现虎.改进蚁群算法的三维激光点云聚类方法[J].测绘通报,2018(3):38-42. 被引量：4
7张丽,丰俊,张少森,夏志贵,周水森.2017年全国消除疟疾进展及疫情特征分析[J].中国寄生虫学与寄生虫病杂志,2018,36(3):201-209. 被引量：173
8吴琴娣,黄小妹,吕来福,周亮.溧阳市2013—2017年疟疾疫情与防控措施分析[J].江苏预防医学,2018,29(6):677-678. 被引量：4
9曹洋洋,林意,王智博,毕小红.基于双曲正切函数约束的时间序列建模表示[J].计算机工程与应用,2018,54(18):82-89. 被引量：2
10孙志伟,董亮亮,马永军.一种基于重要点的时间序列分段算法[J].计算机工程与应用,2018,54(18):250-255. 被引量：8

1詹艳艳,徐荣聪,陈晓云.基于插值边缘算子的时间序列模式表示[J].模式识别与人工智能,2007,20(3):421-427. 被引量：9
2卢海涛.基于时间序列的模式挖掘研究[J].科技资讯,2014,12(17):204-204.
3林意,王智博.基于一阶滤波的时间序列分段线性表示方法[J].计算机工程,2016,42(9):151-157. 被引量：8
4刘贺红,张毅坤.确定时间序列分段点的方法研究[J].计算机工程与应用,2010,46(13):44-46. 被引量：4
5喻高瞻,彭宏,胡劲松,郑启伦.时间序列数据的分段线性表示[J].计算机应用与软件,2007,24(12):17-18. 被引量：19
6张娜,李莉娟.时间序列分段线性表示的几种算法比较[J].中国西部科技,2009,8(14):80-81. 被引量：4
7谢福鼎,王赫楠,张永,孙岩.基于函数的时间序列分段线性表示方法[J].计算机科学,2011,38(11):153-155. 被引量：5
8杨立才,沈君,鲍淑娣,魏守水.基于PLR-DTW的ECG身份识别方法[J].生物医学工程学杂志,2013,30(5):976-981. 被引量：2
9贾澎涛,林卫,何华灿.时间序列的自适应误差约束分段线性表示[J].计算机工程与应用,2008,44(5):10-13. 被引量：9
10廖俊,周中良,寇英信,罗寰.一种基于重要点的时间序列分割方法[J].计算机工程与应用,2011,47(24):166-170. 被引量：16

计算机应用研究

2013年第8期

浏览历史

内容加载中请稍等...

一种基于信息熵的时间序列分段线性表示方法被引量：13

参考文献10

二级参考文献44

共引文献101

同被引文献129

引证文献13

二级引证文献59

相关作者

相关机构

相关主题

浏览历史

一种基于信息熵的时间序列分段线性表示方法 被引量：13

参考文献10

二级参考文献44

共引文献101

同被引文献129

引证文献13

二级引证文献59

相关作者

相关机构

相关主题

浏览历史

一种基于信息熵的时间序列分段线性表示方法被引量：13