-
题名面向高能物理分级存储的文件访问热度预测
被引量:4
- 1
-
-
作者
程振京
汪璐
程耀东
陈刚
胡庆宝
李海波
-
机构
中国科学院高能物理研究所
中国科学院大学
中国科学院高能物理研究所天府宇宙线研究中心
-
出处
《计算机工程》
CAS
CSCD
北大核心
2021年第2期126-132,共7页
-
基金
国家重点研发计划(2017YFB0203200)
国家自然科学基金(11675201,11805226,11805223)。
-
文摘
高能物理计算是典型的数据密集型计算,其主要采用基于文件的分级存储方案,根据访问热度的不同将数据存储于不同性能的存储设备上,然而当前数据热度预测采用基于人工经验的启发式算法,准确率较低。提出一种借助长短期记忆网络预测文件未来访问热度的方法,包括网络结构设计、训练和预测算法等。该方法通过划分动态时间窗口构造文件访问特征的时序序列,预测不同数据的访问趋势。在LHAASO高能物理实验数据集上的实验结果表明,与SVM、MLP等算法相比,该方法预测准确率提升了30%左右,具有更强的适用性。
-
关键词
分级存储
文件访问特征
时序数据
长短期记忆网络
文件访问热度
-
Keywords
hierarchical storage
file access characteristics
time series data
Long Short-Term Memory(LSTM)network
file access popularity
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-