期刊文献+

海量异构资源敏感信息时间序列数据挖掘算法

Time Series Data Mining Algorithm for Sensitive Information of Massive Heterogeneous Resources
下载PDF
导出
摘要 为了保护用户敏感信息,能够进行有效的数据分析和决策制定,突出数据挖掘过程的加速比与准确率,提出一种海量异构资源敏感信息时间序列数据挖掘算法.利用TF-IDF计算异构网络敏感信息的特征向量,根据敏感信息特征提取的阈值,判断是否屏蔽敏感信息特征值,从而过滤掉异构网络中的敏感信息.利用标记向量初始化聚类中心,将每一个特征点依次分配到各自聚类中,重新计算敏感信息的聚类中心,对异构网络资源敏感信息进行聚类处理.为了提高挖掘准确性,算法进行标准化处理,并根据偏好函数对敏感信息时间序列进行加权处理.通过对时间序列数据的偏好流进行排序,计算出时间序列数据的净偏好流,按照不同偏好级别,挖掘出异构网络敏感信息的时间序列.实验结果表明,文中算法在挖掘敏感信息时间序列时的加速比更高,敏感信息时间序列数据挖掘准确率最高达98%.在加速性能和准确率方面具有显著优势,可以更有效地进行敏感信息的挖掘和处理.
作者 吕长松 LV Changsong
出处 《桂林航天工业学院学报》 2024年第1期61-66,共6页 Journal of Guilin University of Aerospace Technology
  • 相关文献

参考文献15

二级参考文献128

共引文献157

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部