-
题名基于可编程交换机的网内灰色故障检测技术研究进展
- 1
-
-
作者
刘宏岩
张栋
吴春明
-
机构
浙江大学计算机科学与技术学院
福州大学计算机与大数据学院
-
出处
《电子学报》
EI
CAS
CSCD
北大核心
2024年第10期3613-3622,共10页
-
基金
浙江省“尖兵”“领雁”研发攻关计划项目(No.2024C01066)。
-
文摘
灰色故障是指对生产网络产生细微影响的交换机故障.然而,当这些轻微故障相互叠加或与新增故障叠加时,可能会导致整个生产网络的瘫痪.因此,检测灰色故障对生产网络的稳定性至关重要.传统解决方案关注的是在控制平面收集数据平面交换机中的流记录,并对其进行处理以检测灰色故障.然而,此类解决方案存在着不足:(1)缓存和处理大量的流记录会引入庞大的资源开销;(2)较高的检测时延无法保证灰色故障检测的时效性.近年来,可编程交换机的出现为灰色故障检测技术带来了新机遇:网络管理员可以将灰色故障检测算法部署运行至可编程交换机的线速ASIC流水线上,从而支持低开销、低时延、高精度的网内灰色故障检测技术.本文针对基于可编程交换机的网内灰色故障检测技术进行综述,在对灰色故障的概念、普遍性及对生产网络的危害进行描述的基础上,分析与讨论了现有基于可编程交换机的网内灰色故障检测技术的研究现状与进展,详细介绍每项技术的工作原理及流程,搭建真实的实验平台评估各项技术的检测指标,在文末指出了现有技术所面临的问题与挑战.
-
关键词
灰色故障检测
可编程交换机
网内计算
网络测量
数据报丢失
数据中心网络
-
Keywords
gray failure detection
programmable switches
in-network computing
network measurement
packet loss
datacenter networks
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-