论文标题: Service Guarantees for Time-Sensitive Software-Defined Networks
作者信息: Weijiang Kong
论文出处: Eindhoven University of Technology, 2025年1月20日
摘要: 在过去十年中,随着半导体技术的进步和对更智能系统的需求增加,汽车网络在规模和带宽方面经历了快速增长。传统的特定领域总线协议越来越难以维持这种趋势,因此行业转向基于以太网的统一连接的时敏网络(TSN)。TSN满足了汽车系统对有界延迟和传输可靠性的各种要求,并吸收了软件定义网络(SDN)的特点,以实现灵活的运行时管理。这种组合通常被称为时敏软件定义网络(TSSDN)。在设计TSSDN时,利用SDN的灵活性同时保持TSN的服务保证是主要关注点。此外,新兴应用需要建立新的服务保证。作为统一的连接方式,TSSDN必须处理具有多样化要求的流量。控制相关流通常请求严格的时序截止时间和由汽车安全完整性等级(ASIL)指定的保证可靠性。软实时流则需要在初始化和整个运行时保证服务质量(QoS)。由于大多数现有技术是为静态TSN的服务保证而开发的,TSSDN需要新的方法来充分利用其灵活性。例如,如何在应用的截止时间内找到运行时配置。在这篇论文中,我们为TSSDN中的多样化流量开发了技术,以在各种场景下保持服务保证。我们做出了四项贡献,如下所述。我们的第一项贡献解决了使用TSSDN的重新配置能力在运行时恢复故障的基本问题之一:是否可以在响应时间限制内计算恢复路线和时间表。我们提出了一个三模式方法来在运行时恢复TSSDN中的安全关键流。当发生故障时,TSSDN利用其SDN能力重新路由流以维持功能。如果不可行,则通过模式切换降级服务。为了满足严格的响应时间要求,我们提出了两种方法来计算恢复路线和时间表,包括基于整数线性规划(ILP)的方法和多项式时间启发式算法。我们还开发了基于响应时间和可靠性影响评估这些解决方案的方法。我们的评估表明,运行时恢复可以将网络的平均故障间隔时间(MTTF)提高高达2倍,同时计算时间在100毫秒内。我们的第二项贡献弥合了TSSDN的动态恢复行为与其设计时可靠性要求之间的差距。我们提出了一个设计时网络规划方法,为受运行时恢复保护的TSSDN提供保证的可靠性。我们的解决方案探索了拓扑设计和ASIL分配问题,使用强化学习(RL)。我们开发了RL代理构建网络拓扑的技术,基于动态动作空间。此外,我们实现了RL环境,检查TSSDN以强制执行其特定领域的可靠性要求。与传统手动设计相比,我们的解决方案可以在更多设计场景中提供可靠性保证,同时将网络成本降低高达6.8倍。我们的第三项贡献将可组合性引入了软实时流的管理方案。因此,修改运行时的流不会破坏其他流量类别中已建立的时序保证。我们提出了一个按类别管理的方案,以可组合的方式设计。为了隔离不同流量类别之间的管理逻辑,我们提出了可组合的最坏情况端到端延迟(WCED)分析,无需知道其他流量类别的确切流设置即可获得延迟界限。基于此分析,可以独立处理各个流量类别的动态路由请求。根据我们的实验,可组合分析带来了2.6倍的速度提升,而找到一个流的路由平均需要0.14秒。在最后一项贡献中,我们开发了一个基本的见解,导致了一种高度可扩展的方法,用于在网络启动时合成软实时流的配置。与现有工作通过路由强制延迟保证不同,我们的见解是通过带宽分配来解决延迟保证问题,这显著降低了问题的复杂性。我们进一步分析了软实时流的WCED,并推导出了一个多项式时间算法,用于分配带宽,同时考虑流的截止时间。这允许我们将AVB流路由问题简化为具有简单约束的混合整数线性规划(MILP)问题。我们的解决方案将带宽分配和路由方法结合起来,与现有设计时解决方案相比,速度提高了14.3倍。
第1章 引言 介绍了汽车网络在过去十年中的发展,以及TSN和SDN的结合如何满足汽车系统对有界延迟和传输可靠性的要求。讨论了TSSDN面临的挑战,包括如何在保持服务保证的同时利用SDN的灵活性,以及新兴应用对新服务保证的需求。提出了论文的主要贡献,包括运行时恢复、设计时网络规划、软实时流的可组合管理以及网络启动时的配置合成。
第2章 背景和系统模型 介绍了TSN网络的建模,包括网络拓扑、流量建模、TSN中的流量整形以及TT流量的调度模型。还讨论了AVB流量的端到端延迟分析。
第3章 TT流量的运行时恢复 提出了一个三模式方法来在运行时恢复TSSDN中的TT流量。当发生故障时,TSSDN尝试通过重新路由流量来维持功能。如果不可行,则通过模式切换降级服务。提出了两种方法来计算恢复路线和时间表,包括基于ILP的方法和多项式时间启发式算法。还开发了基于响应时间和可靠性影响评估这些解决方案的方法。
第4章 基于RL的TSSDN网络规划 提出了一个设计时网络规划方法,为受运行时恢复保护的TSSDN提供保证的可靠性。解决方案探索了拓扑设计和ASIL分配问题,使用强化学习(RL)。开发了RL代理构建网络拓扑的技术,基于动态动作空间。此外,实现了RL环境,检查TSSDN以强制执行其特定领域的可靠性要求。
第5章 AVB流量的按类别管理 提出了一个按类别管理的方案,以可组合的方式设计。为了隔离不同流量类别之间的管理逻辑,提出了可组合的最坏情况端到端延迟(WCED)分析,无需知道其他流量类别的确切流设置即可获得延迟界限。基于此分析,可以独立处理各个流量类别的动态路由请求。
第6章 AVB流量的路由和带宽分配 提出了一个高度可扩展的方法,用于在网络启动时合成软实时流的配置。通过带宽分配来解决延迟保证问题,这显著降低了问题的复杂性。推导出了一个多项式时间算法,用于分配带宽,同时考虑流的截止时间。这允许将AVB流路由问题简化为具有简单约束的混合整数线性规划(MILP)问题。
第7章 结论和未来工作 总结了论文的主要贡献,并讨论了未来研究的机会。提出了管理大规模TSSDN、可靠控制逻辑、对损坏和攻击的弹性以及运行时恢复的形式化验证等未来研究方向。