QoS 是一个很大的领域,涉及到网络中的多个层次和环节。本文仅简要的谈谈 Endpoint 侧的 QoS 概念,将这些纷繁的概念名词串起来,便于理解。
QoS 技术背景
下图说明了 QoS workflow 中,各项技术的位置和关系
当流量进入设备后,它依次经过 mark(标记)→ meter(计量) → police(管制) → class/dscp(重分类) → queue(队列) → sharper(整形) → queue priority (优先级调度). meter + police 完成 rate-limit 功能。 而 queue + sharping + priority 完成 congestion manager 功能。sharping 功能属于可选项。
细解释其中的专业术语和实现特点
- Classification and marking
- Metering
- Policing
- Shaping
- Scheduling
- Congestion management
- 分类:将数据分为不同的类别,称为分类(classification),分类并不修改原来的数据包。
- 标记:将数据设置为不同的优先级称为标记(marking),而标记会修改原来的数据包。
- 流量计量:流量计量可以通过漏桶算法(常用于ATM网络)或令牌桶算法(常用于IP网络)实现。计量后的数据包会根据不同的整形类别分别保存在缓冲区中,待满足对应的流量资料后再进行发送。
- 流量管制:丢弃超出带宽,称为管制(Policing)。
- 流量整形:将超出的带宽缓存在内存中,等到下一秒再传递,这种行为称为Shaping。典型作用是限制流出某一网络的某一连接的流量与突发,使这类报文以比较均匀的速度向外发送,以符合种给定的“流量资料”(traffic profile)。
- 队列调度机制:在QoS技术体系中属于拥塞管理的范畴。
- 拥塞管理:当网络发生拥塞后,数据还是要被传递的,正因为接收到的数据远多于自身的传输能力,所以数据被传输时就出现了先后顺序,而依照什么样的方式来传数据,就需要队列的指导,QOS中的队列定义了数据包被传输的先后顺序。如果处理方式为管制,那么数据包就会被丢弃,通常情况下,网络设备默认丢弃后到的数据包而传输先到的数据包,这样的丢弃方式称为尾丢弃。
流量整形(traffic shaping)常与流量监管(traffic policing)混淆。它们的主要区别在于,流量整形是一种主动调整流量输出速率的措施。流量整形对流量监管中需要丢弃的报文进行缓存——通常是将它们放入缓冲区或队列内,再根据特定算法均匀的向外发送这些被缓存的报文。但这不代表流量整形不会丢弃报文。shaping可能会增加延迟,而policing几乎不引入额外的延迟。
通常的实现方式
- Marking: fwmark, ToS/IPP/DSCP
- Metering: token bucket, trTCM, mark ToS/IPP/DSCP
- Policing per interface (egress)
- Shaping per interface (egress)
- Scheduling: Priority Queuing
- Congestion management: Taildrop
标记方式
实现 QoS 的一个最基本的方法就是分类和标记。
ToS/IPP/DSCP 是 IP头部的一个名为 ToS 字段。用于标记服务类型。这个字段随着发展,被不断的赋予了新的定义。见下表:
ToS/IPP:根据RFC791定义,IP报文头ToS(Type of Service)域由8个比特组成,其中3个比特的 Precedence 字段标识了 IP 报文的优先级
DSCP:差分服务代码点(Differentiated Services Code Point)RFC2474 重新定义了 IP 报文中的 ToS 域,增加了C比特,表示传输开销(Monetary Cost)。
下图是RFC1349 定义的每个位的意义:
上图示例了一些协议应该如何设置(4~1)位:
到了 RFC2474 , IPP的的意义就发生了变化。而 DTR位意义不变。IPP 与 DSCP 相应存在一个转换关系。DSCP 可以看成定义了一系列队列类别,下表列出一部分:
在路由器中,一般都是把 CS6 和CS7 中的数据用 PQ 做绝对优先处理,无论下面是否有数据也是要优先来传递这两个队列中的数据。而其他EF到AF1的队列中是用 WFQ 来做的,保证所有队列都可以得到带宽来传输。
PQ(Priority Queueing,优先队列):PQ会先服务高优先级的子队列,若高优先级子队列里没有数据后,再服务中等优先级子队列,依次类推。如果PQ正在服务中等优先级子队列,但是高优先级里又来了数据包,则PQ会中断中等优先级子队列的服务,转而服务高优先级子队列。
WFQ(Weighted Fair Queueing,加权公平队列):可以保证相同优先级业务间公平,不同优先级业务间加权。
计量算法
令牌桶算法(Token Bucket)
有时人们将漏桶算法与令牌桶算法错误地混淆在一起。而实际上,这两种算法具有截然不同的特性并且为截然不同的目的而使用。它们之间最主要的差别在于:漏桶算法能够强行限制数据的传输速率,而令牌桶算法能够在限制数据的平均传输速率的同时还允许某种程度的突发传输。
双速率三色标记器(trTCM)
基于令牌桶算法做计量器
管制支持
Ingress policing per interface provided by the Fast Path QoS module. QoS basic 支持对 入口流量做管制。 QoS advance 仅支持对 出口流量做管制。管制也即丢弃。
队列调度算法
Priority Queuing
在报文到达接口后,首先对报文进行分类,然后按照报文所属类别让报文进入所属队列尾部,在报文发送时,按照优先级,总是在所有优先级较高队列中报文发送完毕后,再发送低优先级队列中报文,这样,在每次发送报文时,总是将优先级高的报文先发出去,保证了属于较高优先级队列报文有较低时延,所以PQ的优缺点是很明显的:优点是可以保证高优先级队列的报文可以得到较大带宽、较低的时延、较小的抖动;缺点是低优先级队列的报文不能得到及时的调度,甚至得不到调度,即会出现“饿死”现象。
PQ具有如下特征:
(1) 报文丢弃策略采用 Tail Drop 机制;
(2) 每个队列内部使用FIFO逻辑;
(3) 当从队列调度报文时,先从高优先级的队列调度报文
从上面可以看出,PQ一般的应用场合是保证某类流量尽可能得到最好的服务,而不管其它流量的“死活”。
拥塞管理算法
与调度算法相匹配,使用简单的尾部丢弃算法(tail drop)
上述的这些实现方式,按照文章中的第一个 workflow 图,被串起来,对流量进行控制。各种 Endpoint QoS 实现,都无出本文之右。