网络拥塞 (Congestion)是由多个传输流需要共享(争用)网络内资源造成的。当资源需求超过网络容量时,就会产生问题,每条流不知道当前网络资源分配情况,每条流也不知道其它(竞争)流的存在,从而导致丢包率升高、往返时间增大、甚至网络崩溃。如何协调网络内各条流,使其可以高效利用网络资源?
拥塞控制(congestion control)是TCP协议的一项重要功能,TCP的拥塞控制机制是从端到端的角度,推测网络是否发生拥塞,如果推断网络发生拥塞,则立即将数据发送速率降下来,以便缓解网络拥塞。
TCP的拥塞控制采用的是窗口机制,通过调节窗口的大小实现对数据发送速率的调整。TCP的发送端维持一个称为拥塞窗口cwnd的变量,单位为字节,用于表示在未收到接收端确认的情况下,可以连续发送的数据字节数。cwnd的大小取决于网络的拥塞程度,并且动态地发生变化。拥塞窗口调整的原则是:只要网络没有出现拥塞,就可以增大拥塞窗口,以便将更多的数据发送出去,相当于提高发送速率;一旦网络出现拥塞,拥塞窗口就减小一些,减少注入网络的数据量,从而缓解网络的拥塞。
发送端判断网络发生拥塞的依据是:发送端设置一个重传计时器RTO,对于某个已发出的数据报文段,如果在RTO计时到期后,还没有收到来自接收端的确认,则认为此时网络发生了拥塞。
TCP的拥塞控制算法包括了慢启动(slow start)、拥塞避免(congestion avoidance)、快速重传(fast retransmit)和快速恢复(fast recovery)四部分。
慢启动
慢启动算法作用在TCP数据传输的开始阶段,当主机开始发送数据时,因为不知道网络中的负荷情况,如果立即发送大量的数据,有可能会引起网络的拥塞。因此,TCP采用试探的方法,逐渐增大拥塞窗口。通常在刚开始发送数据报文段时,先将拥塞窗口cwnd设置为一个TCP最大段长度MSS的值。而在每收到一个数据报文段的确认后,cwnd就增加一个MSS的数值。这样就可以逐渐增大发送端的拥塞窗口,使数据注入网络的速率比较合理。如果定义从发送端发出一个数据报文段到收到这个数据报文段的确认的时间间隔为往返时间RTT,则在慢启动阶段,每经过一个RTT,cwnd的值就加倍。值得注意的是,慢启动并不是说启动过程增长慢,而是说初始的发送窗口小。
拥塞避免
为了防止拥塞窗口增长过快而引起网络拥塞,TCP还需要设置一个慢启动阈值ssthresh,当拥塞窗口的值增加到ssthresh时,就要减缓拥塞窗口的增长速度,具体的做法是每经过一个RTT,拥塞窗口cwnd的值加1(单位为MSS),这样就可以使cwnd按线性规律缓慢增长,这个过程称之为“加性增加”(Additive Increase)算法。通常情况下,拥塞窗口cwnd的初值被设置为1,慢启动阈值ssthresh的初值被设置为16。当拥塞避免算法执行到某个时刻,发送端在规定时间内没有收到接收端的确认,即发生了网络超时,则意味着网络发生了拥塞。此时,发送端首先将ssthresh的值变为发生超时时cwnd值的一半,同时将cwnd的值置为1,重新执行慢启动算法。这样做的好处是,当网络频繁出现拥塞时,ssthresh下降得很快,可以大大减少注入网络中的数据报文段。通常称这个过程为“乘性减小”(MultiplicativeDecrease)算法。TCP中的“加性增加”和“乘性减小”算法合起来称为AIMD算法。
慢启动和拥塞避免是 1988 年提出的拥塞控制算法, 1990 年在此基础上又增加了快速重传和快速恢复两个算法。
快速重传
快速重传算法的基本思想是:接收端每收到一个失序的数据报文段后就立即发出重复确认,以便更早地通知发送端有丢包的情况发生。假设在某个TCP数据传输过程中,接收端依次收到发送端发出的1号和2号数据报文段,并对这两个数据报文段发送确认后,没有按次序收到3号数据报文段,而是收到了4号,这时就需要立即向发送端发送一个2号数据报文段的确认,称为重复确认。同理,如果继续收到5号、6号数据报文段,接收端仍然要向发送端发出2号数据报文段的重复确认。此时,发送端会收到多个2号数据报文段的重复确认,则认为3号数据报文段发生了丢包,需要立即向接收端重传3号数据报文段,而不需要等待重传计时器到期再重传。快速重传算法中规定如果收到某数据报文段的三个重复确认,则立即重传下一个数据报文段。使用快速重传比用超时重传快很多,超时重传中间只能等待不能做任何事,而且又要重新慢启动,因此要尽量用快速重传。要知道,ACK指的是下一个期望的数据包,如果发送方一直收到ACK,说明接收方没有收到那个包,因此要快速重传。
快速恢复
快速恢复是配合快速重传使用的算法,其基本思想是:当发送端连续收到三个重复确认时,就将慢启动阈值ssthresh减半,以预防网络拥塞的发生,并且将拥塞窗口cwnd的值置为减半后的ssthresh,然后开始执行拥塞避免算法,使得cwnd缓慢地加性增大。