(7) TIME_WAIT

TIME_WAIT 发生的场景

TCP 连接终止时，主机1 先发送 FIN 报文，主机2 进入 CLOSE_WAIT 状态，并发送一个 ACK 应答，同时，主机2 通过 read 调用获得 EOF，并将此结果通知应用程序进行主动关闭操作，发送 FIN 报文。主机1 在接收到 FIN 报文后发送 ACK 应答，此时主机1 进入 TIME_WAIT 状态。

主机1 在 TIME_WAIT 停留持续时间是固定的，是最长分节生命期 MSL（maximum segment lifetime）的两倍，一般称之为 2MSL。Linux 系统里有一个硬编码的字段，名称为TCP_TIMEWAIT_LEN，其值为 60 秒。也就是说，Linux 系统停留在 TIME_WAIT 的时间为固定的 60 秒。

#define TCP_TIMEWAIT_LEN (60*HZ) /* how long to wait to destroy TIME-WAIT state, about 60 seconds  */

注：只有发起连接终止的一方会进入 TIME_WAIT 状态。

TIME_WAIT 的作用

为什么不直接进入 CLOSED 状态，而要停留在 TIME_WAIT 这个状态？

(1) 为了确保最后的 ACK 能让被动关闭方接收，从而帮助其正常关闭。

如果图中主机1 的 ACK 报文没有传输成功，那么主机2 就会重新发送 FIN 报文。如果主机1 没有维护 TIME_WAIT 状态，而直接进入 CLOSED 状态，它就失去了当前状态的上下文，只能回复一个 RST 操作，从而导致被动关闭方出现错误。现在主机1 知道自己处于 TIME_WAIT 的状态，就可以在接收到 FIN 报文之后，重新发出一个 ACK 报文，使得主机2 可以进入正常的 CLOSED 状态。

(2) 为了让旧连接的重复分节在网络中自然消失。

在网络中，经常会发生报文经过一段时间才能到达目的地的情况，如路由器重启，链路突然出现故障等。如果原连接中断后，又重新创建了一个原连接的“化身”，说是化身其实是因为这个连接和原先的连接四元组完全相同，如果迷失报文经过一段时间也到达，那么这个报文会被误认为是连接“化身”的一个 TCP 分节，这样就会对 TCP 通信产生影响。

注：TCP 就设计出了这么一个机制，经过 2MSL 这个时间，足以让两个方向上的分组都被丢弃，使得原来连接的分组在网络中都自然消失，再出现的分组一定都是新化身所产生的。

TIME_WAIT 的危害

对内存资源的占用，这个目前看来不是太严重，基本可以忽略。
对端口资源的占用，一个 TCP 连接至少消耗一个本地端口。一般可以开启的端口为 32768～61000 ，也可以通过net.ipv4.ip_local_port_range指定，如果 TIME_WAIT 状态过多，会导致无法创建新连接。

如何优化 TIME_WAIT？

(1) 通过 sysctl 命令，将 net.ipv4.tcp_max_tw_buckets 调小

这个值默认为 18000，当系统中处于 TIME_WAIT 的连接一旦超过这个值时，系统就会将所有的 TIME_WAIT 连接状态重置，并且只打印出警告信息。这个方法过于暴力，而且治标不治本，带来的问题远比解决的问题多，不推荐使用。

(2) 调低 TCP_TIMEWAIT_LEN，重新编译系统

这个方法是一个不错的方法，缺点是需要“一点”内核方面的知识，能够重新编译内核。

(3) 设置 SO_LINGER

“linger”的意思为停留，我们可以通过设置套接字选项，来设置调用 close 或者 shutdown 关闭连接时的行为。

int setsockopt(int sockfd, int level, int optname, const void *optval,  socklen_t optlen);

struct linger {
     int　 l_onoff;　　　　/* 0=off, nonzero=on */
     int　 l_linger;　　　　/* linger time, POSIX specifies units as seconds */
}

如果l_onoff为 0：那么关闭本选项。l_linger的值被忽略，这对应了默认行为，close 或 shutdown 立即返回。如果在套接字发送缓冲区中有数据残留，系统会将试着把这些数据发送出去。
如果l_onoff为非 0，且l_linger值也为 0：那么调用 close 后，会立该发送一个 RST 标志给对端，该 TCP 连接将跳过四次挥手，也就跳过了 TIME_WAIT 状态，直接关闭。这种关闭的方式称为“强行关闭”。在这种情况下，排队数据不会被发送，被动关闭方也不知道对端已经彻底断开。只有当被动关闭方正阻塞在recv()调用上时，接受到 RST 时，会立刻得到一个“connet reset by peer”的异常。
如果l_onoff为非 0，且l_linger的值也非 0：那么调用 close 后，调用 close 的线程就将阻塞，直到数据被发送出去，或者设置的l_linger计时时间到。