操作系统

摘自《程序员面试白皮书》

进程 vs.线程

进程(process)与线程(thread)最大的区别是进程拥有自己的地址空间,某进程内的线程对于其他的进程不可见,即进程 A 不能通过传地址的方式直接读写进程 B 的存储区域。进程之间的通信需要通过进程间通信(Inter-process communication, IPC)。与之相对的,同一进程的各线程间可以直接通过传递地址或全局变量的方式传递信息。

此外,进程作为操作系统中拥有资源和独立调度的基本单位,可以拥有多个线程。通常操作系统中运行的一个程序就对应一个进程。在同一进程中,线程的切换不会引起进程切换。在不同的进程中进行线程切换,若从一个进程内的线程切换到另一个进程中的线程时,会引起进程切换。相比进程切换,线程切换的开销要小很多。线程与进程相结合能够提高系统的运行效率。

线程可以分为两类: 一类是用户级线程(user level thread)。对于这类线程,有关线程管理的所有工作都由应用程序完成,内核意识不到线程的存在。在应用程序启动后,操作系统分配给该程序一个进程号,以及其对应的内存空间等资源。应用程序通常现在一个线程中运行,该线程被称为主线程。在其运行的某个时刻,可以通过调用线程库中的函数创建一个在相同进程中运行的新线程。用户级线程的好处是非常高效,不需要进入内核空间,但并发效率不高。

另一类是内核级线程(kernel level thread)。对于这类线程,有关线程管理的所有工作由内核完成,应用程序没有进行线程管理的代码,只能调用内核线程的接口。内核维护进程及其内部的每个线程,调度也有内核基于线程架构完成。内核级线程的好处是,内核可以将不同的线程更好地分配到不同的 CPU,以实现真正的并行计算。

事实上,在现代操作系统中,往往使用组合方式实现多线程,即线程创建完全在用户空间中完成,并且一个应用程序中的多个用户级线程被映射到一些内核级线程上,相当于是一种折中方案。

上下文切换

对于单核单线程 CPU 而言,在某一时刻只能执行一条 CPU 指令。上下文切换(context switch)是一种将 CPU 资源从一个进程分配给另一个进程的机制。从用户角度看,计算机能够并行运行多个进程,这恰恰是操作系统通过快速上下文切换造成的结果。在切换的过程中,操作系统需要先存储当前进程的状态(包括内存空间的指针,当前执行完的指令等等),在读入下一个进程的状态,然后执行此进程。

系统调用

系统调用(system call)是程序向系统内核请求服务的方式。可以包括硬件相关的服务(访问硬盘等),或者创建进程,调度其他进程等。系统调用是程序和操作系统之间的重要接口。

Semaphore/Mutex

当用户创立了多个线程/进程时,如果不同线程/进程同时读写相同的内容,则可能造成读写错误,或者数据不一致。此时,需要通过加锁的方式,控制核心区域(critical section)的访问权限。对于 semaphore 而言,在初始化变量的时候可以控制允许多少个线程/进程同时访问一个 critical section,其他的线程/进程会被堵塞,直到有人解锁。Mutex 相当于只允许一个线程/进程访问的 semaphore。此外,根据实际需要,人们还实现了一种读写锁(read-write lock),它允许同时存在多个 reader,但任何时候之多只有一个 writer,且不能和 reader 共存。

死锁

在引入锁的同时,我们遇到了一个新的问题:死锁(dead lock)。死锁是指两个或多个线程/进程之间相互阻塞,以至于任何一个都不能继续运行,因此也不能解锁其他线程/进程。例如,线程 1 占有锁 A,并且尝试获取锁 B;而线程 2 占有锁 B,并尝试获取锁 A。此时,两者相互阻塞,都无法继续运行。

总结产生死锁的四个条件(只有当四个条件同时满足时才会产生死锁):

  1. Mutual Exclusion – Only one process may use a resource at a time
  2. Hold-and-Wait – Process holds resource while waiting for another
  3. No Preemption – Can’t take a resouce away from a process
  4. Circular Wait – The waiting processes form a cycle

生产者消费者

生产者消费者模型是一种常见的通信模型:生产者和消费者共享一个数据管道,生产者将数据写入 buffer,消费者从另一头读取数据。对于数据管道,需要考虑为空和溢出的情况。同时,通常还需要将这部份共享内存用 mutex 加锁。在只有一个生产者消费者的情况下,可以设计无锁队列(lockfree queue),线程安全地直接读写数据。

进程间通信

在介绍进程的时候,我们提起过不能直接读写另一个进程的数据。两者之间的通信需要通过进程间通信(inter-process communication,IPC)进行。进程通信的方式通常遵循生产者消费者模型,需要实现数据交换和同步两大功能。

  1. Shared-memory + semaphore: 不同进程通过读写操作系统中特殊的共享内存进行数据交换,进程之间用 semaphore 实现同步。
  2. Message passing: 进程在操作系统内部注册一个端口,并检测有没有数据,其他进程直接写数据到该端口。该通信方式更加接近与网络通信方式。事实上,网络通信也是一种 IPC,知识进程分布在不同机器上而已。

网络

摘自《程序员面试白皮书》

网络分层

计算级之间的交互模型通常是指 Open System Interconnection model (OSI), 该模型将网络通信系统抽象成了七层。因其不太实用,工业界普遍使用简化的 TCP/IP 五层模型。

osi-model

  • 应用层 针对特定的协议,为应用程序做服务,比如 SMP,POP3,SSH,FTP 等协议。
  • 表示层 负责数据格式的转换,把不同表现形式的信息转换成适合网络传输的格式。
  • 会话层 负责建立和断开通信连接,什么时候建立连接,什么时候断开连接以及保持多久的连接。
  • 传输层 在两个通信节点之间负责数据的传输,起着可靠传输的作用。(运行在这一层的设备有四层交换机,四层路由器)
  • 网络层 路由选择,在多个网络之间转发数据包,负责将数据包传送到目的地址。(运行在这一层的设备有路由器,三层交换机)
  • 数据链路层 负责物理层面互联设备之间的通信传输,比如一个以太网相连的两个节点之间的通信,是数据帧与 1、0 比特流之间的转换。(运行在这一层的设备是网桥、以太网交换机、网卡)
  • 物理层 主要是 1、0 比特流与电子信号的高低电平之间的转换。(运行在这一层的设备是中继器、双绞线)

路由

从用户角度看,路由(routing)是指将数据从一个用户终端,通过网络节点(例如路由器、交换机等),发送到另一个用户节点的过程。理论上说,对于一个拥有多个节点的拓扑网络而言,路由是指在 Network Layer(OSI model 的第三层)将数据包(data packet)从一个节点以最优的路径发送到目标节点的实现方法。其核心包括:如何获得邻近节点的信息,如何估计链路质量,如何寻址,如何构建网络拓扑等等。通过路由器之间的路由协议(routing protocol)可以实现两个网络节点之间信息(包括网络域名,邻近节点,链路质量等)的交换和散布,通过不断重复该过程,每个节点都会获得足够多关于所在网络的拓扑信息。当有数据包需要传送时,路由器再通过路由算法(routing algorithm)计算传递当前数据包的最优路径,并把数据包发送给下一个邻近节点。许多路由算法基于图理论,实现了最小生成树,最短路径等等经典的拓扑算法。

网络中,所谓地址是指 IP 地址,IPv4 规定利用 32bits 作为 IP 地址(即 4bytes,也就是我们常看到的 x.x.x.x,x 在 0-255 之间,2^8-1=255)。但随着网络设备的增多,IPv4 已经不能满足人们的需求,故互联网逐渐向 IPv6 进行演进,IPv6 利用 128bits 作为 IP 地址。

事实上,直观而言,network routing 的过程就相当于传统意义上的邮包寄送,IP 地址可以类比于邮政编码,路由器就相当于邮局,通过目的地邮政编码与邮局系统中的递送路径进行比较,由此确定下一步应该把当前包裹传递到哪里。

网络统计指标

带宽/速率(Bandwidth/Rate)

所谓带宽是指一个网络节点能以多快的速度将数据接收/发送出去,单位时 bits per second(bps)。对于实时性要求不高的数据,例如下载等,带宽时影响用户体验的主要因素。两个终端节点之间的带宽由路径中所有节点的最小带宽决定。同时,重算的数据发送速度不应超过当前的上载带宽,否则会对网络造成压力导致拥塞(congestion)。

One-way Delay/Round Trip Time

One-way Delay 用以衡量网络的延迟。假设在时间点 A 从一个节点发送数据到另一个节点,目的节点在时间 B 收到数据,则两个时间点之差即为 One-way Delay. 类似的,RTT 则是数据完成一个 Round Trip 回到始发节点的时间差,一般 RTT 可以近似估计为 One-way Delay 的两倍。对于网络会议,IP 电话等,延迟时影响用户体验的主要因素。延迟可能是由网络中某个节点处理数据速度慢,突然有大规模数据需要传输,或者某条链路不断重传数据造成的。延迟与带宽有一定的相关性,但没有必然联系。

TCP vs. UDP

在 Transport Layer,数据流被分块传输。最常见的协议是 TCP 和 UDP。

TCP

Reliable Protocol TCP(Transmission Control Protocol)是一种可靠的传输协议,在网络条件正常的情况下,TCP 协议能够保证接收端收到所有数据,并且接受到的数据顺序与发送端一致。TCP 通过在发送端给每个数据包分配单调递增的 sequence number,以及在接收端发送 ACK(acknowledgement)实现可靠传输。每个发送的数据包都包含序列号,当接收端收到数据包时,会发送 ACK 告诉发送端当前自己期待的下一个序列号是多少。例如,发送端分别发送了序列号为 99、100、101、102 的四个数据包,接收端收到数据包 99 后,会发送 ACK 100,意味着接收端期待下一个数据包编号 100. 如果由于某些原因,数据包 100 没有到达接收端,但数据包 101、102 到达了,那么接收端会继续发送 ACK 100. 当发送端发现当前发送的数据包编号超过了 100,但接收端仍然期望收到 100,那么发送端就会重新发送数据包 100. 如果接收端收到了重新发送的数据包 100,那么接收端会回复 ACK 103,继续进行剩下的数据传输,并且把数据包 99、100、101、102 按顺序传递给上一层。

Flow Control TCP 使用了 end-toend flow control 以避免发送端发送数据过快导致接收端无法处理。TCP 采用了滑动窗口(sliding window)实现流量控制。接收端通过 ACK 告诉发送端自己还能接收多少数据,发送端不能发送超过该值的数据量。当接收端返回的窗口大小为 0 时,发送端停止发送数据,直到窗口大小被更新。由于 ACK 是由发送端发送的数据触发,可能接收端窗口已经打开,但是由于发送端已经停止发送,故接收端没有机会通过 ACK 告知发送端新的窗口大小,在这种情况下会造成死锁。在实际实现中,发送端会设置一个 timer,如果 timer 到期,发送端会尝试发送小数据包,以触发接收端 ACK.

Congestion Control 为了控制传输速度防止堵塞网络,并且在网络容量允许的范围内尽可能多的传输数据,TCP 引入 congestion control,用以判断当前的网络负荷,并且调整传输速率。TCP 通常采用 additive increase,multiplicative decrease 的算法,即如果按时收到对应的 ACK,则下一次传输速率线性增加,否则视为发生了网络拥塞,下一次传输的比特数折半。所谓的“按时”基于 RTT:发送端会估计 RTT,并且期望当数据包发送以后,在 RTT 时间内收到对应的 ACK。现在 TCP 需要分别实现 slow-start,congestion avoidance,fast retransmit 和 fast-recovery,以达到最高的效率。

UDP

相比与 TCP,UDP(User Datagram Protocol)简单许多:连接建立时不需要经过类似于 TCP 的三次握手,只需要知道接收端的 IP 和端口,发送端就可以直接发送数据。同时,UDP 也没有 ACK,flow control 和 congestion control,故 UDP 相较 TCP 传输更快,使用起来更简单。

UDP 介绍

摘自《计算机网络 第四版》

UDP 面向无连接,它传输的数据段(segment)是由 8 字节的头和净荷域构成的。头包含源端口和目标端口,各占 16 位,共 4 字节。两个端口分别被用来标识源机器和目标机器内部的端点。当一个 UDP 分组到来的时候,它的净荷部分被递交给与目标端口相关联的那个进程。这种关联关系是在调用了 bind 原语或者其他某一种类似的做法之后建立起来的。实际上,采用 UDP 而不是原始的 IP,其最主要的价值是增加了源端口和目标端口。如果没有端口域,则传输层将不知道该如何处理分组;而有了端口之后,它就可以正确地提交数据段了。

当目标端必须将一个应答送回给源端地时候,源端口是必须地。发送应答的进程只要将进来的数据段中的 source port 域复制道输出的数据段中的 destination port 域,就可以指定在发送方机器上由哪个进程来接受应答。

另外值得提出来的可能是 UDP 没有做到一些事情。UDP 并不考虑流控制、错误控制,在收到一个坏的数据段之后它也不重传。所有这些工作都留给用户进程。UDP 所作的事情就是提供一个接口,并且在接口中增加复用(demultiplexing)的特性。他利用端口的概念将数据段解复用到多个进程中。这就是它所做的全部工作。

UDP 尤其适用域 C-S 架构下,客户端给服务器发送一个短的请求,并且期望一个短的应答回来,如果请求或者应答丢失,只需要超时重传。

UDP 的一个应用时 DNS(Domain Name System),简单来说,如果一个程序需要根据某一个主机名(比如 www.cs.berkeley.edu)来查找它的 IP 地址,那么,它可以给 DNS 服务器发送一个包含该主机名的 UDP 分组。服务器用一个包含该主机 IP 地址的 UDP 分组作为应答。实现不需要建立连接,事后也不需要释放连接。在网络上只要两条消息就够了。DNS 在进行区域传输 (主从 dns server 之间的数据同步) 的时候使用 TCP,普通的查询使用 UDP。因为普通查询数据量小,比较适合用 udp 这种速度更快。

RPC

从某种意义上讲,向一台远程主机发送一个消息并获得一个应答,就如同在编程语言中执行一个函数调用一样。在这两种情况下,你都要提供一个或多个参数,然后获得一个结果。这种现象导致人们试图将网络上的请求 - 应答交互过程,做成像过程调用那样可以进行类型匹配和转换。这样的结构是的网络应用更加易于编程,而且人们对这种处理方式也更加熟悉。例如,假设有一个名为getIPaddress(hostname)的过程,它的工作方式为:向 DNS 服务器发送一个 UDP 分组,然后等待应答,如果在规定的时间内没有接收到应答的话,则超时并重试。通过这种方式,网络的所有细节对于程序员而言全部隐藏。

这个领域中的关键工作由 Birrel 和 Nelson(1984)完成。简单来说:允许本地的程序调用远程主机上的过程。当机器 A 上的进程调用机器 B 上的一个过程的时候,机器 A 上的调用进程被挂起,而机器 B 上被调用的过程则开始执行。参数信息从调用方传输到被调用方,而过程的执行结果则从反方向传递回来。对于程序员而言,所有的消息传递都是不可见的。这项技术称为 RPC(Remote Procedure Call),目前已成为许多网络应用的基础。按照传统,调用过程称为客户,被调用过程称为服务器。

当然,RPC 不一定非得使用 UDP 分组,但是,RPC 和 UDP 是一对很好的搭档,而且,UDP 常常被用于 RPC。然而,当参数或者结果值可能超过最大的 UDP 分组的时候,或者当所请求的操作并不幂等(即不能安全地重复多次执行,比如计数器递增地操作)的时候,可能有必要建立一个 TCP 连接,然后利用该连接来发送请求,而不是使用 UDP 来完成远程调用。

RTC

UDP 的还被广泛应用在实时多媒体:Internet 广播电台、Internet 电话、音乐点播、视频会议、视频点播等。人们发现每一种应用都在重复设计几乎相同的实时传输协议,逐渐地人们意识到,为多媒体应用制定一个通用的协议是一个很好的想法,因此就诞生了 RTP(Real-time Transport Protocol)。

TCP 介绍

UDP 是一个简单的协议,它有一些非常合适的用途。但是对于大多数 Internet 应用来说,他们更需要可靠的,按序递交的特性。所以还需要另一个协议,这就是 TCP,目前它是 Internet 上承担任务最为繁重的一个协议。

TCP 是专门为了在不可靠的互联网上提供一个可靠的端到端字节流而设计的。每台支持 TCP 的机器都有一个 TCP 传输实体,它或者是一个库过程,或者是一个用户进程,或者是内核的一部分。在所有这些情形下,它管理 TCP 流,以及与 IP 层之间的接口。TCP 传输实体接受本地进程和用户数据流,并且将他们分割成不超过 64KB(在实践中,考虑到每个帧中都希望有 IP 和 TCP 头,所以通常不超过 1460 数据字节)的分片,然后以单独的 IP 数据报的形式发送每一个分片。当包含 TCP 数据的数据报到达一台机器的时候,他们被递交给 TCP 传输实体,然后 TCP 传输实体再重构出原始的字节流。

IP 层并不保证数据报一定被正确的递交到目标端,所以 TCP 需要判断超时的情况,并且需要根据需要重传数据报。即使被正确递交的数据报,也可能存在错序的问题,这也是 TCP 的责任,他必须把接收到的数据报按照正确的顺序重新装配成用户消息。

TCP 服务模型

要想获得 TCP 服务,发送方和接收方必须创建一种被称为套接字的端点。每个套接字有一个套接字号(地址),它是由主机的 IP 地址以及本地主机局部的一个 16 为数值组成的,此 16 为数值被称为端口(port)。端口是一个 TSAP 的 TCP 名字。为了获得 TCP 服务,首先必须要显示的再发送机器的套接字和接受机器的套接字之间建立一个连接。

一个套接字有可能同时被用于多个连接。换句话说,两个或者多个连接可能终止与同一个套接字。每个连接可以用两端的套接字标识符来标识,即(socket1, socket2)。TCP 不适用虚电路号或者其他的标识符。

1024 以下的端口号被称为知名端口(well-known port),其实就是系统保留端口,有很多约定的服务和特定的端口号对应,如 ssh 默认端口号是 22.

应用程序FTPTFTPTELNETSMTPDNSHTTPSSHMYSQL
端口21, 206923255380223306
传输层协议TCPUDPTCPTCPUDPTCPTCPTCP

所有的 TCP 连接都是全双工的,并且是点到点的。所谓全双工,意味着同时可在两个方向上传输数据;而点到点则意味着每个连接恰好有两个端点。TCP 并不支持多播或者广播传输模式。

一个 TCP 连接就是一个字节流,而不是消息流。端到端之间并不比保留消息的边界。例如,如果发送进程将 4 个 512 字节的数据块写到一个 TCP 流中,那么在接收进程中,这些数据有可能按 4 个 512 字节快的方式被递交,也可能是 2 个 1024 字节的数据块,或是一个 2048 字节的数据块,或者其他方式。接收方无法获知这些数据被写入字节流时候的单元大小。

正如 Unix 中文件一样,读文件的程序无法判断该文件是怎么写成的,是一次性还是分块写入,然而,程序也无意于去弄清这个事情。一个 TCP 软件不理解 TCP 字节流的含义,也无意于弄清其含义,一个字节就是一个字节而已。

当一个应用将数据传递给 TCP 的时候,TCP 可能立即将数据发送出去,也可能将它缓冲起来(为了收集更多的数据从而一次发送出去),这完全由 TCP 软件自己来决定。然而,有时候应用程序确实希望自己的数据立即被发送出去,例如,假设一个用户已经登陆到一台远程服务器上,用户每输入一行命令就会敲入回车键,这时候该命令行应该被立即发送到远程主机,而不应该缓冲起来等待下一行命令。为了强迫将数据发送出去,应用程序可以使用 PUSH 标志,它相当于告诉 TCP 不要延迟传输过程。

有关 TCP 服务的最后一个值得在这里提出来的特性是紧急数据(urgent data)。当一个交互用户通过敲入DEL或者CTRL-C来打断一个已经开始运行的远程计算过程的时候,发送方应用把一些控制信息放在数据流中,然后将它联通 URGETN 标志一起交给 TCP。这一事件将使得 TCP 停止继续积累数据,而是将该连接上已有的所有数据立即传输出去。当目标端接收到紧急数据的时候,接收方应用被中断(比如,按 Unix 的术语来说得到了一个信号),所以它停止当前正在做的工作,并且读入数据流以找到紧急数据。紧急数据的尾部应该被标记出来,所以,如何发现紧急数据要取决于具体的应用程序。这种方案基本上只是提供了一种原始的信号机制,其余的工作全部留给应用程序自己来处理。

TCP 协议

TCP 的一个关键特征,也是主导了整个协议设计的特征是,TCP 连接上的每个字节都有它独有的 32 位序列号。发送端和接收端的 TCP 实体以数据段的形式交换数据。TCP 数据段(TCP segment)是由一个固定的 20 字节的头(加上可选的部分)以及随后的 0 个或者多个数据字节构成的。TCP 软件决定数据段的大小,它可以将多次写操作的数据累积起来放到一个数据段中,也可以将一次写操作的数据分割到多个数据段中。有两个因素限制了段的长度:第一,每个数据段,包括 TCP 头在内,必须适合 IP 的 65515 字节净荷大小;其次,每个网络都有一个最大传输单元(Maximum Transfer Unit)MTU,每个数据段必须适合于 MTU。在实践中,MTU 通常是 1500 字节(以太网的净荷大小),因此它规定了数据段长度的上界。

tcp-head

  1. 源端口和目的端口,各占 2 个字节,分别写入源端口和目的端口;
  2. 序号(seq number),占 4 个字节,TCP 连接中传送的字节流中的每个字节都按顺序编号。例如,一段报文的序号字段值是 301,而携带的数据共有 100 字段,显然下一个报文段(如果还有的话)的数据序号应该从 401 开始;
  3. 确认号(ack number),占 4 个字节,是期望收到对方下一个报文的第一个数据字节的序号。例如,B 收到了 A 发送过来的报文,其序列号字段是 501,而数据长度是 200 字节,这表明 B 正确的收到了 A 发送的到序号 700 为止的数据。因此,B 期望收到 A 的下一个数据序号是 701,于是 B 在发送给 A 的确认报文段中把确认号置为 701;
  4. 数据偏移,占 4 位,它指出 TCP 报文的数据距离 TCP 报文段的起始处有多远;
  5. 保留,占 6 位,保留今后使用,但目前应都位 0;
  6. 紧急 URG,当 URG=1,表明紧急指针字段有效。告诉系统此报文段中有紧急数据;
  7. 确认 ACK,仅当 ACK=1 时,确认号字段才有效。TCP 规定,在连接建立后所有报文的传输都必须把 ACK 置 1;
  8. 推送 PSH,当两个应用进程进行交互式通信时,有时在一端的应用进程希望在键入一个命令后立即就能收到对方的响应,这时候就将 PSH=1;
  9. 复位 RST,当 RST=1,表明 TCP 连接中出现严重差错,必须释放连接,然后再重新建立连接;
  10. 同步 SYN,在连接建立时用来同步序号。当 SYN=1,ACK=0,表明是连接请求报文,若同意连接,则响应报文中应该使 SYN=1,ACK=1;
  11. 终止 FIN,用来释放连接。当 FIN=1,表明此报文的发送方的数据已经发送完毕,并且要求释放;
  12. 窗口,占 2 字节,指的是通知接收方,发送本报文你需要有多大的空间来接受;
  13. 检验和,占 2 字节,校验首部和数据这两部分;
  14. 紧急指针,占 2 字节,指出本报文段中的紧急数据的字节数;
  15. 选项,长度可变,定义一些其他的可选的参数。

注意:标志位ACK和确认序列号 ack,ack 是一个变量,它表示本机期待的下个包的序列号(seq),ack 的全称叫做 acknowledgement number. 而ACK是一个标志位,在 TCP 头部可以看到,标志位只能为 0 或 1,用来传输特定的信息。

TCP 连接的建立

关于 TCP 的三握四挥参见 1,讲的很详细,以下绝大部分参考自该文。

TCP 使用三步握手法建立连接。为了一个建立一个连接,某一方,比如说服务器,通过执行 LISTEN 和 ACCEPT primitives(既可以指定一个特定的源,也可以不指定)被动地等待一个进来地连接请求。

另一端,比如客户端,执行一个 CONNECT primitive,同时指定以下参数:它希望连接地 IP 地址和端口、它愿意接受地最大 TCP 分段长度,以及一些可选地用户数据(比如口令)。CONNECT primitive 发送一个 SYN=1 和 ACK=0 的 TCP 数据段,然后等待应答。

当这个数据段到达目标端的时候,那里的 TCP 实体查看一下是否有一个进程已经在 Destination port 域中指定的端口上执行的 LISTEN。如果没有的话,它送回一个设置了 RST 位的应答,以拒绝客户的连接请求。

如果某个进程正在监听端口,那么,TCP 实体将进来的 TCP 数据段交给该进程。然后该进程可以接受或者拒绝这个连接请求。如果它接受的话,则送回一个确认数据段。在正常情况下发送的 TCP 数据段顺序如图(a)所示。请注意,SYN 数据段只消耗 1 字节的序列号空间,所以它的确认是非常明确的,毫无二义性。

nKaiH1.png

如果两台主机同时企图在同样的两个套接字之间建立一个连接,则事件序列如上图(b)所示。这些事件的结果是,只有一个连接被建立起来,而不是两个,因为所有的连接都是由它们的端点来标识的。如果第一个请求导致建立了一个由 (x,y) 标识的连接,而第二个请求也建立了这样一个连接,那么,在 TCP 实体内部只有一个表项,即 (x,y).

具体来说:

  1. 一方(客户端)发起连接请求,发送一个包(seq=x,SYN=1,ACK=0),进入 SYN-SENT 状态;
  2. 另一方(服务端)收到请求,如果同意连接,则发出确认包(seq=y,ack=x+1,SYN=1,ACK=1),进入 SYN-RCVD 状态;
  3. 客户端收到确认的包后,也需要向服务端发送确认包(seq=x+1,ack=y+1,SYN=0,ACK=1),进入 ESTABLISHED 状态;
  4. 服务端收到确认的包后,进入 ESTABLISHED 状态,至此,连接已建立。

tcp-connect

为什么客户端最后还要发送一次确认?

假设客户端发送的第一个连接请求没有丢失,只是在网络节点中滞留的时间太长了,由于客户端没有收到服务端的回复,所以会超时重传,无论如何,客户端发送了两个连接请求,如果采用两次握手,那么服务端因为收到了两次连接请求,会开启两个连接在等待数据传输,这会造成资源浪费。而如果是三次握手才建立连接,那么服务端会等待客户端的确认,才会建立连接。而客户端本意只有一次连接请求,所以只会发送一次确认,服务端收到确认之后建立连接。而对服务端的第二个返回确认,客户端会置之不理,因为客户端本意只有一次连接而已。

TCP 连接的释放

虽然 TCP 连接是全双工的,但是,为了理解 TCP 连接的释放过程,最好将 TCP 连接看成一对单工连接。每个单工连接被单独释放,两个单工连接之间相互独立。为了释放一个连接,任何一方都可以发送一个设置了 FIN 位的 TCP 数据段,这表示它已经没有数据要发送了。当 FIN 数据段被确认的时候,这个方向上就停止传送新数据。然而,另一个方向上可能还在继续无限制地传送数据,当两个方向都停止的时候,连接才被释放。通常情况下,为了释放一个连接,需要 4 个 TCP 数据段:每个方向一个 FIN 和一个 ACK。然而,第一个 ACK 和第二个 FIN 有可能被包含在同一个数据段中,从而将总数降低到 3 个。

四次挥手。https://blog.csdn.net/qq_33951180/article/details/60767876 https://www.imooc.com/article/17411

具体来说:

  1. 一方(客户端)主动发送连接释放请求,发送一个包(seq=u,FIN=1),其序列号为 u,等于之前最后接收的包序列号加 1,进入 FIN-WAIT-1 状态;
  2. 另一方(服务端)收到释放请求,发出确认报文(seq=v,ack=u+1,ACK=1),进入 CLOSE-WAIT 状态。将 TCP 连接看成一对单工连接,此时客户端单方面停止向服务端发送消息,但服务端的发送还未停止,客户端仍要接收来自服务端的消息;这时服务端会通知上层应用客户端连接已经释放,但到服务端释放可能还需要一段时间;
  3. 客户端收到服务器的确认报文,进入 FIN-WAIT-2 状态;
  4. 服务端处理完自己的事情之后,向客户端发送连接释放确认报文(seq=w,ack=u+1,ACK=1,FIN=1),进入 LAST-ACK 状态;
  5. 客户端收到服务端的释放报文,必须发出确认报文(seq=u+1,ack=w+1,ACK=1),进入 TIME-WAIT 状态。此时连接还未释放,客户端会等待 2 个 MSL (Maximum Segment Lifetime) 时间,才会进入 CLOSED 状态;
  6. 服务端只要收到客户端的确认报文,立即进入 CLOSED 状态。

tcp-disconnect

为什么客户端最后还要等待 2MSL?

第一,保证客户端发送的最后一个 ACK 报文能够到达服务器,因为这个 ACK 报文可能丢失,站在服务器的角度看来,我已经发送了 FIN+ACK 报文请求断开了,客户端还没有给我回应,应该是我发送的请求断开报文它没有收到,于是服务器又会重新发送一次,而客户端就能在这个 2MSL 时间段内收到这个重传的报文,接着给出回应报文,并且会重启 2MSL 计时器。

第二,防止类似与“三次握手”中提到了的“已经失效的连接请求报文段”出现在本连接中。客户端发送完最后一个确认报文后,在这个 2MSL 时间中,就可以使本连接持续的时间内所产生的所有报文段都从网络中消失。这样新的连接中不会出现旧连接的请求报文。处在 TIME_WAIT 状态的两端端口都不能使用,等到 2MSL 时间结束后才能继续使用。当连接处于 2MSL 等待阶段时,任何迟到的报文段将会被丢弃。这样一来,就会有更大的机会让丢失的 ACK 字段再次被发送出去,并且也让“四次挥手”更加可靠。

HTTP 协议

  • HTTP 协议(HyperText Transfer Protocol,超文本传输协议)是因特网上应用最为广泛的一种网络传输协议,所有的 WWW 文件都必须遵守这个标准。
  • HTTP 是基于 TCP/IP 通信协议来传递数据(HTML 文件,图片文件,查询结果等)
  • HTTP 协议通常承载于 TCP 协议之上,有时也承载于 TLS 或 SSL 协议层之上,这个时候,就成了我们常说的 HTTPS。如下图

https

  • HTTP 是一个应用层协议,由请求和响应构成,是一个标准的客户端服务器模型。HTTP 是一个无状态的协议。
  • HTTP 默认的端口号为 80,HTTPS 的端口号为 443。

HTTP 状态码

类别原因
1XXInformational(信息性状态码)
2XXSuccess(成功状态码)
3XXRedirection(重定向)
4XXClient Error(客户端错误状态码)
5XXServer Error(服务器错误状态码)
200(OK 客户端发过来的数据被正常处理
204(Not Content 正常响应,没有实体
206(Partial Content 范围请求,返回部分数据,响应报文中由 Content-Range 指定实体内容

301(Moved Permanently) 永久重定向
302(Found) 临时重定向,规范要求,方法名不变,但是都会改变
303(See Other) 和 302 类似,但必须用 GET 方法
304(Not Modified) 状态未改变, 配合 (If-Match、If-Modified-Since、If-None_Match、If-Range、If-Unmodified-Since)
307(Temporary Redirect) 临时重定向,不该改变请求方法

400(Bad Request) 请求报文语法错误
401 (unauthorized) 需要认证
403(Forbidden) 服务器拒绝访问对应的资源
404(Not Found) 服务器上无法找到资源

500(Internal Server Error) 服务器故障
503(Service Unavailable) 服务器处于超负载或正在停机维护

References

  1. 5 分钟让你明白 HTTP 协议
  2. LRU 缓存算法
  3. HTTP 协议及其工作流程
  4. TCP 的三次握手与四次挥手(详解 + 动图)