在前端开发中,衡量WEB页面的性能时,有个非常重要的指标 —— FP(First Paint)—— 指从页面加载到首次开始绘制的时长。这个指标会很大程度上影响用户的跳出率。更快的页面响应意味着更多的PV、更高的参与度,以及更高的转化率。

而影响 FP 的一个重要因素就是「网络的加载速度」

要想优化Web页面的加载速度,你需要对网络有充分的了解。而理解网络的关键是要对网络协议有深刻的认识,不管你是使用 HTTP,还是使用 WebSocket,它们都是基于 TCP/IP 的,如果你对这些原理有足够了解,也就清楚如何去优化Web性能,或者能更轻松地定位Web问题了。

在网络中,一个文件通常会被拆分为很多数据包来进行传输,而数据包在传输过程中又有很大概率丢失或者出错。那么如何保证页面文件能被完整地送达浏览器呢?

这篇文章就是让我们站在数据包的视角,解析这个问题。

数据包的传输流程

下面我将分别从「数据包如何送达主机」「主机如何将数据包转交给应用」和「数据是如何被完整地送达应用程序」这三个角度来为你讲述数据的传输过程。

互联网,实际上是一套理念和协议组成的体系架构。其中,协议是一套众所周知的规则和标准,如果各方都同意使用,那么它们之间的通信将变得毫无障碍。

互联网中的数据是通过数据包来传输的。如果发送的数据很大,那么该数据就会被拆分为很多小数据包来传输。比如你现在听的音频数据,是拆分成一个个小的数据包来传输的,并不是一个大的文件一次传输过来的。

把数据包送达目的主机

数据包要在互联网上进行传输,就要符合网际协议(Internet Protocol,简称IP)标准。互联网上不同的在线设备都有唯一的地址,地址只是一个数字,这和大部分家庭收件地址类似,你只需要知道一个家庭的具体地址,就可以往这个地址发送包裹,这样物流系统就能把物品送到目的地

计算机的地址就称为IP地址,访问任何网站实际上只是你的计算机向另外一台计算机请求信息。

如果要想把一个数据包从主机A发送给主机B,那么在传输之前,数据包上会被附加上主机B的IP地址信息,这样在传输过程中才能正确寻址。额外地,数据包上还会附加上主机A本身的IP地址,有了这些信息主机B才可以回复信息给主机A。这些附加的信息会被装进一个叫IP头的数据结构里。IP头是IP数据包开头的信息,包含IP版本、源IP地址、目标IP地址、生存时间等信息

为了方便理解,我先把网络简单分为三层结构,如下图

下面我们一起来看下一个数据包从主机A到主机B的旅程

  • 上层将含有「HELLO WEB」的数据包交给网络层;
  • 网络层再将IP头附加到数据包上,组成新的 IP数据包,并交给底层;
  • 底层通过物理网络将数据包传输给主机B;
  • 数据包被传输到主机B的网络层,在这里主机B拆开数据包的IP头信息,并将拆开来的数据部分交给上层;
  • 最终,含有「HELLO WEB」信息的数据包就到达了主机B的上层了

把数据包送达应用程序

IP是非常底层的协议,只负责把数据包传送到对方电脑,但是对方电脑并不知道把数据包交给哪个程序,是交给浏览器还是交给明日方舟?因此,需要基于IP之上开发能和应用打交道的协议,最常见的是「用户数据包协议(User Datagram Protocol)」,简称UDP。

UDP 中一个最重要的信息是端口号,端口号其实就是一个数字,每个想访问网络的程序都需要绑定一个端口号。通过端口号 UDP 就能把指定的数据包发送给指定的程序了,所以 IP 通过IP地址信息把数据包发送给指定的电脑,而 UDP 通过端口号把数据包分发给正确的程序。和IP头一样,端口号会被装进 UDP头 里面,UDP头 再和原始数据包合并组成新的UDP数据包。UDP头 中除了目的端口,还有源端口号等信息。

为了支持UDP协议,我把前面的三层结构扩充为四层结构,在网络层和上层之间增加了传输层,如下图所示:

来看下一个数据包从主机A旅行到主机B的路线

  • 上层将含有「HELLO WEB」的数据包交给传输层;
  • 传输层会在数据包前面附加上UDP头,组成新的UDP数据包,再将新的UDP数据包交给网络层;
  • 网络层再将IP头附加到数据包上,组成新的IP数据包,并交给底层;
  • 数据包被传输到主机B的网络层,在这里主机B拆开IP头信息,并将拆开来的数据部分交给传输层;
  • 在传输层,数据包中的UDP头会被拆开,并根据UDP中所提供的端口号,把数据部分交给上层的应用程序;
  • 最终,含有「HELLO WEB」信息的数据包就旅行到了主机B上层应用程序这里

在使用UDP发送数据时,有各种因素会导致数据包出错,虽然UDP可以校验数据是否正确,但是对于错误的数据包,UDP并不提供重发机制,只是丢弃当前的包,而且UDP在发送之后也无法知道是否能达到目的地。

虽说UDP不能保证数据可靠性,但是传输速度却非常快,所以UDP会应用在一些关注速度、但不那么严格要求数据完整性的领域,如网络直播、网络云游戏等。

把数据完整地送达应用程序

对于浏览器请求,或者邮件这类要求数据传输可靠性的应用,如果使用UDP来传输会存在两个问题:

基于这两个问题,我们引入TCP了。TCP(Transmission Control Protocol,传输控制协议)是一种面向连接的、可靠的、基于字节流的传输层通信协议。相对于UDP,TCP有下面两个特点:

和UDP头一样,TCP头除了包含了目标端口和本机端口号外,还提供了用于排序的序列号,以便接收端通过序号来重排数据包。

下面看看TCP下的单个数据包的传输流程。

通过上图你应该可以了解一个数据包是如何通过TCP来传输的。TCP单个数据包的传输流程和UDP流程差不多,不同的地方在于,通过TCP头的信息保证了一块大的数据传输的完整性。

下面我们再看下完整的TCP连接过程,通过这个过程你可以明白TCP是如何保证重传机制和数据包的排序功能的。

从下图可以看出,一个完整的TCP连接的生命周期包括了“建立连接”“传输数据”和“断开连接”三个阶段。

到这里你应该就明白了,TCP为了保证数据传输的可靠性,牺牲了数据包的传输速度,因为“三次握手”和“数据包校验机制”等把传输过程中的数据包的数量提高了一倍。

总结

互联网中的数据是通过数据包来传输的,数据包在传输过程中容易丢失或出错。

由IP负责把数据包送达目的主机。

由UDP负责把数据包送达具体应用。

而TCP保证了数据完整地传输,它的连接可分为三个阶段:建立连接、传输数据和断开连接。

其实了解TCP协议,是为了全方位了解HTTP,包括其实际功能和局限性,之后才会更加深刻地理解为什么要推出HTTP/2,以及为什么要推出QUIC协议,也就是未来的HTTP/3。

近期文章
title: HTTP 请求流程
time: 2023-10-19
tag: #前端#浏览器#网络#HTTP
title: 页面进程详解
time: 2023-10-12
tag: #前端#浏览器#计算机科学