第七章传输层

Transcript 第七章传输层

计算机网络
Computer Network
2015年4月9日
课程目录
第1章
概述
第2章
物理层与数据通信基础
第3章
数据链路层
第4章
局域网
第5章
网络层
第6章
网络互联技术
第7章
传输层
第8章
应用层
第9章
网络管理与信息安全
第10章网络新技术专题
计算机网络--刘桂江
2/87
第7章传输层
7.1
传输层概述
7.2
互联网传输协议
计算机网络--刘桂江
3/87
7.1 传输层概述
7.1.1 提供给高层的服务
7.1.2 服务质量
7.1.3 多路复用技术
计算机网络--刘桂江
4/87
7.1.1 提供给高层的服务
主机 A
主机 B
传输服务用户
（应用层实体）
传输层服务访问点
TSAP
完成传输层功能
的硬件或软件
传输实体
网络层服务访问点
NSAP
应用层
传输服务用户
（应用层实体）
层接口
传输协议
传输实体
网络层
传输层
层接口
传输层与其上下层之间的关系
• 传输层向高层提供两种类型的服务：面向连接的传输服务和无连接的
传输服务。
计算机网络--刘桂江
5/87
7.1.2 服务质量

传输层服务质量是指在两节点之间表现出来的某些传输连
接的特征，是传输层性能的度量，反映了传输质量及服务
的可用性。
连接建立延迟
连接建立失败概率

传输层服务质量参数表
吞吐量
传输延迟

传输层服务质量不是由单方面决定
的，一般它需要连接的双方有一个
协商的过程。
计算机网络--刘桂江
残留差错率
保护性
优先权
回弹率
6/87
7.1.3 多路复用技术
TSAP
应用层
应用层
NSAP
传输层
传输层
网络层
网络层
至路由器
（a）向上多路复用

至路由器
（b）向下多路复用
向上复用的使用往往是出于费用上的考虑；向下复用的目的
是为了提高吞吐量。
计算机网络--刘桂江
7/87
7.2 互联网传输协议
7.2.1 TCP简介
7.2.2 TCP服务模型
7.2.3 TCP协议
7.2.4 TCP报文段头
7.2.5 TCP连接管理
7.2.6 TCP传输策略
7.2.7 TCP流量控制和拥塞控制
7.2.8 TCP计时器
7.2.9 UDP协议简介
计算机网络--刘桂江
8/87
7.2.1 TCP简介


TCP（传输控制协议）是TCP/IP体系中面向连接的
传输层协议，它提供全双工的服务。
TCP提供差错控制和排序的功能，提供可靠的端到端
字节流的传输服务。
计算机网络--刘桂江
9/87
7.2.2 TCP服务模型(1 /5)
 TCP是使用连接来进行通信的。当一个应用进程希望与另一
个远程的应用进程建立连接的时候，除了要知道对方的主机
地址外，它还必须知道要连接到对方哪个应用进程上，从而
实现端到端的通信。
AP1
5
应用进程
AP2
端口
应用进程
传输层提供应用进程间的逻辑通信
4
3
端口
AP3
AP4
5
4
IP 层
3
2
2
1
1
传输层提供端到端的服务
计算机网络--刘桂江
10/87
7.2.2 TCP服务模型(2 /5)
 在传输层上通常使用的方法是为那些能够监听连接请求的进
程定义TSAP；在Internet中，这些访问点就被称为端口。同
样，在网络层上的访问点被称为NSAP。IP地址就是NSAP的
特例。
NSAP、
TSAP和传输
连接之间的关
系
计算机网络--刘桂江
11/87
7.2.2 TCP服务模型(3 /5)

客户机上的应用进程如何知道服务器上的服务器进程是被
关联到某个特定端口上的呢？
常用的方法有两种：
（1）对于一些少数且关键的服务器进程（例如Web服务
器），它们被连接请求的频率高，而且一旦连接上以后维
持的时间一般也比较长，则将这些典型服务器进程与熟知
的TSAP永久地关联起来。且这些关键服务进程和对应的
熟知TSAP往往被罗列在某个文件中。
（2）采用名字服务器或目录服务器。
计算机网络--刘桂江
12/87
7.2.2 TCP服务模型(4/5)
套接字(socket)


为了区分不同主机中的进程，TCP/IP协议簇将主机的IP
地址与端口结合起来，定义为通信的一个端点，称之为
套接字。
套接字、端口和IP地址的关系是：
IP 地址
128.10.2.3
套接字
128.10.2.3
计算机网络--刘桂江
端口号（16位）
25
25
13/87
7.2.2 TCP服务模型(5 /5)
三类端口
（1）熟知端口，其数值为0～1023。这一类端口由
ICANN负责分配给一些常用的应用层程序固定使用。
（2）登记端口，其数值为1024～49151。这类端口是
ICANN控制的，使用这个范围的端口必须在ICANN登记
，以防止重复。
（3）动态端口，其数值为49152～65535。这类端口
是留给客户进程选择作为临时端口。
计算机网络--刘桂江
14/87
7.2.3 TCP协议
在TCP协议中需要关注的几个问题：
（1）TCP连接上的每个字节都是有编号的，即都有它
自己独有的32位序列号。
（2）TCP报文段的结构
（3）滑动窗口协议
（4）错序问题
计算机网络--刘桂江
15/87
7.2.4 TCP报文段头
 一个TCP报文段分为首部和数据两部分。TCP首部
由固定首部和可选的附加选项组成。

TCP数据部分理论上长度最多可达65495个字节。
 无任何数据的TCP报文段也是合法的，它通常被用
于确认或控制消息。

TCP的全部功能都体现在它首部中各字段的作用。
计算机网络--刘桂江
16/87
32 bit
比特0
8
16
24
源端口
31
目的端口
序号
确认
TCP
首部
数据
偏移
序
20 字节的
固定首部
号
U A P R S F
R C S S Y I
G K H T N N
保留
窗口大小
检验和
附加选
TCP 报文段
项
紧急指针
（长度可变）
TCP 首部
填
充
TCP 数据部分
发送在前
IP 首部
IP 数据部分
TCP报文段首部结构图
计算机网络--刘桂江
17/87
比特 0
8
16
24
源端口
31
目的端口
序号
TCP
首部
确
数据
偏移
保留
认
序
号
U A P R S F
R C S S Y I
G K H T N N
检验和
附加选
项
20
字节
固定
首部
窗口大小
紧急指针
（长度可变）
填
充
源端口和目的端口——各占2个字节。端口是传输层与应用
层的服务接口，它们分别与源IP地址和目的IP地址一起标
识一个TCP连接的两个端点，传输层的复用和分用功能都
要通过端口才能实现。
计算机网络--刘桂江
18/87
比特 0
8
16
24
源端口
31
目的端口
序号
TCP
首部
确
数据
偏移
保留
认
序
号
U A P R S F
R C S S Y I
G K H T N N
检验和
附加选
项
20
字节
固定
首部
窗口大小
紧急指针
（长度可变）
填
充
序号字段——占 4 字节。TCP 连接中传送的数据流中的
每一个字节都编上一个序号。序号字段的值则指的是本报
文段所发送的数据的第一个字节的序号。
计算机网络--刘桂江
19/87
比特 0
8
16
24
源端口
31
目的端口
序号
TCP
首部
确
数据
偏移
保留
认
序
号
U A P R S F
R C S S Y I
G K H T N N
检验和
附加选
项
20
字节
固定
首部
窗口大小
紧急指针
（长度可变）
填
充
确认序号字段——占 4 字节，是期望收到对方的下一个报
文段的数据的第一个字节的序号。
计算机网络--刘桂江
20/87
比特 0
8
16
24
源端口
31
目的端口
序号
TCP
首部
确
数据
偏移
保留
认
序
号
U A P R S F
R C S S Y I
G K H T N N
检验和
附加选
项
20
字节
固定
首部
窗口大小
紧急指针
（长度可变）
填
充
数据偏移——占4bit，它指出 TCP 报文段的数据起始处距离
TCP 报文段的起始处有多远。“数据偏移”的单位不是字节而
是 32 bit字（即4字节为计算单位）。
计算机网络--刘桂江
21/87
比特 0
8
16
24
源端口
31
目的端口
序号
TCP
首部
确
数据
偏移
保留
认
序
号
U A P R S F
R C S S Y I
G K H T N N
检验和
附加选
项
20
字节
固定
首部
窗口大小
紧急指针
（长度可变）
填
充
保留字段——占 6 bit，保留为今后使用，但目前都置为 0。
计算机网络--刘桂江
22/87
比特 0
8
16
24
源端口
31
目的端口
序号
TCP
首部
确
数据
偏移
保留
认
序
号
U A P R S F
R C S S Y I
G K H T N N
检验和
附加选
项
20
字节
固定
首部
窗口大小
紧急指针
（长度可变）
填
充
紧急比特 URG ——紧急标志位。当 URG  1 时，表明紧
急指针字段有效。它告诉系统此报文段中有紧急数据，应尽
快传送(相当于高优先级的数据)。
计算机网络--刘桂江
23/87
比特 0
8
16
24
源端口
31
目的端口
序号
TCP
首部
确
数据
偏移
保留
认
序
号
U A P R S F
R C S S Y I
G K H T N N
检验和
附加选
项
20
字节
固定
首部
窗口大小
紧急指针
（长度可变）
填
充
确认比特 ACK ——确认标志位。当ACK=1时表明报文段中
确认序号字段有效，这时可以理解当前发送的报文段为确
认报文；当ACK=0时表明确认序号字段无效。
计算机网络--刘桂江
24/87
比特 0
8
16
24
源端口
31
目的端口
序号
TCP
首部
确
数据
偏移
保留
认
序
号
U A P R S F
R C S S Y I
G K H T N N
检验和
附加选
项
20
字节
固定
首部
窗口大小
紧急指针
（长度可变）
填
充
推送PSH (Push) —— 接收 TCP 收到推送比特置 1 的报文
段，就尽快地交付给接收应用进程，而不再等到整个缓存都填
满了后再向上交付。
计算机网络--刘桂江
25/87
比特 0
8
16
24
源端口
31
目的端口
序号
TCP
首部
确
数据
偏移
保留
认
序
号
U A P R S F
R C S S Y I
G K H T N N
检验和
附加选
项
20
字节
固定
首部
窗口大小
紧急指针
（长度可变）
填
充
复位RST (Reset) ——复位标志。当RST=1时表明TCP连接中出现
严重差错（例如主机崩溃），这时必须释放当前连接然后再重新
建立一个新的传输连接。另外RST置1还可以用来拒绝接收一个非
法报文段，或拒绝建立一个连接。
计算机网络--刘桂江
26/87
比特 0
8
16
24
源端口
31
目的端口
序号
TCP
首部
确
数据
偏移
保留
认
序
号
U A P R S F
R C S S Y I
G K H T N N
检验和
附加选
项
20
字节
固定
首部
窗口大小
紧急指针
（长度可变）
填
充
同步SYN ——建立连接标志。建立连接过程中，在客户端发出请
求建立连接的报文段中：SYN=1，ACK=0；在服务器端表示接收建
立连接的报文段中：SYN=1，ACK=1；所以可用SYN来区分与建立连
接有关的报文段，而用ACK进一步区分是连接请求还是连接接收。
计算机网络--刘桂江
27/87
比特 0
8
16
24
源端口
31
目的端口
序号
TCP
首部
确
数据
偏移
保留
认
序
号
U A P R S F
R C S S Y I
G K H T N N
检验和
附加选
项
20
字节
固定
首部
窗口大小
紧急指针
（长度可变）
填
充
终止FIN (Final) ——释放连接标志。当FIN=1时表示此报文段
的发送方的数据发送已经结束，并要求释放传输连接。注意这
是个单方面请求释放连接，即仍然还允许对方发送数据过来。
计算机网络--刘桂江
28/87
比特 0
8
16
24
源端口
31
目的端口
序号
TCP
首部
确
数据
偏移
保留
认
序
号
U A P R S F
R C S S Y I
G K H T N N
检验和
附加选
项
20
字节
固定
首部
窗口大小
紧急指针
（长度可变）
填
充
窗口大小字段 —— 占 2 字节。窗口字段用来控制对方发送
的数据量，单位为字节。TCP 连接的一端根据设置的缓存空
间大小确定自己的接收窗口大小，然后通知对方以确定对方
的发送窗口的上限。
计算机网络--刘桂江
29/87
比特 0
8
16
24
源端口
31
目的端口
序号
TCP
首部
确
数据
偏移
保留
认
序
号
U A P R S F
R C S S Y I
G K H T N N
检验和
附加选
项
20
字节
固定
首部
窗口大小
紧急指针
（长度可变）
填
充
检验和——占2字节。检验和字段检验的范围包括首部和数
据这两部分。在计算检验和时，要在 TCP 报文段的前面加
上 12 字节的伪首部。
计算机网络--刘桂江
30/87
在计算检验和时，临时把“伪首部”和TCP报文段连接
在一起，得到一个临时的TCP报文段。检验和就针对这
个临时的TCP报文段来计算的。伪首部既不向下传送也
不向上递交，而仅仅是为了计算检验和。
32 bit
源 IP 地址
目的 IP 地址
全0 6
TCP长度
TCP报文段伪首部结构图
计算机网络--刘桂江
31/87
TCP计算检验和的具体方法：
在发送方，首先是把全零放入检验和字段，再把伪首部以
及TCP报文段看成是由许多16位的字串接起来。若TCP报
文段的数据部分长度不是4N（N为正整数）字节的整数
倍，则要填充全零字串在后面直至长度为4N字节。然后按
二进制反码计算出这些16位字的和，将此和的二进制反码
写入检验和字段后，发送该TCP报文段。
在接收方，把收到的TCP报文段增加伪首部（以及可能的
填充全零字节）一起，按二进制反码计算出这些16位字的
和。当无差错时其结果应为全1；否则就表明出现传输错
误，接收方应丢弃这个错误的TCP报文段（当然也可以上
交给应用层，但附上出现了差错的警告）。
计算机网络--刘桂江
32/87
比特 0
8
16
24
源端口
31
目的端口
序号
TCP
首部
确
数据
偏移
保留
认
序
号
U A P R S F
R C S S Y I
G K H T N N
检验和
附加选
项
20
字节
固定
首部
窗口大小
紧急指针
（长度可变）
填
充
紧急指针字段 —— 占 16 bit。紧急指针指出在本报文段中，
紧急数据一共有多少个字节。它和紧急标志位URG配合使用。
计算机网络--刘桂江
33/87
比特 0
8
16
24
源端口
31
目的端口
序号
TCP
首部
确
数据
偏移
保留
认
序
号
U A P R S F
R C S S Y I
G K H T N N
检验和
附加选
项
20
字节
固定
首部
窗口大小
紧急指针
（长度可变）
填
充
附加选项字段 ——
长度可变。TCP 只规定了一种选项，即最大报文段长度
MSS (Maximum Segment Size)。MSS 告诉对方 TCP：“我的缓存所能接收的报文
段的数据字段的最大长度是 MSS 个字节。”
附加选项是可选的，如果主机没有使用这个选项，则缺省使用MSS的默认值是536。
另外，一个连接两个方向上的最大数据段长度MSS可以不相同。
计算机网络--刘桂江
34/87
比特 0
8
16
24
源端口
31
目的端口
序号
TCP
首部
确
数据
偏移
保留
认
序
号
U A P R S F
R C S S Y I
G K H T N N
检验和
附加选
项
20
字节
固定
首部
窗口大小
紧急指针
（长度可变）
填
充
填充字段 —— 这是为了使整个首部长度是 4 字节的整
数倍。
计算机网络--刘桂江
35/87
7.2.5 TCP连接管理(1 /8)
1．建立TCP连接
TCP协议中使用三次握手方法建立连接。
主机 A
主机 B
主动打开
被动打开
SYN=1，seq=x
连接请求
ACK=0
SYN=1，ACK=1，seq=y，ack=x+1
确认
时间
确认
ACK=1，seq=x+1，ack=y1
三次握手法
1、防止可能发生的死锁
2、防止已失效的连接再
次传到被连接的主机
时间
为何不用两次握手方法建立连接？
计算机网络--刘桂江
36/87
7.2.5 TCP连接管理(2 /8)
2．释放TCP连接
 释放连接有两种方式：非对称释放和对称释放。
（1）非对称释放
主机 A
主机 B
连接建立
发送第一
个数据
发送第二
个数据
DATA 1
ACK
发送确认
DATA 2
撤消连接
在一方断开连接后不再
时间
接收数据，数据丢失
该方法较为粗
暴，可能会导
致数据丢失。
时间
计算机网络--刘桂江
37/87
7.2.5 TCP连接管理(3 /8)
（2）对称释放方法
主机 A
释放请求即
A不再发送
数据
主机 B
FIN=1，seq=x
ACK=1，seq=y，ack=x+1
半关闭状态
FIN=1，seq=y+1，ack=x+1
发送确认
ACK=1，seq=x+1，ack=y 2
通知主机
进程并发
送确认
释放请求即
B也不再发
送数据
关闭状态
时间
时间
计算机网络--刘桂江
38/87
7.2.5 TCP连接管理(4 /8)
不过，对称释放协议并不总是可以正确地工作。它存在两
军队问题。
两军队问题
用“断开连接”来代替军队的“发起进攻” 。如果任何一方一定要在确定
另一方已经做好了断开连接的准备之后才准备断开连接的话，那么，断开
连接的操作将永远都不可能发生。
计算机网络--刘桂江
39/87
7.2.5 TCP连接管理(5 /8)
*3．有限状态机
建立连接和释放连接所要求的步骤可以用一个
有限状态机来表达。该状态机有11种状态，在每
一种状态中，都存在一些合法的事件。当合法事
件发生的时候，可能需要采取某个动作；当其他
事件发生的时候，则报告一个错误。
计算机网络--刘桂江
40/87
7.2.5 TCP连接管理(6 /8)
状态
说明
没有活动的连接，或者未完成的连接
LISTEN
服务器正在等待进来的连接请求
SYN_RCVD
一个连接请求已经到达；等待ACK
SYN_SENT
应用程序已经开始打开连接
ESTABLISHED
正常的数据传输状态
FIN_WAIT_1
一方请求释放连接
FIN_WAIT_2
另一方已经同意释放连接
TIME_WAIT
等待所有的分组逐渐消失
CLOSING
双方试图同时关闭连接
CLOSE_WAIT
另一方已经发起了释放连接的过程
LAST_ACK
等待所有的分组逐渐消失
计算机网络--刘桂江
TCP
CLOSED
有
限
状
态
机
中
存
在
的
状
态
41/87
7.2.5 TCP连接管理(7/8)
每个连接都从CLOSED状态开始。当它执行了一
个被动的打开操作（LISTEN），或者一个主动的打
开操作（CONNECT）的时候，它就离开CLOSED状
态。如果另一端执行了相对应的操作，则连接被建
立起来，当前状态变成ESTABLISHED；连接的释放
过程可以由任何一方发起，当释放完成的时候，状
态又回到了CLOSED。
计算机网络--刘桂江
42/87
CLOSED
被动打开
关闭
收到 SYN
发送 SYN, ACK
LISTEN
被动打开
收到 RST
发送 SYN
收到 SYN，发送 SYN, ACK
同时打开
收到 ACK
SYN_RCVD
关闭
发送 FIN
主动关闭
收到 FIN
发送 ACK
同时关闭
CLOSING
收到 FIN, ACK
发送 ACK
收到 ACK
FIN_WAIT_2
SYN_SENT
关闭
或超时
主动打开
收到 SYN, ACK
发送 ACK
数据传送
收到 FIN
阶段
发送 ACK
ESTABLISHED
关闭
发送 FIN
FIN_WAIT_1
主动打开
发送 SYN
被动关闭
CLOSE_WAIT
关闭
发送 FIN
收到 ACK
TCP
的
有
限
状
态
机
LAST_ACK
收到 ACK
收到 FIN
发送 ACK
TIME_WAIT
定时经过两倍报文段寿命后
计算机网络--刘桂江
43/87
7.2.6 TCP传输策略(1 /5)



TCP 协议是面向字节流的。TCP 将所要传送的报文看成是字节组成
的数据流，并使每一个字节对应于一个序号。
在连接建立时，双方要商定初始序号。TCP 每次发送的报文段的首
部中的序号字段数值表示该报文段中的数据部分的第一个字节的序
号。
TCP 发送的确认报文段是对接收到的数据的最高序号表示确认。
接收端返回的确认序号是已收到的数据的最高序号加 1。也就是说，
确认序号表示接收端期望下次收到的数据中的第一个数据字节的序
号。
计算机网络--刘桂江
44/87
7.2.6 TCP传输策略(2 /5)
TCP传输的可靠就是由于使用了序号和确认机制：
在TCP发送一个报文段时，它同时也在自己的重传队
列中存放一个副本，并启动一个计时器。若收到该报
文段的确认，则删除此副本；若在计时器超时之前没
有收到确认，则重传此报文段的副本。TCP的确认并
不保证数据已由应用层交付给了端用户，而只是表明
在接收方的TCP收到了发送方所发送的报文段。
计算机网络--刘桂江
45/87
7.2.6 TCP传输策略(3 /5)
TCP的发送和确认机制
在发送方，TCP一般是根据以下三种基本机制来控制报文段的
发送时机。第一种机制是TCP维持一个变量，它等于接收方确
认报文段中的最大报文长度MSS，这个数值给出了接收方的最
大数据接收能力，因此只要发送方发送缓存从发送进程中得到
的数据已达到MSS字节时，就组装成一个TCP报文段，然后发送
出去。第二种机制是当发送方的应用进程指明要求发送一个报
文段时，即使用了TCP的推送（PUSH）操作，则TCP立即将这个
报文段单独发送出去。第三种机制是当发送方的一个计时器期
限到了，这说明某一个已发送出去的报文段在规定时限之内没
有收到确认，于是发送方就把该计时器所对应的报文段副本从
重传队列中取出再次发送出去。
计算机网络--刘桂江
46/87
7.2.6 TCP传输策略(4 /5)
在接收方，当接收方的接收缓存已经装满数据，就会返
回一个确认，并设置窗口（WIN）的值为0，这时发送
方是不能够再正常地发送数据段了。但这里有两种意外
情形允许发送方继续发送报文段。第一，紧急数据仍可
以发送，例如要中断远程机器上运行的某一个进程。第
二，发送方可以发送一个1字节的数据段，要求接收方
重申窗口大小及下一个准备接收的数据字节序号。这是
避免当一个返回窗口信息的确认丢失之后发生死锁的情
形。
计算机网络--刘桂江
47/87
7.2.6 TCP传输策略(5/5)
Nagle算法
Clark算法（糊涂窗口综合症）
Nagle算法和Clark算法针对糊涂窗口综合症的解决方
案是相互补充的。Nagle算法试图解决由于发送方每
次向TCP只传送一个字节而引起的问题；Clark算法则
试图解决由于接收方每次从TCP流中只读取一个字节
而引起的问题。这两种算法都是有效的，而且可以一
起工作。它们要达到的目标是：发送方不要发送太小
的数据段，接收方也不要请求太小的数据段。
计算机网络--刘桂江
48/87
7.2.7 TCP流量控制和拥塞控制(1/14)
1．TCP流量控制

TCP 采用大小可变的滑动窗口进行流量控制。窗口大小的单位是
字节。
RecvWindow
网络来的数据
空闲缓冲区
缓冲的TCP数
据
用户进程
RecvBuffer
计算机网络--刘桂江
49/87
7.2.7 TCP流量控制和拥塞控制(2/14)


在 TCP 报文段首部的窗口（WIN）字段写入的数值就是当前给对
方设置的发送窗口数值的上限。
发送窗口在连接建立时由双方商定。但在通信的过程中，接收端
可根据自己的资源情况，随时动态地调整对方的发送窗口上限值
(可增大或减小)。
计算机网络--刘桂江
50/87
设主机A和B的连接已经建立完毕，双方商定的初始窗口值是500。再设每
一个报文段的数据字段的长度为100字节，数据报文段序号的初始值为1。
主机 A
主机 B
seq = 1,DATA
A 还能发送 400 字节
seq = 101,DATA
seq = 201,DATA
A 还能发送 300 字节
丢失！
ACK = 1,ack = 201,win=300
seq = 301,DATA
seq = 401,DATA
seq = 201,DATA
ACK =1,ack=501,win = 200
seq = 501,DATA
ACK=1,ack = 601,win = 0
允许 A 再发送 300 字节（序号 201 至 500）
A 还能发送 200 字节（序号 301 至 500）
A 还能发送 100 字节（序号 401 至 500）
A 超时重发，但不能发送序号 500 以后的数据
允许 A 再发送 200 字节（序号 501 至 700）
A 还能发送 100 字节（序号 501 至 700）
不允许 A 再发送（到序号 600 的数据都已收到）
计算机网络--刘桂江
51/87
7.2.7 TCP流量控制和拥塞控制(4/14)
2．TCP拥塞控制


发送端的主机在确定发送报文段的速率时，既要根据接收端的接收
能力，又要从全局考虑不要使网络发生拥塞。
因此，每一个 TCP 连接需要维护以下两个状态变量：


接收窗口 rwnd (receiver window) 又称为通知窗口
(advertised window)。
拥塞窗口 cwnd (congestion window)。
计算机网络--刘桂江
52/87
7.2.7 TCP流量控制和拥塞控制(5/14)


(1) 接收窗口 rwnd
这是接收端根据其目前的接收缓存大小所
许诺的最新的窗口值，是来自接收端的流量控制。接收端将此窗口
值放在 TCP 报文的首部中的窗口字段，传送给发送端。
(2) 拥塞窗口 cwnd (congestion window)
是发送端根据自己估
计的网络拥塞程度而设置的窗口值，是来自发送端的流量控制。
计算机网络--刘桂江
53/87
7.2.7 TCP流量控制和拥塞控制(6/14)
发送窗口的上限值

发送端的发送窗口的上限值应当取为接收端窗口 rwnd 和拥塞窗口 cwnd
这两个变量中较小的一个，即应按以下公式确定：
发送窗口的上限值  Min（rwnd, cwnd）

当 rwnd < cwnd 时，是接收端的接收能力限制发送窗口的最大值。

当 cwnd < rwnd 时，则是网络的拥塞限制发送窗口的最大值。
计算机网络--刘桂江
54/87
7.2.7 TCP流量控制和拥塞控制(7/14)
为了在传输层进行拥塞控制，1999年公布的互
联网建议标准[RFC 2581]定义了四种算法，即慢
开始（slow-start）、拥塞避免（congestion
avoidance）、快重传（fast retransmit）和快
恢复（fast recovery）。
计算机网络--刘桂江
55/87
7.2.7 TCP流量控制和拥塞控制(8/14)
慢开始算法的原理




在主机刚刚开始发送报文段时可先将拥塞窗口 cwnd
设置为一个最大报文段 MSS 的数值。
在每收到一个对新的报文段的确认后，将拥塞窗口增
加至多一个 MSS 的数值。
用这样的方法逐步增大发送端的拥塞窗口 cwnd，可以
使分组注入到网络的速率更加合理。
实际上，每一批被确认的报文段都会使拥塞窗口加倍。
拥塞窗口一直呈指数增长，直至发生超时，或者达到
接收窗口的大小。
计算机网络--刘桂江
56/87
7.2.7 TCP流量控制和拥塞控制(9/14)
实际中慢开始算法往往还未出现超时就已停止使用，而
改用拥塞避免算法。因此TCP连接还需要设置另一个状态
参数，称之为慢开始门限ssthresh。它的用法如下：
当cwnd<ssthresh时，使用上述的慢开始算法；
当cwnd>ssthresh时，停止使用慢开始算法而改用拥塞
避免算法；
当cwnd=ssthresh时，或者使用慢开始算法，或者使用
拥塞避免算法。
计算机网络--刘桂江
57/87
7.2.7 TCP流量控制和拥塞控制(10/14)
拥塞避免算法的原理
使发送方的拥塞窗口cwnd每经过一个往返时延RTT
就增加一个MSS的大小（而不管在时间RTT内收到了几
个ACK）。这样，拥塞窗口cwnd将是按线性规律缓慢
增长，比慢开始算法中拥塞窗口的增长速率要缓慢的
多了。
计算机网络--刘桂江
58/87
慢开始和拥塞避免算法的实现举例(1/10)
拥塞窗口 cwnd
发生超时
线性规律增长
24
进入拥塞避免
20
进入拥塞避免
ssthresh = 16
16
12
8
4
更新后的 ssthresh = 12
指数规律增长
传输次数
0
0
2
慢开始
4
6
8
10
12 14 16
拥塞避免
慢开始
18 20 22
拥塞避免
当 TCP 连接进行初始化时，将拥塞窗口置为 1。图中的窗口单
位不使用字节而使用报文段。
慢开始门限的初始值设置为 16 个报文段，即 ssthresh = 16。
计算机网络--刘桂江
59/87
慢开始和拥塞避免算法的实现举例(2 /10)
拥塞窗口 cwnd
发生超时
线性规律增长
24
进入拥塞避免
20
进入拥塞避免
ssthresh = 16
16
12
8
4
更新后的 ssthresh = 12
指数规律增长
传输次数
0
0
2
慢开始
4
6
8
10
12 14 16
拥塞避免
慢开始
18 20 22
拥塞避免
发送端的发送窗口不能超过拥塞窗口 cwnd 和接收端窗口 rwnd
中的最小值。我们假定接收端窗口足够大，因此现在发送窗口
的数值等于拥塞窗口的数值。
计算机网络--刘桂江
60/87
慢开始和拥塞避免算法的实现举例(3 /10)
拥塞窗口 cwnd
发生超时
线性规律增长
24
进入拥塞避免
20
进入拥塞避免
ssthresh = 16
16
12
8
4
更新后的 ssthresh = 12
指数规律增长
传输次数
0
0
2
慢开始
4
6
8
10
12 14 16
拥塞避免
慢开始
18 20 22
拥塞避免
在执行慢开始算法时，拥塞窗口 cwnd 的初始值为 1，发送第一
个报文段 M0。
计算机网络--刘桂江
61/87
慢开始和拥塞避免算法的实现举例(4 /10)
拥塞窗口 cwnd
发生超时
线性规律增长
24
进入拥塞避免
20
进入拥塞避免
ssthresh = 16
16
12
8
4
更新后的 ssthresh = 12
指数规律增长
传输次数
0
0
2
慢开始
4
6
8
10
12 14 16
拥塞避免
慢开始
18 20 22
拥塞避免
发送端收到 ACK1 （确认 M0，期望收到 M1）后，将 cwnd 从 1
增大到 2，于是发送端可以接着发送 M1 和 M2 两个报文段。
计算机网络--刘桂江
62/87
慢开始和拥塞避免算法的实现举例(5 /10)
拥塞窗口 cwnd
发生超时
线性规律增长
24
进入拥塞避免
20
进入拥塞避免
ssthresh = 16
16
12
8
4
更新后的 ssthresh = 12
指数规律增长
传输次数
0
0
2
慢开始
4
6
8
10
12 14 16
拥塞避免
慢开始
18 20 22
拥塞避免
接收端发回 ACK2 和 ACK3。发送端每收到一个对新报文段的确
认 ACK，就把发送端的拥塞窗口加 1。现在发送端的 cwnd 从
2 增大到 4，并可发送 M4 ~ M6共 4个报文段。
计算机网络--刘桂江
63/87
慢开始和拥塞避免算法的实现举例(6 /10)
拥塞窗口 cwnd
发生超时
线性规律增长
24
进入拥塞避免
20
进入拥塞避免
ssthresh = 16
16
12
8
4
更新后的 ssthresh = 12
指数规律增长
传输次数
0
0
2
慢开始
4
6
8
10
12 14 16
拥塞避免
慢开始
18 20 22
拥塞避免
发送端每收到一个对新报文段的确认 ACK，就把发送端的拥塞
窗口加 1，因此拥塞窗口 cwnd 随着传输次数按指数规律增长。
计算机网络--刘桂江
64/87
慢开始和拥塞避免算法的实现举例(7 /10)
拥塞窗口 cwnd
发生超时
线性规律增长
24
进入拥塞避免
20
进入拥塞避免
ssthresh = 16
16
12
8
4
更新后的 ssthresh = 12
指数规律增长
传输次数
0
0
2
慢开始
4
6
8
10
12 14 16
拥塞避免
慢开始
18 20 22
拥塞避免
当拥塞窗口 cwnd 增长到慢开始门限值 ssthresh 时（即当
cwnd = 16 时），就改为执行拥塞避免算法，拥塞窗口按线性
规律增长。
计算机网络--刘桂江
65/87
慢开始和拥塞避免算法的实现举例(8 /10)
拥塞窗口 cwnd
发生超时
线性规律增长
24
进入拥塞避免
20
进入拥塞避免
ssthresh = 16
16
12
8
4
更新后的 ssthresh = 12
指数规律增长
传输次数
0
0
2
慢开始
4
6
8
10
12 14 16
拥塞避免
慢开始
18 20 22
拥塞避免
假定拥塞窗口的数值增长到 24 时，网络出现超时（表明网络拥
塞了）。
计算机网络--刘桂江
66/87
慢开始和拥塞避免算法的实现举例(9 /10)
拥塞窗口 cwnd
发生超时
线性规律增长
24
进入拥塞避免
20
进入拥塞避免
ssthresh = 16
16
12
8
4
更新后的 ssthresh = 12
指数规律增长
传输次数
0
0
2
慢开始
4
6
8
10
12 14 16
拥塞避免
慢开始
18 20 22
拥塞避免
更新后的 ssthresh 值变为 12（即发送窗口数值 24 的一半），
拥塞窗口再重新设置为 1，并执行慢开始算法。
计算机网络--刘桂江
67/87
慢开始和拥塞避免算法的实现举例(10 /10)
拥塞窗口 cwnd
发生超时
线性规律增长
24
进入拥塞避免
20
进入拥塞避免
ssthresh = 16
16
12
8
4
更新后的 ssthresh = 12
指数规律增长
传输次数
0
0
2
慢开始
4
6
8
10
12 14 16
拥塞避免
慢开始
18 20 22
拥塞避免
当 cwnd = 12 时改为执行拥塞避免算法，拥塞窗口按按线性
规律增长，每经过一个往返时延就增加一个 MSS 的大小。
计算机网络--刘桂江
68/87
7.2.7 TCP流量控制和拥塞控制(11/14)
必须强调指出


“拥塞避免”并非指完全能够避免了拥塞。利
用以上的措施要完全避免网络拥塞还是不可能
的。
“拥塞避免”是说在拥塞避免阶段把拥塞窗口
控制为按线性规律增长，使网络比较不容易出
现拥塞。
计算机网络--刘桂江
69/87
7.2.7 TCP流量控制和拥塞控制(12/14)
慢开始和拥塞避免算法是在TCP中最早
使用的拥塞控制算法。但后来人们发现
这种拥塞控制算法还需要改进，因为有
时一条TCP连接会因为等待重传计时器
的超时而空闲较长的时间。为此后来又
增加了两个新的拥塞控制算法，这就是
快重传和快恢复。
计算机网络--刘桂江
70/87
7.2.7 TCP流量控制和拥塞控制(13/14)
快重传算法的原理


快重传算法规定，发送端只要一连收到三个重复的 ACK 即
可断定有分组丢失了，就应立即重传丢失的报文段而不必
继续等待为该报文段设置的重传计时器的超时。
不难看出，快重传并非取消重传计时器，而是在某些情况
下可更早地重传丢失的报文段。
计算机网络--刘桂江
71/87
快重传举例
主机 A
M1, M2
ACK2, ACK3
M3
M4
ACK3
M5
ACK3
M6
ACK3
M3
主机 B
A 发送 M1 和 M2
B 确认 M1 和 M2
丢失！ A 发送 M3 但丢失了
A 发送 M4
B 只能再次确认 M2(因为 M3 没有收到）
A 发送 M5
B 发送第二个重复确认 ACK3
A 发送 M6
B 发送第三个重复确认 ACK3
A 收到了三个重复的确认 ACK3，就立即重传
M3，而不必等待超时重传。
计算机网络--刘桂江
72/87
7.2.7 TCP流量控制和拥塞控制(14/14)
快恢复算法的原理
(1) 当发送端收到连续三个重复的 ACK 时，就重新设置慢开始门限
ssthresh。
(2) 与慢开始不同之处是拥塞窗口 cwnd 不是设置为 1，而是设置为
ssthresh + 3  MSS。
(3) 若收到的重复的 ACK 为 n 个（n > 3），则将 cwnd 设置为
ssthresh + n  MSS。
(4) 若发送窗口值还容许发送报文段，就按拥塞避免算法继续发送报
文段。
(5) 若收到了确认新的报文段的 ACK，就将 cwnd 缩小到 ssthresh。
计算机网络--刘桂江
73/87
7.2.8 TCP计时器(1 /8)
 TCP使用多个定时器来辅助其完成工作，其中最重
要的是重传定时器。
 当TCP实体每发送一个TCP报文段的时候，它同时
也启动一个重传定时器：如果在定时器超时之前该报
文段被确认，则定时器被停止；否则重发该报文段，
并重新启动定时器。
计算机网络--刘桂江
74/87
7.2.8 TCP计时器(2 /8)

由于 TCP 的下层是一个互连网环境，IP 数据报所选择的路由变
化很大。因而传输层的往返时延的方差也很大。
往返时延的
概率分布
往返时延的
概率分布
往返时间
往返时间
T1
T
数据链路层中往返时延的概率密度
T2
TCP中往返时延的概率密度
计算机网络--刘桂江
75/87
7.2.8 TCP计时器(3 /8)
TCP采用了一种自适应算法



记录每一个报文段发出的时间，以及收到相应的确认报文段的时间。
这两个时间之差就是报文段的往返时延。
将各个报文段的往返时延样本加权平均，就得出报文段的平均往返时
延 RTT。
每测量到一个新的往返时延样本，就按下式重新计算一次平均往返时
延 RTT：
平均往返时延RTT
   (旧的RTT)  (1  )  (新的往返时延样本)
在上式中， 是修正因子，取值范围为：0≤  < 1。它决定RTT的历史
值在计算中所占的比例，一般取 =7/8。
计算机网络--刘桂江
76/87
7.2.8 TCP计时器(4 /8)
即使有了一个好的平均RTT值，要选择一个合适的超
时重传时间间隔仍然不是一件很容易的事情。
正常情况下，TCP使用β·RTT作为超时重传间隔，但难
点在于如何选择β。在历史上最初的实现中，总是取β
为2，但经验表明常数值是不够灵活的，因为当发生
变化时它不能够灵活地做出反应。
计算机网络--刘桂江
77/87
7.2.8 TCP计时器(5 /8)
Jacobson算法
在1988年，Jacobson提出来让β与确认到达时间概率密度
函数的标准偏差成正比，即大的变化意味着大的β，反之亦
然。尤其是，他建议使用平均偏差作为标准偏差的粗略估
计。在他的算法中要求TCP实体维护一个被平滑的偏差变量
D，它为来回时间的测定值与估计值之间的偏差。当得到
RTT的最新估计值之后，用以下公式修正变量D：
D = αD + (1-α)|RTT - M|
最后按以下公式设置超时重传时间间隔：
timeout = RTT + 4×D
计算机网络--刘桂江
78/87
7.2.8 TCP计时器(6 /8)
往返时间的确认二义性


TCP 报文段 1 没有收到确认。重传（即报文段 2）后，收到了
确认报文段 ACK。
如何判定此确认报文段是对原来的报文段 1 的确认，还是对重
传的报文段 2 的确认？
发送一个
TCP 报文段
1
超时重传
TCP 报文段
2
是对哪一个报文段
的确认？
收到 ACK
时间
往返时延 RTT?
往返时延 RTT?
计算机网络--刘桂江
79/87
7.2.8 TCP计时器(7 /8)
Karn 算法


在计算平均往返时延 RTT 时，只要报文段重传了，就
不采用其往返时延样本。
这样得出的平均往返时延 RTT 和重传时间就较准确。
计算机网络--刘桂江
80/87
7.2.8 TCP计时器(8/8)
修正的 Karn 算法

报文段每重传一次，就将重传时间增大一些：
新的重传时间    (旧的重传时间)



系数  的典型值是2 。
当不再发生报文段的重传时，才根据报文段的往返时延更
新平均往返时延 RTT 和重传时间的数值。
实践证明，这种策略较为合理。
计算机网络--刘桂江
81/87
7.2.9 UDP协议简介(1/6)



UDP和TCP不同，它是一种无连接方式的、不可靠的传
输协议，也就是说不需要连接建立和连接释放过程，
没有流量控制、拥塞控制，UDP数据报在传输过程中
可能会丢失，可能会失序，可能会延迟等等。
它是一个非常简单的传输层协议。
UDP仅仅是在IP提供的服务基础上增添了多路复用和
分用的功能。
计算机网络--刘桂江
82/87
7.2.9 UDP协议简介(2/6)
UDP的优点：
 UDP是无连接的，减少了开销和发送数据之前的时延。
 UDP是尽最大努力交付，即不保证可靠交付，同时也不使
用拥塞控制，因此主机上不需要维持具有许多参数的、
复杂的连接状态表。
 由于UDP没有拥塞控制，因此网络出现的拥塞也不会使源
主机的发送速率降低。这对某些实时应用是很重要的。
 UDP是面向报文的。也就是说，UDP对应用程序交下来的
报文不再划分成若干个分组来发送，也不会把收到的若
干个报文合并后再交付给应用程序。
 UDP用户数据报的首部只有8个字节，比TCP报文段的首部
至少是20个字节要短，大大减小了网络开销。
计算机网络--刘桂江
83/87
7.2.9 UDP协议简介(3/6)
UDP用户数据报的首部和伪首部
字节
4
4
1
源 IP 地址
目的 IP 地址
0
字节
12
伪首部
2
源端口
UDP 用户数据报
2
目的端口
1
17 UDP长度
2
长度
首部
2
2
检验和
数
据
发送在前
首部
数
据
IP 数据报
计算机网络--刘桂江
84/87
7.2.9 UDP协议简介(4/6)
用户数据报 UDP 有两个字段：数据字段和首部字段。首部字段有 8
个字节，由 4 个字段组成，每个字段都是两个字节。
4
4
1 1
2
字节
0 17 UDP长度
源 IP 地址
目的 IP 地址
字节
12
伪首部
2
源端口
UDP 用户数据报
2
目的端口
2
长度
首部
2
检验和
数
据
发送在前
首部
数
据
IP 数据报
计算机网络--刘桂江
85/87
7.2.9 UDP协议简介(5/6)
在计算检验和时，临时把“伪首部”和 UDP 用户数据报连接在
一起。伪首部仅仅是为了计算检验和。
字节
4
4
1
源 IP 地址
目的 IP 地址
0
字节
12
伪首部
2
源端口
UDP 用户数据报
2
目的端口
1
17 UDP长度
2
长度
首部
2
2
检验和
数
据
发送在前
首部
数
据
IP 数据报
计算机网络--刘桂江
86/87
计算 UDP 检验和的例子
12 字节
伪首部
8 字节
UDP 首部
7 字节
数据
10011001 00010011
00001000 01101000
153.19.8.104
10101011 00000011
171.3.14.11
00001110 00001011
全 0 17
15
00000000 00010001
1087
13
00000000 00001111
15
全0
数据数据数据数据 00000100 00111111
00000000 00001101
数据数据数据全 0
00000000 00001111
00000000 00000000
填充
01010100 01000101
01010011 01010100
01001001 01001110
01000111 00000000
→
→
→
→
→
→
→
→
→
→
→
→
→
→
153.19
8.104
171.3
14.11
0 和 17
15
1087
13
15
0（检验和）
数据
数据
数据
数据和 0（填充）
按二进制反码运算求和 10010110 11101011 → 求和得出的结果
将得出的结果求反码 01101001 00010100 → 检验和
计算机网络--刘桂江
87/87

第七章传输层

Transcript 第七章传输层

Directory