**欢迎大家前往[腾讯云+社区](https://cloud.tencent.com/developer/?fromSource=waitui),获取更多腾讯海量技术实践干货哦~**
> 本文由[jackieluo](https://cloud.tencent.com/developer/user/1205848?fromSource=waitui)发表于[云+社区专栏](https://cloud.tencent.com/developer/column/4514?fromSource=waitui)
## TCP客户端-服务器典型事件
下图是TCP客户端与服务器之间交互的一系列典型事件时间表:
1. 首先启动服务器,等待客户端连接
2. 启动客户端,连接到服务器
3. 客户端发送一个请求给服务器,服务器处理请求,响应客户端
4. 循环步骤3
5. 客户端给服务器发一个文件结束符,关闭客户端连接
6. 服务器也关闭连接
![img](https://ask.qcloudimg.com/draft/1205848/k2dav9qf7d.png?imageView2/2/w/1620)基本TCP客户-服务器程序的套接口函数
## 套接口编程基本函数
### socket 函数
为了执行网络I/O,一个进程(无论是服务端还是客户端)必须做的第一件事情就是调用`socket`函数。
```js
#include <sys/socket.h> /* basic socket definitions */
int socket(int family, int type, int protocol);/* 返回:非负描述字——成功,-1——出错 */
```
- `family`——协议族
| 族 | 解释 |
| ---------- | ---------- |
| `AF_INET` | IPv4协议 |
| `AF_INET6` | IPv6协议 |
| `AF_LOCAL` | Unix域协议 |
| `AF_ROUTE` | 路由套接口 |
| `AF_KEY` | 密钥套接口 |
- `type`——套接口类型
| 类型 | 解释 |
| ------------- | ------------ |
| `SOCK_STREAM` | 字节流套接口 |
| `SOCK_DGRAM` | 数据报套接口 |
| `SOCK_RAW` | 原始套接口 |
下面是有效的`family`和`type`组合(简略版):
| | `AF_INET` | `AF_INET6` |
| ------------- | --------- | ---------- |
| `SOCK_STREAM` | TCP | TCP |
| `SOCK_DGRAM` | UDP | UDP |
| `SOCK_RAW` | IPv4 | IPv6 |
`socket`函数返回一个套接口描述字,简称套接字(`sockfd`)。获取套接字无需指定地址,只需要指定协议族和套接口类型(如上表中的组合)。
### connect函数
TCP客户用`connect`函数来建立一个与TCP服务器的连接。
```js
#include <sys/socket.h> /* basic socket definitions */
int connect(int sockfd, const struct sockaddr * servaddr, socklen_t addrlen);/* 返回:0——成功,-1——出错 */
```
- 参数`sockfd`便是`socket`函数返回的套接口描述字。
- 套接口地址结构`servaddr`必须包含服务器的IP地址和端口号。
- 客户端不必非要绑定一个端口(调用`bind`函数),内核会选择源IP和一个临时端口。
- `connect`函数会触发TCP三次握手。有可能出现下面的错误情况:
1.客户端未收到`SYN`分节的响应
第一次发出未收到,间隔6s再发一次,再没收到,隔24秒再发一次,总共等待75s还没收到则返回错误( `ETIMEDOUT`)。可以用时间日期程序验证一下:
查看本地网络信息:
```js
JACKIELUO-MC0:intro jackieluo$ ifconfig
en0: flags=8863<UP,BROADCAST,SMART,RUNNING,SIMPLEX,MULTICAST> mtu 1500
ether f4:0f:24:2a:72:a6
inet6 fe80::1830:dbd:1b29:2989%en0 prefixlen 64 secured scopeid 0x6
inet 192.168.0.101 netmask 0xffffff00 broadcast 192.168.0.255
nd6 options=201<PERFORMNUD,DAD>
media: autoselect
status: active
```
将程序指向本地地址`192.168.0.101`(确保时间日期服务器程序已运行),成功:
```js
JACKIELUO-MC0:intro jackieluo$ ./daytimetcpcli 192.168.0.101
Sat Oct 6 17:06:55 2018
```
将程序指向本地子网地址`192.168.0.102`,其主机ID(102)不存在,等待几分钟后超时返回:
```js
JACKIELUO-MC0:intro jackieluo$ ./daytimetcpcli 192.168.0.102
connect error: Operation timed out
```
2.收到`RST`
即服务器主机在指定端口上没有等待连接的进程,这称为“hard error”,客户端一接收到`RST`,马上返回错误(`ECONNREFUSED`)。验证:
关闭之前本机运行的`daytimetcpsrv`进程
将程序指向本地地址`192.168.0.101`:
```js
JACKIELUO-MC0:intro jackieluo$ ./daytimetcpcli 192.168.0.101
connect error: Connection refused
```
3.发出的`SYN`在路由器上引发了目的不可达`ICMP`错误
这个错误被称为“soft error”,最终返回`EHOSTUNREACH`或者`ENETUNREACH`。
### bind函数
函数`bind`为套接口分配一个本地协议地址,包括IP地址和端口号。
```js
#include <sys/socket.h> /* basic socket definitions */
int bind(int sockfd, const struct sockaddr * servaddr, socklen_t addrlen);/* 返回:0——成功,-1——出错 */
```
- 客户端可以不调用这个函数,由内核选择一个本地ip的临时端口就好。
- 服务器一般都会调用`bind`函数绑定ip地址和端口,供客户端调用。一个例外是RPC(远程过程调用)服务器,它由内核为其选择临时端口。然后通过RPC端口映射器进行注册,客户端与该服务器连接之前,先通过端口映射器获取服务器的端口。
- 进程可以把一个特定的IP地址捆绑到它的套接口上。对于客户端,它发送的请求,源IP地址就是这个地址;对于服务器,如果绑定了IP地址,则只接受目的地为此IP地址的客户连接。
- 如果服务器不把IP地址绑定到套接口上,那么内核把客户端发送`SYN`所在分组的目的IP地址作为服务器的源IP地址。(即服务器收到`SYN`的IP)
给函数`bind`指定用于捆绑的IP地址和/或端口号的结果:
| IP地址 | 端口 | 结果 |
| ---------- | ---- | ---------------------------- |
| | 0 | 内核选择IP地址和端口 |
| | 非0 | 内核选择IP地址,进程指定端口 |
| 本地IP地址 | 0 | 进程选择IP地址,内核指定端口 |
| 本地IP地址 | 非0 | 进程选择IP地址和端口 |
### listen函数
函数`listen`仅被TCP服务器调用。
```js
#include <sys/socket.h> /* basic socket definitions */
int listen(int sockfd, int backlog);/* 返回:0——成功,-1——出错 */
```
调用函数`socket`函数创建的套接口,默认是主动方,下一步应是调用`connect`,`CLOSED`的下一个状态是`SYN_SENT`(见TCP状态转换图)。而函数`listen`将套接口转换成被动方,告诉内核,应接受指向此套接口的连接请求,`CLOSED`状态变成`LISTEN`。
函数`listen`的第二个参数`backlog`表示内核为此套接口排队的最大连接数。对于给定的监听套接口,内核会维护两个队列:
1. 未完成连接队列(incomplete connection queue) SYN分节已由客户发出,到达服务器,正在进行TCP的三路握手。此时这些套接口处于`SYN_RCVD`状态。
2. 已完成连接队列(completed connection queue) SYN分节已由客户发出,到达服务器,并且已完成三路握手。此时这些套接口处于`ESTABLISHED`状态。
3. 当来自客户的SYN到达时,TCP在未完成连接队列中创建一个新条目,直到三路握手中,第三个分节(客户对服务SYN的ACK)到达,这个条目移到已完成连接队列的队尾。
4. 当进程调用`accept`函数时,已完成连接队列的头部条目返回给进程。
5. 两个队列之和不能超过`backlog`
6. 当一个客户SYN到达时,若这两个队列都是满的,TCP就忽略此分节,且不发送RST。客户TCP将重发SYN,期望不久就能在队列中找到空闲位置。
![img](https://ask.qcloudimg.com/draft/1205848/3zveblq98i.png?imageView2/2/w/1620)TCP为监听套接口维护的两个队列
### accept函数
函数`accept`由TCP服务器调用,从已完成连接队列头部返回下一个已完成连接,若该队列为空,则进程睡眠(假定套接口为默认的阻塞方式)。
```js
#include <sys/socket.h> /* basic socket definitions */
int accept(int sockfd, struct sockaddr *cliaddr, socklen_t *addrlen);/* 返回:非负描述字——成功,-1——出错 */
```
函数`accept`的第一个参数和返回值都是套接口描述字。其中,
1. 第一个参数,称为监听套接口描述字,即由函数`socket`返回,也用于`bind`,`listen`的第一个参数。
2. 返回值,称为已连接套接口描述字。
通常一个服务器,只生成一个监听套接口描述字,直到其关闭。而内核为每个被接受的客户连接,创建一个已连接套接口,当客户连接完成时,关闭该已连接套接口。
注意到`intro/daytimetcpsrv.c`中,后两个参数传的都是空指针,这是因为我们不关注客户的身份,无需知道客户的协议地址。
```js
connfd = Accept(listenfd, (SA *) NULL, NULL);
```
稍作修改,不再传入空指针,见`intro/daytimetcpsrv1.c`:
```js
socklen_t len;
struct sockaddr_in servaddr, cliaddr;
...
connfd = Accept(listenfd, (SA *) &cliaddr, &len);
printf("connection from %s, port %d\n",
Inet_ntop(AF_INET, &cliaddr.sin_addr, buff, sizeof(buff)),
ntohs(cliaddr.sin_port));
```
kill掉之前的`daytimetcpsrv`进程:
```js
$ sudo lsof -i -P | grep -i "listen"
daytimetc 80986 root 3u IPv4 0xae12d925e4528793 0t0 TCP *:13 (LISTEN)
$ sudo kill -9 80986
```
编译运行新的服务端程序:
```js
$ make daytimetcpsrv1.c daytimetcpsrv1
$ ./daytimetcpsrv1
```
重复执行客户端程序,发几个请求:
```js
$ ./daytimetcpcli 127.0.0.1
Wed Sep 26 14:11:20 2018
$ ./daytimetcpcli 127.0.0.1
Wed Sep 26 14:17:06 2018
```
查看服务端打印:
```js
connection from 127.0.0.1, port 58201
connection from 127.0.0.1, port 58342
```
注意到,由于客户端程序没有调用`bind`函数,内核为它的协议地址选择了源ip作为IP地址,临时端口号也发生了变化。
### fork和exec函数
```js
#include <unistd.h>
pid_t fork(void);/* 返回:在子进程中为0,在父进程中为子进程ID,-1——出错 */
```
`fork`函数调用一次,却返回两次。
1. 在调用它的进程(即父进程),它返回一次,返回值是派生出来的子进程的进程ID。 父进程可能有很多子进程,必须通过返回值跟踪记录子进程ID。
2. 在子进程,它还返回一次,返回值为0。 子进程只有一个父进程,总可以通过`getppid`来得到父进程的ID
通过返回值可以判断当前进程是子进程还是父进程。
父进程在调用`fork`之前打开的所有描述字在函数`fork`返回后都是共享的。网络服务器会利用这一特性:
1. 父进程调用`accept`。
2. 父进程调用`fork`,已连接套接口就在父进程与子进程间共享。(一般来说就是子进程读、写已连接套接口,而父进程关闭已连接套接口)。
`fork`有两个典型应用:
1. 一个进程为自己派生一个拷贝,并发执行任务,这也是典型的并发网络服务器模型。
2. 一个进程想执行其他的程序,于是调用`fork`生成一个拷贝,利用子进程调用`exec`来执行新的程序。典型应用是shell。
以文件形式存储在硬盘上的可执行程序若要被执行,需要由一个现有进程调用`exec`函数。我们将调用`exec`的进程称为调用进程,新程序的进程ID并不改变,仍处于当前进程。
## 小结
客户和服务器,从调用`socket`开始,返回一个套接口描述字。客户调用`connect`,服务器调用`bind`、`listen`、`accept`。最后套接口由`close`关闭。
多数TCP服务器是调用`fork`来实现并发处理多客户请求的。多数UDP服务器则是迭代的。
> **相关阅读**
> [系统重启后nginx reload不生效原因分析](https://cloud.tencent.com/developer/article/1339917?fromSource=waitui)
> [SRS开源直播服务 - StateThreads微线程框架学习](https://cloud.tencent.com/developer/article/1197338?fromSource=waitui)
> [高性能网络编程3----TCP消息的接收](https://cloud.tencent.com/developer/article/1345058?fromSource=waitui)
> [【每日课程推荐】机器学习实战!快速入门在线广告业务及CTR相应知识](https://cloud.tencent.com/developer/edu/course-1128?fromSource=waitui)
**此文已由作者授权腾讯云+社区发布,更多原文请[点击](https://cloud.tencent.com/developer/article/1351071?fromSource=waitui )**
**搜索关注公众号「云加社区」,第一时间获取技术干货,关注后回复1024 送你一份技术课程大礼包!**
海量技术实践经验,尽在[云加社区](https://cloud.tencent.com/developer?fromSource=waitui)!
有疑问加站长微信联系(非本文作者))