(3) 使用套接字进行读写

(1) 发送数据

发送数据时常用的有三个函数，分别是 write、send 和 sendmsg。

ssize_t write (int socketfd, const void *buffer, size_t size)
ssize_t send (int socketfd, const void *buffer, size_t size, int flags)
ssize_t sendmsg(int sockfd, const struct msghdr *msg, int flags)

使用场景：

write：常见的文件写函数，如果把 socketfd 换成文件描述符，就是普通的文件写入。
send：可以通过 flag 参数指定选项，发送带外数据。(带外数据，是一种基于 TCP 协议的紧急数据，用于客户端 - 服务器在特定场景下的紧急处理)
senmsg：可以指定多重缓冲区传输数据，以结构体 msghdr 的方式发送数据。

发送缓冲区

当TCP三次握手成功，TCP连接成功建立后，操作系统内核会为每一个连接创建配套的基础设施，比如发送缓冲区。

发送缓冲区的大小可以通过套接字选项来改变

注：当我们的应用程序调用 write 函数时，实际所做的事情是将数据从应用程序中拷贝到操作系统内核的发送缓冲区中，并不一定是把数据通过套接字写出去。

有俩种情况：

第一种情况：操作系统内核的发送缓冲区足够大，可以直接容纳这份数据，程序从 write 调用中返回，返回写入的字节数就是应用程序的数据大小。
第二种情况：操作系统内核的发送缓冲区是够大了，不过还有数据没有发送完，或者数据发送完了，但是操作系统内核的发送缓冲区不足以容纳应用程序数据。操作系统内核并不会返回，也不会报错，而是应用程序被阻塞。(大部分UNIX系统的做法是 一直等到可以把应用程序数据完全放到操作系统内核的发送缓冲区中，再从系统调用中返回)

注：返回的时刻，应用程序数据并没有全部被发送出去，发送缓冲区里还有部分数据，这部分数据会在稍后由操作系统内核通过网络发送出去。

(2) 读取数据

read函数

ssize_t read (int socketfd, void *buffer, size_t size)

read函数要求操作系统内核从套接字描述符socketfd 读取最多多少个字节（size），并将结果存储到 buffer 中。

如果返回值> 0：即实际读取的字节数目
如果返回值= 0，表示 EOF（end-of-file），这在网络中表示对端发送了 FIN 包，要处理断连的情况；
如果返回值= -1，表示出错。(如果是非阻塞 I/O，情况会略有不同)

注：这里是最多读取 size 个字节。如果我们想让应用程序每次都读到 size 个字节，就需要不断地循环读取。

/* 从socketfd描述字中读取"size"个字节. */
size_t readn(int fd, void *buffer, size_t size) {
    char *buffer_pointer = buffer;
    int length = size;

    while (length > 0) {
        int result = read(fd, buffer_pointer, length);
        if (result < 0) {
            if (errno == EINTR)
                continue;       /* 考虑非阻塞的情况，这里需要再次调用read */
            else
                return (-1);
        } else if (result == 0)
            break;               /* EOF(End of File)表示套接字关闭 */

        length -= result;
        buffer_pointer += result;
    }

    return (size - length);       /* 返回的是实际读取的字节数 */
}

6-19 行：的循环条件表示的是，在没读满 size 个字节之前，一直都要循环下去。

10-11 行：表示的是非阻塞 I/O 的情况下，没有数据可以读，需要继续调用 read。

14-15 行：表示读到对方发出的 FIN 包，表现形式是 EOF，此时需要关闭套接字。

17-18 行：需要读取的字符数减少，缓存指针往下移动。

20 行：是在读取 EOF 跳出循环后，返回实际读取的字符数。

(3) 缓冲区实验

用一个客户端 - 服务器的例子来解释一下读取缓冲区和发送缓冲区的概念。在这个例子中客户端不断地发送数据，服务器端每读取一段数据之后进行休眠，以模拟实际业务处理所需要的时间。

服务器端读取数据程序

#include "lib/common.h"

void read_data(int sockfd) {
    ssize_t n;
    char buf[1024];

    int time = 0;
    for (;;) {
        fprintf(stdout, "block in read\n");
        if ((n = readn(sockfd, buf, 1024)) == 0)
            return;

        time++;
        fprintf(stdout, "1K read for %d \n", time);
        usleep(1000);
    }
}


int main(int argc, char **argv) {
    int listenfd, connfd;
    socklen_t clilen;
    struct sockaddr_in cliaddr, servaddr;

    listenfd = socket(AF_INET, SOCK_STREAM, 0);

    bzero(&servaddr, sizeof(servaddr));
    servaddr.sin_family = AF_INET;
    servaddr.sin_addr.s_addr = htonl(INADDR_ANY);
    servaddr.sin_port = htons(12345);

    /* bind到本地地址，端口为12345 */
    bind(listenfd, (struct sockaddr *) &servaddr, sizeof(servaddr));
    /* listen的backlog为1024 */
    listen(listenfd, 1024);

    /* 循环处理用户请求 */
    for (;;) {
        clilen = sizeof(cliaddr);
        connfd = accept(listenfd, (struct sockaddr *) &cliaddr, &clilen);
        read_data(connfd);   /* 读取数据 */
        close(connfd);        /* 关闭连接套接字，注意不是监听套接字*/
    }
}

21-35 行：先后创建了 socket 套接字，bind 到对应地址和端口，并开始调用 listen 接口监听。

38-42 行：循环等待连接，通过 accept 获取实际的连接，并开始读取数据。

8-15 行：实际每次读取 1K 数据，之后休眠 1 秒，用来模拟服务器端处理时延。

客户端发送数据程序

#include "lib/common.h"

#define MESSAGE_SIZE 102400

void send_data(int sockfd) {
    char *query;
    query = malloc(MESSAGE_SIZE + 1);
    for (int i = 0; i < MESSAGE_SIZE; i++) {
        query[i] = 'a';
    }
    query[MESSAGE_SIZE] = '\0';

    const char *cp;
    cp = query;
    size_t remaining = strlen(query);
    while (remaining) {
        int n_written = send(sockfd, cp, remaining, 0);
        fprintf(stdout, "send into buffer %ld \n", n_written);
        if (n_written <= 0) {
            error(1, errno, "send failed");
            return;
        }

        remaining -= n_written;
        cp += n_written;
    }

    return;
}

int main(int argc, char **argv) {
    int sockfd;
    struct sockaddr_in servaddr;

    if (argc != 2)
        error(1, 0, "usage: tcpclient <IPaddress>");

    sockfd = socket(AF_INET, SOCK_STREAM, 0);

    bzero(&servaddr, sizeof(servaddr));
    servaddr.sin_family = AF_INET;
    servaddr.sin_port = htons(12345);
    inet_pton(AF_INET, argv[1], &servaddr.sin_addr);
    int connect_rt = connect(sockfd, (struct sockaddr *) &servaddr, sizeof(servaddr));
    if (connect_rt < 0) {
        error(1, errno, "connect failed ");
    }

    send_data(sockfd);

    exit(0);
}

31-37 行：先后创建了 socket 套接字，调用 connect 向对应服务器端发起连接请求。

43 行：在连接建立成功后，调用 send_data 发送数据。

6-11 行：初始化了一个长度为 MESSAGE_SIZE 的字符串流。

16-25 行：调用 send 函数将 MESSAGE_SIZE 长度的字符串流发送出去。