Linux 高级编程 - 底层 IO 函数

底层输入输出(Low-Level I/O)

这篇文章主要介绍 Linux 原生的 IO 操作(Low IO),你可能会想不是有跨平台的 ANSI C 可以使用么,为啥还要学习底层 IO ? 有以下 4 个原因:

  1. 用于读取大块的二进制文件

  2. 在解析之前将整个文件读入内核

  3. 执行数据传输以外的操作

  4. 将描述符传递给子进程


你需要知道这 4 个使用底层 IO 的原因,在以后遇到实际的情况时能够想到利用底层 IO 来解决。因为底层输入输出的函数也有很多,这篇博客主要介绍 5 个最常用,最基本的底层 IO 函数

  1. 打开文件:open

  2. 关闭文件:close

  3. 读取文件:read

  4. 写入文件:write

  5. 操作文件指针:lseek


如果你还有兴趣学习其他的底层 IO 函数,建议你查看 glibc 的官方底层 IO 的学习资料,那是最好,最权威的资料,下面就一起来看看这 5 个函数的用法。

open & close

我们操作 IO 首先要学会的就是打开和关闭文件,我们使用 openclose 这两个函数,他们的声明如下(man 2 open):

横屏阅读代码框效果更好。

open

// open 需要 3 个头文件 #include <sys/types.h> #include <sys/stat.h> #include <fcntl.h> /*
 * filename: 要打开的文件名称
 * flags: 打开标记,例如:O_CREAT | ORDWR 表示文件不存在就创建,并且可读可写
 * mode: 打开权限
 * return: 成功,返回一个新的文件描述符 fd,失败返回 -1,并设置 errno
 */ int open (const char *filename, int flags, mode t mode);

打开文件也可以用 create,不过这个函数已经弃用了!

close

再来看看 close,关闭文件会有如下结果:

  1. 文件描述符被取消分配

  2. 文件上进程所拥有的任何记录锁都将被解锁

  3. 当与管道或 FIFO 相关联的所有文件描述符都已关闭时,任何未读数据被丢弃

#include <unistd.h> /*
 * fd: 要关闭的文件的描述符
 * return: 成功返回 0,失败返回 -1,并设置 errno
 */ int close(int fd);

实例 1: open_close.c

我们来看一个简单的例子:

#include <stdio.h> #include <stdlib.h> #include <unistd.h> #include <sys/types.h> #include <sys/stat.h> #include <fcntl.h> int main(int argc, char* argv[]) { if (argc < 2) { printf("please input filename:\n"); exit(1);
    } // argv[1] = "1.txt", 打开的文件不存在就创建 | 可读可写,666(rw-rw-rw) int fd = open(argv[1], O_CREAT | O_RDWR, 666); if (fd < 0) { printf("file open fail.\n"); exit(1);
    } else { printf("file open success.\n"); // 必须关闭文件 close(fd); printf("file closed.\n");
    } return 0;
}

编译:

gcc open_close.c -o open_close

运行,我们没有新建 1.txt 文件:

./open_close 1.txt
file open success.
file close success.

文件打开成功,并且当前目录下也有了一个 1.txt 文件了,说明我们指定的 O_CREAT标记使得程序建立了这个文件。这两个函数基本用法就是这样,更多更详细的用法还需要你自己到 glibc 官网或者 man 2 open 去找。

read & write

我们在打开文件后肯定会做的就是读写文件了,不然你打开文件干嘛,我们来看看读文件的 API:

read

read 函数从文件描述符 filedes 指定的文件中读取 size 个字节,存储到 buffer 中。

#include <unistd.h> /*
 * filedes: 要读取的文件描述符
 * buffer: 存储读取字节的缓冲区
 * size: 要读取的大小
 * return: 成功返回读取的字节数,失败返回 -1,并设置 errno
 */ ssize_t read (int filedes, void *buffer, size t size);

write

write 函数从 buffer 中取出 size 个字节的数据,写到 filedes 描述符表示的文件中。

#include <unistd.h> /*
 * filedes: 写入的文件描述符
 * buffer: 存储待写入数据的缓存区
 * size: 要写入的字节数
 * return: 成功返回写入的字节数,失败返回 -1,并设置 errno
 */ ssize_t write (int filedes, const void *buffer, size t size);

实例 2: read_write.c

来看一个简单的读写文件的例子:读取 file1 的内容,写到 file2 中,相当于文件拷贝

#include <stdio.h> #include <stdlib.h> #include <fcntl.h> #include <sys/types.h> #include <sys/stat.h> #include <unistd.h> #include <string.h> int main(int argc, char* argv[]) { // 1. 打开两个文件 int fd1 = open(argv[1], O_CREAT | O_RDWR, 0666); int fd2 = open(argv[2], O_CREAT | O_RDWR, 0666); if ((fd1 < 0) || (fd2 < 0)) { printf("file open fail.\n"); exit(1);
    } else { printf("file1 open success: fd1 = %d\n", fd1); printf("file2 open success: fd2 = %d\n", fd2); char buf[1024]; // clear memset(buf, 0, 1024); int read_length = 0; int write_length = 0; // 2. 将文件 1 的内容读取到 buf 中 if ((read_length = read(fd1, buf, 1024)) != -1)  { // 3. 将 buf 的内容写入到文件 2 中 if (read_length == write(fd2, buf, read_length)) printf("write to fd2 success.\n"); else printf("write to fd2 falil.\n");
        } else { printf("read fd1 fail.\n");
        } // 必须关闭 2 个文件 close(fd1);
        close(fd2); printf("file1 close success.\n"); printf("file2 close success.\n");
    } return 0;
}

编译:

gcc read_write.c -o read_write

运行,1.txt 的内容是 hello world

./read_write 1.txt 2.txt

file1 open success: fd1 = 3
file2 open success: fd2 = 4
write to fd2 success.
file1 close success.
file2 close success.

写入成功,查看下 2.txt 的内容:

cat 2.txt

hello world

发现成功写入 hello world 到 2.txt 文件了,并且注意到 fd1 = 3, fd2 = 4,这也说明前面的 3 个文件描述符被系统使用了。

lseek

lseek 用来移动文件指针,什么是文件指针呢?你可以理解为当前读取或者写入的位置,我们移动这个指针可以控制读取或者写入数据的位置,声明如下:

#include <sys/types.h> #include <unistd.h> /*
 * filedes: 要操作的文件描述符
 * offset: 根据当前 whence 的偏移量
 * whence: 指定当前文件指针的位置
 * return: 成功返回设置后的文件位置,可以使用 `SEEK_CUR` 查看当前文件指针位置,
 *         失败返回 -1 并设置 errno
 */ off_t lseek (int filedes, off t offset, int whence);

其中 whence 参数需要特别注意,它有 3 种情况:

  1. SEEK_SET:设置文件指针指向文件开始并偏移 offset 字节处

  2. SEEK_CUR:设置文件指针只想当前位置偏移 offset 字节处

  3. SEEK_END:设置文件指针指向文件末尾偏移 offset 字节处

实例 3:file_length.c

我们可以使用 int file_length = lseek(fd, 0, SEEK_END)求文件的长度,这个操作经常被使用。

#include <stdio.h> #include <stdlib.h> #include <fcntl.h> #include <sys/types.h> #include <unistd.h> int main(int argc, char* argv[]) {  // 打开文件 int fd = open(argv[1], O_CREAT | O_RDWR, 0666);  if (fd < 0) {  printf("file open fail.\n");  exit(1);
    } else {  printf("file1 open success: fd = %d\n", fd);  // 得到文件长度 int file_length = lseek(fd, 0, SEEK_END);  // 输出文件长度 printf("file_length = %d\n", file_length);  // 关闭文件 close(fd); printf("file1 close success.\n");
    } return 0;
}

编译:

gcc file_length.c -o file_length

运行,注意到 1.txt 中的 hello world 加上 ‘\0’ 一共 12 个字符

./file_length 1.txt
file1 open success: fd = 3
file_length = 12
file1 close success.

打印出 12,计算正确啦。

结语

到此,我们就学习了 5 个底层的 IO 函数,并实际练习了几个例子,把这几个例子搞清楚,基本的用法也就掌握的差不多了,更加详细的用法可以查看系统提供的 man 手册 man 2 open 等,或者查阅 glibc 官方文档


#Linux#
全部评论

相关推荐

异步编程是一种编程模式,用于处理可能会花费较长时间的操作,而不会阻塞其他代码的执行。在同步编程中,代码会按照顺序一步一步执行,每个操作的完成都会等待前一个操作完成后才继续执行。这样的执行方式可能会导致程序在等待某些操作完成时出现阻塞,影响用户界面的响应性或导致整个程序的执行速度变慢。异步编程通过将长时间运行的操作(如网络请求、文件读取、数据库查询等)放置在后台,不会阻塞主线程的执行。在进行异步编程时,可以在发起异步操作后继续执行后续的代码,而不需要等待异步操作完成。当异步操作完成时,系统会通知相应的回调函数或执行注册的事件处理程序,以便使用异步操作的结果继续处理。常见的异步编程模式和技术包括:https://www.nowcoder.com/issue/tutorial?zhuanlanId=Mg58Em&amp;uuid=aa2d7fa706914dfc9afef6476efb3004回调(Callback):&nbsp;将一个函数作为参数传递给异步操作,并在操作完成时调用该函数。这是一种传统的异步编程模式,但它容易造成回调地狱(callback&nbsp;hell)的问题,即多层嵌套的回调函数,难以维护和阅读。Promise:&nbsp;Promise&nbsp;是一种表示异步操作的对象,可以在异步操作完成后进行处理。使用&nbsp;Promise,可以链式地调用&nbsp;then()&nbsp;方法来处理成功的结果,以及&nbsp;catch()&nbsp;方法来处理失败的情况,避免了回调地狱问题。Async/await:&nbsp;Async/await&nbsp;是基于&nbsp;Promise&nbsp;的语法糖,它提供了更加简洁和易读的方式来处理异步操作。通过使用&nbsp;async&nbsp;关键字声明一个函数,并在其中使用&nbsp;await&nbsp;关键字等待异步操作的结果,可以以同步的方式编写异步代码。
点赞 评论 收藏
转发
点赞 3 评论
分享
牛客网
牛客企业服务