备份脚本

一、日常备份

如果你正在使用 Linux 系统处理一个重要的项目,那么可以创建一个 shell 脚本来自动备份特定目录。这有助于避免从主归档文件main archive file )执行耗时的恢复过程。

1.1 基本功能拆解

在 Linux 世界中,备份数据的工作是由 tar 命令完成的。

  • 先来看一个使用 tar 命令来创建工作目录归档文件的例子:
# 1.列出待归档的文件。
[root@VM-8-11-centos tmp]# ls
a.txt  b.txt  c.txt  dir1  dir2  error.log  info.log  service.log  test.txt
[root@VM-8-11-centos tmp]# 

# 2.创建归档。
# 注意:(tar)命令会显示一条警告消息,指出它删除了路径开头的斜线。这意味着将路径从绝对路径改为了相对路径,以便将(tar)归档文件提取到文件系统中的任何位置。
[root@VM-8-11-centos tmp]# tar -cf archive.tar /home/tmp/*.*
tar: Removing leading `/' from member names
[root@VM-8-11-centos tmp]# 

# 3.列出创建完成的归档。
[root@VM-8-11-centos tmp]# ls archive.tar 
archive.tar
[root@VM-8-11-centos tmp]# 
  • 如果不想在脚本中输出警告消息,则可以将 STDERR 重定向到 /dev/null 文件:
# 1.创建归档时,重定向警告信息。
[root@VM-8-11-centos tmp]# tar -cf archive.tar /home/tmp/*.* 2>/dev/null 
[root@VM-8-11-centos tmp]# 

# 2.列出创建完成的归档。
[root@VM-8-11-centos tmp]# ls archive.tar 
archive.tar
[root@VM-8-11-centos tmp]# 
  • 由于 tar 归档文件会占用大量的磁盘空间,因此最好压缩一下。对此,我们可以使用 -z 选项。(会使用 gzip 压缩 tar 归档文件)
  • 另外,采用 .tar.gz.tgz 表示是经过 gzip 压缩过的文件:
# 1.加入(-z)选项,并以(.tgz)命名创建压缩归档。
[root@VM-8-11-centos tmp]# tar -zcf archive.tgz /home/tmp/*.* 2>/dev/null
[root@VM-8-11-centos tmp]# 

# 2.经过压缩后的归档(.tgz后缀),字节数明显小于未压缩归档(.tar后缀)。
[root@VM-8-11-centos tmp]# ls -l archive.*
-rw-rw-r--+ 1 root root 10240 Jul 10 15:39 archive.tar
-rw-rw-r--+ 1 root root   900 Jul 10 15:47 archive.tgz
[root@VM-8-11-centos tmp]# 
  • 配置文件中包含我们希望纳入归档的所有目录的绝对路径
# 1.查看配置文件内容。(Does_not_exist 表示不存在的路径,用于稍后脚本的测试。)
[root@VM-8-11-centos tmp]# cat file_path.conf 
/home/jan/BackupScriptProject/ 
/home/jan/Downloads/ 
/home/jan/Does_not_exist/ 
/home/jan/PythonConversion/
[root@VM-8-11-centos tmp]# 
  • 为了让脚本读取配置文件,将每个目录名加入归档列表中,这需要用到 read 命令。并使用 exec 命令来重定向标准输入(STDIN):
# $config_file:读取配置文件的每一条记录。
exec 0<$config_file 
read -r file_name

# 循环读:一旦(read)命令读到配置文件的末尾,就会$?变量返回一个非0状态码。这时,脚本会退出(while)循环。
while [ $? -eq 0 ]; do
    # TODO
    read -r file_name
done
  • 在 while 循环中,需要做两件事:首先,必须将目录名加入归档列表;其次,但更重要的是,要检查目录是否存在
    # 确保是文件或者目录。
    if [ -f $file_name ] || [ -d $file_name ]; then
        # 添加至集合。
        file_list="$file_list $file_name"
    else
        # 不是文件或者目录则进行提示。
        echo
        echo "$file_name, does not exist."
        echo "Obviously, I will not include it in this archive."
        echo "It is listed on line $file_no of the config file."
        echo "Continuing to build archive list..."
        echo
    fi
    # file_no 记录在归档配置文件的哪一行中含有不正确或缺失的文件或目录。
    file_no=$((file_no + 1))

1.2 创建按日归档文件的存放位置

如果只需要备份少量文件,那么将这些归档文件放在个人目录中即可。但如果要对多个目录进行备份,则最好还是创建一个集中的归档仓库目录。

  • 创建仓库及关联组过程
# 1.创建归档仓库目录。
[root@VM-8-11-centos home]# sudo mkdir /archive
[root@VM-8-11-centos home]#

# 2.检查创建好的归档仓库目录。
[root@VM-8-11-centos home]# ls -ld /archive/
drwxr-xr-x 2 root root 4096 Jul 10 17:28 /archive/
[root@VM-8-11-centos home]# 

# 3.添加组(Archivers)并关联用户(jan),最后再对组添加读写执行权限。
# 将用户添加到 Archivers 组后,用户必须先登出然后再登入,这样才能使组成员关系生效。
# 现在只要是该组的成员,无须超级用户权限就可以在目录中创建文件了。
[root@VM-8-11-centos home]# sudo groupadd Archivers
[root@VM-8-11-centos home]# 
[root@VM-8-11-centos home]# sudo chgrp Archivers /archive
[root@VM-8-11-centos home]# 
[root@VM-8-11-centos home]# ls -ld /archive
drwxr-xr-x 2 root Archivers 4096 Jul 10 17:28 /archive
[root@VM-8-11-centos home]# 
[root@VM-8-11-centos home]# sudo usermod -aG Archivers jan
[root@VM-8-11-centos home]# 
[root@VM-8-11-centos home]# sudo chmod 775 /archive/
[root@VM-8-11-centos home]# 
[root@VM-8-11-centos home]# ls -ld /archive/
drwxrwxr-x 2 root Archivers 4096 Jul 10 17:28 /archive/
[root@VM-8-11-centos home]# 

# 4.移动配置文件到归档仓库目录。
[root@VM-8-11-centos tmp]# mv file_path.conf /archive/
[root@VM-8-11-centos tmp]# 
[root@VM-8-11-centos tmp]# ls /archive/
file_path.conf
[root@VM-8-11-centos tmp]# 

1.3 创建按日归档的脚本

Daily_Archive.sh 脚本会自动在指定位置创建一个归档文件,并使用当前日期作为该文件的唯一标识。

  • 脚本内容
#!/bin/bash
####################  相关信息  ####################
# 包名通过日期区分。
today=$(date +%y%m%d)
backupfile=archive$today.tar.gz
# 配置文件及归档的目标目录。
config_file=/archive/file_path.conf
destination=/archive/$backupfile

####################  处理逻辑  ####################
# 确保配置文件是存在的。
if [ -f $config_file ]; then
    # 存在则什么也不用做。
    echo
else
    # 不存在则进行提示。
    echo
    echo "$config_file does not exist."
    echo "Backup not completed due to missing Configuration File"
    echo
    exit
fi
# 记录行数。
file_no=1
# 从配置文件中获取输入。
exec 0<$config_file
read -r file_name
# 循环读。
while [ $? -eq 0 ]; do
    # 确保是文件或者目录。
    if [ -f $file_name ] || [ -d $file_name ]; then
        # 添加至集合。
        file_list="$file_list $file_name"
    else
        # 不是文件或者目录则进行提示。
        echo
        echo "$file_name, does not exist."
        echo "Obviously, I will not include it in this archive."
        echo "It is listed on line $file_no of the config file."
        echo "Continuing to build archive list..."
        echo
    fi
    # 记录行号。
    file_no=$((file_no + 1))
    # 读取下一条。
    read -r file_name
done
#
echo "Starting archive..."
echo
# 判断归档文件列表是否为空。
if [ -n "${file_list[*]}" ]; then
    tar -czf $destination $file_list 2>/dev/null
    echo "Archive completed"
    echo "Resulting archive file is: $destination"
    echo
else
    echo "file_list is empty."
fi
# 退出。
exit

1.4 运行按日归档的脚本

在测试脚本之前,别忘了修改脚本文件的权限。文件属主必须被赋予可执行权限(x)才能运行脚本.

  • 运行脚本
# 1.添加执行权限。
[root@VM-8-11-centos archive]# ls -og Daily_Archive.sh 
-rw-r--r-- 1 1533 Jul 13 15:38 Daily_Archive.sh
[root@VM-8-11-centos archive]# 
[root@VM-8-11-centos archive]# chmod u+x Daily_Archive.sh 
[root@VM-8-11-centos archive]# 
[root@VM-8-11-centos archive]# ls -og Daily_Archive.sh 
-rwxr--r-- 1 1533 Jul 13 15:38 Daily_Archive.sh
[root@VM-8-11-centos archive]#

# 2.当前目录下的文件。
[root@VM-8-11-centos archive]# ls 
Daily_Archive.sh  file_path.conf  temp.sh

# 3.运行脚本。
[root@VM-8-11-centos archive]# ./Daily_Archive.sh 


/home/jan/Does_not_exist/, does not exist.
Obviously, I will not include it in this archive.
It is listed on line 3 of the config file.
Continuing to build archive list...

Starting archive...

Archive completed
Resulting archive file is: /archive/archive230713.tar.gz

[root@VM-8-11-centos archive]#

# 4.生成了压缩归档文件。
[root@VM-8-11-centos archive]# ls 
archive230713.tar.gz  Daily_Archive.sh  file_path.conf  temp.sh

# 5.查看 tar 压缩文件的内容。
[root@VM-8-11-centos archive]# 
[root@VM-8-11-centos archive]# tar -tf archive230713.tar.gz 
home/jan/BackupScriptProject/
home/jan/BackupScriptProject/1.txt
home/jan/Downloads/
home/jan/Downloads/2.txt
home/jan/PythonConversion/
home/jan/PythonConversion/3.txt
[root@VM-8-11-centos archive]# 
  • 由于这是一个重要的脚本,因此请考虑使用 anacron 程序,以便让它每天都运行,而无须担心是否忘记启动脚本。
  • 提示
    • tar 只是使用 bash shell 命令在系统中执行备份的一种方法。
    • 有一些其他的实用程序(或命令组合)也许能更好地满足你的需求,比如 rsync
    • 要查看可能有助于备份工作的各种实用工具名称,可以在命令行提示符下输入 man -k archive 和 man -k copy。

二、创建按小时归档的脚本

如果你处于文件改动非常频繁的高产量生产环境中,那么按日归档可能无法满足需求。

2.1 目录层级

  • 按小时备份文件时,如果依然使用 date 命令为每个归档文件加入时间戳,那么随着日积月累在同一目录下的文件会越来越多,不方便查阅。
  • 因此我们可以对目录层级进行优化。不必将所有的归档文件都放到同一目录中,可以为归档文件创建一个目录层级
  • 示意图
                                                                 日期

                                      月份                   +---------+
                                                      +----->+  day|01 |
                                  +---------+         |      +---------+
                                  |         |         |
                     +------------+   01月  +---------+
                     |            |         |         |
     基点            |            +---------+         |      +---------+
                     |                                +----->+  day|02 |
 +----------+        |            +---------+                +---------+
 |          |        |            |         |
 |          +---------------------+   02月  |
 |          |        |            |         |
 +----------+        |            +---------+
                     |
/archive/hourly      |            +---------+
                     |            |         |
                     +------------+   ...   |
                                  |         |
                                  +---------+

  • 这个归档目录包含了与一年中的各个月份相对应的子目录并以月份命名,而每月的目录中又包含与当月各天相对应的子目录并以天的序号命名。

  • 这样你只需给每个归档文件加上时间戳,然后将其放入与月日对应的目录中即可。

  • 首先必须创建新目录 /archive/hourly 并设置适当的权限

# 1.创建hourly目录。
[root@VM-8-11-centos ~]# sudo mkdir /archive/hourly
[root@VM-8-11-centos ~]# 

# 2.关联该目录的所属组(Archivers)。
[root@VM-8-11-centos ~]# sudo chgrp Archivers /archive/hourly
[root@VM-8-11-centos ~]# 

# 3.列出目录本身的信息,包括所有权信息和所属组信息。
[root@VM-8-11-centos ~]# ls -ogd /archive/hourly/
drwxr-xr-x 2 4096 Jul 14 11:09 /archive/hourly/
[root@VM-8-11-centos ~]# 

# 4.赋予主和组的读写执行权限。
[root@VM-8-11-centos ~]# sudo chmod 775 /archive/hourly
[root@VM-8-11-centos ~]# 

# 5.权限赋予完成。
[root@VM-8-11-centos ~]# ls -ogd /archive/hourly/
drwxrwxr-x 2 4096 Jul 14 11:09 /archive/hourly/
[root@VM-8-11-centos ~]# 
  • 新目录设置好之后,需要将按小时归档的配置文件 file_path.conf 移到该目录中
# 1.当前所在目录。
[root@VM-8-11-centos archive]# pwd
/archive
[root@VM-8-11-centos archive]# 

# 2.将按小时归档的配置文件移到当前目录。
[root@VM-8-11-centos archive]# mv /archive/file_path.conf /archive/hourly/
[root@VM-8-11-centos archive]# 

# 3.配置文件移动完成。
[root@VM-8-11-centos archive]# cd /archive/hourly/
[root@VM-8-11-centos archive]# 
[root@VM-8-11-centos hourly]# ls
file_path.conf
[root@VM-8-11-centos hourly]#  
  • 只需要修改脚本的相关信息部分(处理逻辑部分与按日归档的脚本一致):
[root@VM-8-11-centos hourly]# cat Hourly_Archive.sh 
#!/bin/bash
####################  相关信息  ####################
# 基点目录。
basedest=/archive/hourly
# 月日及时分。
month=$(date +%m)
day=$(date +%d)
time=$(date +%k%M)
# 递归创建目录及子目录。
mkdir -p $basedest/$month/$day
# 配置文件及归档的目标目录。
config_file=/archive/hourly/file_path.conf
destination=$basedest/$month/$day/archive$time.tar.gz

####################  处理逻辑  ####################
...

2.2 运行按小时归档的脚本

最好通过 date 命令来获取当前的小时数和分钟数,有了这些信息才能验证最终的归档文件名的正确性。

  • 运行脚本
# 1.赋予执行权限。
[root@VM-8-11-centos hourly]# chmod u+x Hourly_Archive.sh 
[root@VM-8-11-centos hourly]# 

# 2.先通过命令检查当前的时和分。
[root@VM-8-11-centos hourly]# date +%k%M
1419
[root@VM-8-11-centos hourly]# 

# 3.运行脚本。
[root@VM-8-11-centos hourly]# ./Hourly_Archive.sh 


/home/jan/Does_not_exist/, does not exist.
Obviously, I will not include it in this archive.
It is listed on line 3 of the config file.
Continuing to build archive list...

Starting archive...

Archive completed
Resulting archive file is: /archive/hourly/07/14/archive1419.tar.gz

[root@VM-8-11-centos hourly]# 

# 4.查看 tar 压缩文件的内容。
[root@VM-8-11-centos hourly]# tar -tf /archive/hourly/07/14/archive1419.tar.gz 
home/jan/BackupScriptProject/
home/jan/BackupScriptProject/1.txt
home/jan/Downloads/
home/jan/Downloads/2.txt
home/jan/PythonConversion/
home/jan/PythonConversion/3.txt
[root@VM-8-11-centos hourly]# 

三、结束语

“-------怕什么真理无穷,进一寸有一寸的欢喜。”

微信公众号搜索:饺子泡牛奶

全部评论

相关推荐

04-26 14:36
已编辑
郑州信息科技职业学院 Java
由于高考成绩不是很理想,听取了张雪峰老师的建议,优先选了专业并且当时的想法就是选一个能赚钱的专业,于是最终选择了报了一个能收留我的有计算机专业的学校。当时听张雪峰老师说河南的学习氛围很好,所以就想去体验一下,事实雀食如张雪峰老师所说,大家都一股脑的铺在学习这条路上。可能是因为那边氛围导致的吧,我一开始想的也是卷学习卷绩点,所以大一的时候就一直在学习硬试教育的一些东西,学期结束了,排名出来的时候中上水平吧,据我了解保研的只有前5名可能会有机会,当时的心里就想着,我这成绩再卷也卷不到哪去了,并且保研也无望了,总结的说,一些事情只有真正做了才知道是不是自己所追求的。说了很多废话吧,剩下的关于学校的就长话短说了吧。大二很多专业课基本上要从早八上到晚上,但基本上我都是不去,不如自学现在新媒体技术这么发达,并且还可以学一下自己需要的技术栈,由于学校的课程原因对其他的技术栈不是很了解,所以,一心就投入在Java这个方向了,但是,Python也会学一下,这是因为加入实验室,实验室老师是做人工智能方向的缘故。现在回想,我大二当时还是学的太慢了,还有就是信息差太大了,出来工作之后才发现有些佬们已经大二就出来实习,并且八股就背的滚瓜烂熟了。只能说这里的学习氛围很好吧,走廊里都是背书刷题的声音,跟身边的同学和实验室的同学谈是否直接就业的事,他们要么都是说考研,要么对直接就业很含糊,可能是因为觉得自己学的还不够吧,我想说,学的不够就干中学呗,反正,我先迈出去这步再说。到了大三上还是没有找工作的打算,因为身边的人也都还没有这个意识吧,现在跟了身边的同事聊天才知道,我的信息差太大了。到了大三下刚开始,我才开始正式的踏上求职路,当时的信息差还是很大的,根本就不敢碰瓷大厂,想着有一个公司能要再说吧,并且地域也限制的很死,只想着在本地找一下,因为怕学校找事(我想这是学校一贯操作了),在本地吧,他们大多数都是接受的线下面,一开始面了一个,可能自己比较摆也很悲观,就显得我很差吧,hr面完就没后续了,最终终于有一个面,并且也展示出自己的自信和对专业的理解了,最后,我也没想着这么多背调公司呀,当个备选什么的就直接去了。也算是我的第一家正式的公司吧(之前都是线上的码农兼职),干多了就发现,这个公司压根学不到东西,并且薪资低的,因为我是第一个进来的计算机实习生,有一个同事干了两三年的吧,带着我做的时候是真能学到东西,但是,最后那个同事离职了,我就只能和学艺术的老板直接汇报项目进度,一个学艺术的来指导我这个科班出身的就很离谱的好吧。最后,我也离职了,也跟前同事聊了很久,她说我是她见过大三就能学到这程度,已经超过很多人了,并且她当时在的时候还说我是内定能转正的。并且还说我真的可以去考研。我也仔细思考了一下,我决定让自己沉淀一下再出发吧,先备考了软件设计师,然后期末考,大三暑期的时候就充实自己的简历,并且也认识了一个某东的老哥,也用了内推码,教我了怎么写好简历量化成果之类的,总之,很感谢一路走来帮助我的人吧,并且我在边充实自己的同时也在边投递简历,但当时卡的也很死,要选base地在河南附近的,不像现在全国可飞。面了很多base地在学校附近的,然后,还有一个北京的py和杭州的java,最终就这两个地方给了offer,但是都是实习转正的,不是秋招offer,因为觉得Java的太卷了,然后,面试的时候也会感觉压力很大,所以就把杭州的那个拒了,去了北京的,北京是免费住的房子(三个月这是伏笔),当时觉得环境很好,但是合租室友的作息跟自己的作息不一样就很不习惯,于是,我就想着要是三个月后我一定要找一个单间的哪怕破一点。北京这个公司吧就很像国企的感觉,早九晚五,当月发当月工资,并且干的活接触的数据量都不是很大,就是干了很多杂活,并且mentor和部门的领导都不是技术出身,所以,我能学到的东西少之又少,但是吧,学习是自己的事,而且这部门不是很忙对于实习生来说,我完全可以学自己的东西(前提是不被发现)。到最后这个部门的氛围就很微妙,我遇到不会的问他们我应该怎么做的时候,他们说让我自己想,我当时就想说,神人一个,啥都不说让我自己干,干出来又不满意,你说你让我干py的东西你不会我就不说啥了,让我干无关代码的东西,让我调研项目应该做些什么内容,现在回想都是泪呀,我就这样被欺压的过完了三个月,最后免费住的地方也到期了,伏笔来了,最后,找我谈话说你技术可以了能看出来,因为你也自己独立完成了消息通知那一块内容嘛,但是,由于我们部门干的活比较杂并且我也缺少一些电力相关的一些知识,所以,觉得不合适。(OS:其实我对每一份工作都是真心换真心的,并且这些电力知识我也知道我有一点欠缺所以我也有自己再学习,你们啥也不教我,最后把屎盆子把我头上扣)最后,回到了学校,心态也发生了变化,想着做啥都不如找一个稳定的工作重要,想着回家沉淀吧,少年终有出头日。但是,计划赶不上变化,之前那个同事,内推了我去她现在的公司,并且是做AI应用的也是我想接触的,并且还是与我上家的业务场景类似的,真的感谢那个同事,俗话说:千里马常有而伯乐不常有。并且那里的部门领导也很好,并且说我虽然不是电力相关出身的,但是能做的这样已经很不错了,所以DDDD,由于各种不可抗力因素吧,还是想找一个离家近,然后不是很像小作坊的感觉(这个公司虽然比较小,但是比之前那个大的公司的氛围和待遇一点都不差的好吧甚至更好)。最终,在学校也呆了一个月吧,也陆陆续续面了一个月有一个C厂的面答的都挺好直接就谈薪了,但是风评不好还是保命要紧,还有各种的中小厂面吧,但感觉都不是自己想要的,只是想刷刷面试经验吧(这是某东哥告诉我的,与其一直改简历不如去多面)。最后,在校期间面了一个比较合适的某鸦智能,一直推进到了HR面,但是最后被横向了,开始复盘,被横向了属实是没招了,经历了这么多大风大浪什么场面没见过。过年期间,求职路线关闭,把自己缺少的技术栈和简历中的项目业务理清楚说明白。年过完就要开始加入找工作大军中了,把节前没面完的先面了,节后一开始就是某鸟的HRG面,聊的就很憋屈的感觉,问我技术方面的,说我说的很像AI的(我心想跟你说具体的细节你又说我不想听技术的,说的比较宽泛浅显说我AI)。最后,反正体验感不是很好的结束了吧。说一个星期等通知,等了两个星期才说是通过的(我认为是排名靠前的那些人没去,顺位到我了)。那你既然这样说了,那我就接受吧。还没入职就问我要身份证信息要这要那的,最后都给过去了,说HC调整,要重新review,又又又一次被恶心到了。后面就是陆续的沉淀面试等,我当时的重心已经完全的想着私企没人要,就去试试考公和考央国企了,毕竟我的履历不看学历的话放到电网当中还是可以的。私企的话有一个外企洋里洋气的说话,问我怎么口语这么好?我说这叫智取,宝贝。虽然这个tek外企过了,但是还有一个openday要去线下,来回的衣食住行不是很方便也不是很想去所以就拒绝了没去。后来就收到了,国网网申通过的通知,说实话,我之前问了很多我们学校历年有没有考央国企之类的案例,很显然都不知道,也可以说少之又少吧,于是我就奔赴京城进京赶考,唉,时间不太合适就想着算了吧,再等等,好事多磨,宁缺毋滥吧。金三银四终于等来了面试的机会,这个岗位我只能说我不是很熟悉,但是语言这东西吧都是相通的,重要的是我要把其中的内核搞懂,梳理清楚业务逻辑。最终,来到了这家公司,目前来说是我遇到过最好的了,能有hc且不是要通过实习评估的那种,并且合同期限是三年的,并且是12%的公积金。我认为这就是我所遇到的最好的了。希望能真心换真心吧,不再把我当创口贴/路边一条了,并且也遇到了很多优秀的同事。总的来说,就是要是能重来我要选李白。我肯定会打破这些信息差,后悔知道的太晚,并且跟优秀的人聊天说话真的可以学到很多东西,之前上文提到的贵人就不说了,说说最近的,他是跟我一届,学校后缀甚至不如我的后缀,但是真正了解的才会知道真是佬👍,他跟我找工作的时间线差不多,但是他在中大厂甚至大厂都呆过,因为跟他聊了才知道我当时的信息差有多大,并且毅力也是我甚至…都没有的。并且也听说了他们学校找工作的氛围很好,不像我阿巴阿巴阿巴,只有考研等相关的一些。并且说的一些观点都是很认同的。总之,希望能在这好好的吧,我真的不想经历大起大落了。经历了,打招呼挂,简历挂,一面挂,HR面挂,offer挂的,现在的心态已经放宽了很多了,但是难过还是有的,希望这家公司诚不欺我吧。也祝大家遇到自己的梦中情厂
选择和努力,哪个更重要?
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务