rsync传输不改变文件用户用户组权限 rsync保留文件属性
rsync传输不改变文件用户用户组权限 rsync保留文件属性
rsync是一款开源的、快速的、多功能的、可实现全量及增量的本地或远程数据同步备份的优秀工具。它支持本地复制,以及其他SSH、rsync主机同步,以其delta-transfer算法闻名。本文将详细介绍rsync的基本概念、功能特点、配置方法以及与inotify结合实现实时同步的完整教程。
前言
rsync是Linux系统下的数据镜像备份工具。使用快速增量备份工具Remote Sync可以远程同步,支持本地复制,或者其他SSH、rsync主机同步。
一、概述
1.1 rsync服务器
- rsync是一款开源的、快速的、多功能的、可实现全量及增量的本地或远程数据同步备份的优秀工具。并且可以不进行改变原有数据的属性信息,实现数据的备份迁移特性。
- rsync软件适用于unix/linux/windows等多种操作系统平台
- rsync是一个快速和非常同样的文件复制工具。它能本能复制,远程复制,或者远程守护进程方式复制,它提供了大量的参数来控制其行为的各个方面,并且允许非常灵活的方式来实现文件的传输复制
- 以其delta-transfer算法闻名。
- rsync监听端口:873
- rsync运行模式:C/S
1.2 同步方式
1.2-1 全量备份
- 原有的数据全部传送
- 把原来的文件和新的文件一起统一传送
(全量复制,效率低)
1.2-2 增量备份
在传输数据之前通过一些算法通过你有的数据和我有的数据进行对比,把不一样的数据通过网络传输。
(增量复制,效率高)
1.3 rsync源服务器的关系
- rsync同步源
- 指备份操作的远程服务器,也称为备份源
例:A服务器同步B服务器的数据,B服务器就是备份源
B服务器同步A服务器的数据,A服务器就是备份源
三、配置rsync源
3.1 基本思路
- 建立rsyncd.conf配置文件、独立的账号文件
- 启用rsync的 --daemon模式
3.2 配置文件rsyncd.conf
- 认证配置auth users、secrets file,不加则为匿名
3.3 独立的账号文件
- 用户名:密码
- 每行一个用户记录
- 独立的账号数据,不依赖系统账号
3.4 启用rsync服务
- 通过 --daemon独自提供服务,rsync --daemon
- 执行kill $(cat /var/run/rsyncd.pid)关闭服务
3.5 rsync功能及特点
3.5-1 rsync功能
- 作为命令:实现本地-远程文件同步
- 作为服务:实现本地-远程文件同步
3.5-2 rsync特点
- 可以镜像保存整个目录树和文件系统
- 可以保留原有的权限(permission,mode),owner,group,时间(修改时间,modify time),软硬链接,文件acl,文件属性(attributes)信息等
- 传输效率高,使用同步算法,只比较变化的
- 支持匿名传输,方便网站镜像;也可以做验证,加强安全
3.6 与rsync相同类型的服务
- sync 同步:刷新文件系统缓存,强制将修改过的数据块写入磁盘,并且更新超级块。
- async 异步:将数据先放到缓冲区,再周期性(一般是30s)的去同步到磁盘。
- rsync 远程同步:remote synchronous
3.7 cp与rsync的比较
- cp将源文件完整复制到指定路径下 全备
- rsync 做本地复制的时候
- 先将源文件和目标文件进行比较,找出差异部分
- 根据目的位置的文件与源文件差异的部分,进行一致性同步
- scp:secure copy 同样是用来进行远程复制的命令,但是每次备份数据都是完全备份
四、rsync命令
命令使用的语法
rsync 【选项】原始位置 目标位置
常用选项
-r 递归模式,包含目录及子目录中的所有文件
-l 对于符号链接文件仍然复制为符号链接文件
-v 显示同步过程的详细信息
-z 在传输时进行压缩
-a 归档模式,递归并保留对象属性,等同于-rlptgoD
-p 保留文件的权限标记
-t 保留文件的时间标记
-g 保留文件的属组标记(仅超级用户使用)
-o 保留文件的属主标记(仅超级用户使用)
-H 保留硬链接文件
-A 保留ACL属性信息
-D 保留设备文件及其他特殊文件
--delete 删除目标位置有而原始位置没有的文件
--checksum 根据对象的校验和来决定是否跳过文件
--delete的作用简单来说,就是删除差异文件,保留一致性
五、配置源的两种方式
格式一:
用户名@主机地址::共享模块名
格式二:
rsync://用户名@主机地址/共享模块名
六、inotify概述
可以监控文件系统的变动情况,并做出通知响应
- 调整inotify内核参数(优化)
- /etc/sysctl.conf(内核参数配置文件)
- max_queue_events #监控事件队列大小
- max_user_instances #最多监控实例数
- max_user_watches #每个实例最多监控文件数
- notifywait:用于持续监控,实时输出结果
- inotifywatch:用于短期监控,任务完成后再输出结果
inotifywait -mrq -e modify,create,move,delete /var/www/html
-m 持续进行监控
-r 递归监控所有子对象
-q 简化输出信息
-e 指定要监控哪些事件类型
modify 修改
create 创建
move 移动
delete 删除
七、配置rsync下行同步
- 部署环境
主机 操作系统 IP地址 软件 / 安装包 / 工具
client CentOS7 192.168.63.20 rsync
server CentOS7 192.168.63.102 rsync / inotify-tools-3.14.tar.gz
7.1 将client服务器数据备份到slave服务器
7.1-1 client(192.168.63.20)
systemctl stop firewalld
systemctl disable firewalld
setenforce 0
#关闭防火墙及安装机制
yum install -y httpd rsync
#rsync系统一般已默认安装,安装httpd是为了生成/var/www/html目录(后续会用到作为共享目录)
vim /etc/rsyncd.conf
#编辑rsync配置文件
uid = root
gid = root
use chroot = yes
address = 192.168.63.20
port 873
log file = /var/log/rsyncd.log
pid file = /var/run/rsyncd.pid
hosts allow = 192.168.63.0/24
[wwwroot]
path = /var/www/html
comment = Document Root of www.yxp.com
read only = yes
dont comperss = *.gz *.bz2 *.tgz *.zip *.rar *.z
auth users = backuper
secrets file = /etc/rsyncd_users.db
----详解----
uid = root #用户id,表示共享权限能执行的身份
gid = root #组id
use chroot = yes #开启,禁锢在源目录,表示允许在访问我备份的目录或文件的时候,使用的角色是root,同时你访问本地目录时拥有的也是root权限
address = 192.168.63.20 #监听地址
port 873 #默认端口号为873
log file = /var/log/rsyncd.log #日志文件存放位置
pid file = /var/run/rsyncd.pid #存放进程id的文件位置
hosts allow = 192.168.63.0/24 #允许访问的主机网段,有点类似于黑白名单
[wwwroot] #共享模块的名称,rsync默认调用该模块,默认我调用的路径是该模块指定的路径
path = /var/www/html #源目录路径
comment = Document Root of www.yxp.com #
read only = yes #是否为只读
dont comperss = *.gz *.bz2 *.tgz *.zip *.rar *.z #同步时不再压缩的文件类型,因为同步时,-avz已经进行压缩
auth users = backuper #授权用户,使用wwwroot模块的用户是哪个用户,多个账户以空格隔开
secrets file = /etc/rsyncd_users.db #存放账号信息的数据文件,一行一个
----
vim /etc/rsyncd_users.db
backuper:123123
#编辑用户账号文件,固定格式为[名称:密码],一行一个
chmod 600 /etc/rsyncd_users.db
#官方要求,最好只是赋权600!
rsync --daemon
#开启服务
netstat -natp | grep rsync
#检测端口号,确认服务是否成功开启
cd /var/www/html
#切换至共享目录下
touch dog.html cat.html
ls
关闭防火墙及安全增强机制
备份配置文件
rsync系统一般已默认安装,安装httpd是为了生成/var/www/html目录(后续会用到作为共享目录)
编辑rsync配置文件
编辑用户账号文件,固定格式为【名称:密码】,一行一个
官方要求,最好只是赋权600
开启服务、检测端口号、确认服务是否成功开启
切换至共享目录下,创建文件
7.1-2 slave(192.168.63.102)
systemctl stop firewalld.service
setenforce 0
yum -y install rsync
cd /opt
mkdir caca
chmod 777 caca
vim /etc/server.pass
123123
chmod 600 /etc/server.pass
rsync -az --delete --password-file=/etc/server.pass backuper@192.168.63.20::wwwroot /opt/caca
ls caca
八、Rsync+Inotify实时同步
8.1 client(192.168.63.20)
vim /etc/rsyncd.conf
read only = no
kill `cat /var/run/rsyncd.pid`
netstat -natp | grep rsync
rsync --daemon
netstat -natp | grep rsync
chmod 777 /var/www/html
8.2 server(192.168.63.102)
cat /proc/sys/fs/inotify/max_queued_events
cat /proc/sys/fs/inotify/max_user_instances
cat /proc/sys/fs/inotify/max_user_watches
vim /etc/sysctl.conf
fs.inotify.max_queued_events = 32768
fs.inotify.max_user_instances = 1024
fs.inotify.max_user_watches = 1048576
sysctl -p
yum -y install gcc gcc-c++
#放入安装包
tar zxvf inotify-tools-3.14.tar.gz -C /opt
cd /opt/inotify-tools-3.14/
./configure
make && make install
vim /opt/inotify.sh
#!/bin/bash
INOTIFY_CMD="inotifywait -mrq -e create,delete,move,modify,attrib /opt/haha/"
RSYNC_CMD="rsync -azH --delete --password-file=/etc/server.pass /opt/haha/ kiki@192.168.184.10::wwwroot"

$INOTIFY_CMD | while read DIRECTORY EVENT FILE
do
if [ $(pgrep rsync | wc -l) -le 0 ] ; then
$RSYNC_CMD
fi
done
cd /opt/
chmod +x inotify.sh
./inotify.sh
cd /opt/caca
touch 333.html
rm -rf 111.html
8.3 client(192.168.63.20)验证
cd /var/www/html
ls
有的时候网络波动,同步的会慢一些。
总结
rsync特点
- 能够镜像保存整个目录树和文件系统。
- 能够很容易作到保持原来文件的权限、时间、软硬连接等等。
- 无须特殊权限便可安装。
- 快速:第一次同步时 rsync 会复制所有内容,但在下一次只传输修改过的文件。rsync 在传输数据的过程当中能够实行压缩及解压缩操做,所以可使用更少的带宽。
- 安全:可使用scp、ssh等方式来传输文件,固然也能够经过直接的socket链接。
- 支持匿名传输,以方便进行网站镜象。
rsync的优势与不足
优势:
与传统的cp、tar备份方式相比,rsync具备安全性高、备份迅速、支持增量备份等优势,经过rsync能够解决对实时性要求不高的数据备份需求,例如按期的备份文件服务器数据到远端服务器,对本地磁盘按期作数据镜像等。
缺点:
随着应用系统规模的不断扩大,对数据的安全性和可靠性也提出的更好的要求,rsync在高端业务系统中也逐渐暴露出了不少不足,首先,rsync同步数据时,须要扫描全部文件后进行比对,进行差量传输。若是文件数量达到了百万甚至千万量级,扫描全部文件将是很是耗时的。并且正在发生变化的每每是其中不多的一部分,这是很是低效的方式。其次,rsync不能实时的去监测、同步数据,虽然它能够经过linux守护进程的方式进行触发同步,可是两次触发动做必定会有时间差,这样就致使了服务端和客户端数据可能出现不一致,没法在应用故障时彻底的恢复数据。