這篇文章將為大家詳細講解有關Linux下同步工具inotify+rsync的使用方法,文章內容質量較高,因此小編分享給大家做個參考,希望大家閱讀完這篇文章后對相關知識有一定的了解。
創(chuàng)新互聯(lián)是一家專業(yè)提供芷江企業(yè)網站建設,專注與成都網站設計、網站建設、HTML5建站、小程序制作等業(yè)務。10年已為芷江眾多企業(yè)、政府機構等服務。創(chuàng)新互聯(lián)專業(yè)網站建設公司優(yōu)惠進行中。
rsync是一個遠程數(shù)據(jù)同步工具,可通過LAN/WAN快速同步多臺主機間的文件。它使用所謂的“Rsync演算法”來使本地和遠程兩個主機之間的文件達到同步,這個算法只傳送兩個文件的不同部分,而不是每次都整份傳送,因此速度相當快。所以通??梢宰鳛閭浞莨ぞ邅硎褂谩?/p>
運行Rsync server的機器也叫backup server,一個Rsync server可同時備份多個client的數(shù)據(jù);也可以多個Rsync server備份一個client的數(shù)據(jù)。Rsync可以搭配ssh甚至使用daemon模式。Rsync server會打開一個873的服務通道(port),等待對方rsync連接。連接時,Rsync server會檢查口令是否相符,若通過口令查核,則可以開始進行文件傳輸。第一次連通完成時,會把整份文件傳輸一次,下一次就只傳送二個文件之間不同的部份。
基本特點:
可以鏡像保存整個目錄樹和文件系統(tǒng);
可以很容易做到保持原來文件的權限、時間、軟硬鏈接等;
無須特殊權限即可安裝;
優(yōu)化的流程,文件傳輸效率高;
可以使用rcp、ssh等方式來傳輸文件,當然也可以通過直接的socket連接;
支持匿名傳輸。
命令語法:
rsync的命令格式可以為以下六種:
rsync [OPTION]… SRC DEST
rsync [OPTION]… SRC [USER@]HOST:DEST
rsync [OPTION]… [USER@]HOST:SRC DEST
rsync [OPTION]… [USER@]HOST::SRC DEST
rsync [OPTION]… SRC [USER@]HOST::DEST
rsync [OPTION]… rsync://[USER@]HOST[:PORT]/SRC [DEST]
對應于以上六種命令格式,我們可以總結rsync有2種不同的工作模式:
shell模式:使用遠程shell程序(如ssh或rsh)進行連接。當源路徑或目的路徑的主機名后面包含一個冒號分隔符時使用這種模式,rsync安裝完成后就可以直接使用了,無所謂啟動。(目前沒有嘗試過這個方法)
daemon模式:使用TCP直接連接rsync daemon。當源路徑或目的路徑的主機名后面包含兩個冒號,或使用rsync://URL時使用這種模式,無需遠程shell,但必須在一臺機器上啟動rsync daemon,默認端口873,這里可以通過rsync --daemon
使用獨立進程的方式,或者通過xinetd超級進程來管理rsync后臺進程。
當rsync作為daemon運行時,它需要一個用戶身份。如果你希望啟用chroot,則必須以root的身份來運行daemon,監(jiān)聽端口,或設定文件屬主;如果不啟用chroot,也可以不使用root用戶來運行daemon,但該用戶必須對相應的模塊擁有讀寫數(shù)據(jù)、日志和lock file的權限。當rsync以daemon模式運行時,它還需要一個配置文件——rsyncd.conf。修改這個配置后不必重啟rsync daemon,因為每一次的client連接都會去重新讀取該文件。
我們一般把DEST遠程服務器端成為rsync Server,運行rsync命令的一端SRC稱為Client。
安裝:
rsync在CentOS6上默認已經安裝,如果沒有則可以使用yum install rsync -y
,服務端和客戶端是同一個安裝包。
1 | # rsync -h |
關于rsync
命令的諸多選項說明,見另外一篇文章rsync與inotifywait命令和配置選項說明。
1 | # rsync -auvrtzopgP --progress /root/ /tmp/rsync_bak/ |
會看到從/root/
傳輸文件到/tmp/rsync_bak/
的列表和速率,再運行一次會看到sending incremental file list下沒有復制的內容,可以在/root/下touch
某一個文件再運行看到只同步了修改過的文件。
上面需要考慮以下問題:
刪除/root/下的文件不會同步刪除/tmp/rsync_bak,除非加入--delete
選項
文件訪問時間等屬性、讀寫等權限、文件內容等有任何變動,都會被認為修改
目標目錄下如果文件比源目錄還新,則不會同步
源路徑的最后是否有斜杠有不同的含義:有斜杠,只是復制目錄中的文件;沒有斜杠的話,不但要復制目錄中的文件,還要復制目錄本身
在服務器間rsync傳輸文件,需要有一個是開著rsync的服務,而這一服務需要兩個配置文件,說明當前運行的用戶名和用戶組,這個用戶名和用戶組在改變文件權限和相關內容的時候有用,否則有時候會出現(xiàn)提示權限問題。配置文件也說明了模塊、模塊化管理服務的安全性,每個模塊的名稱都是自己定義的,可以添加用戶名密碼驗證,也可以驗證IP,設置目錄是否可寫等,不同模塊用于同步不同需求的目錄。
/etc/rsyncd.conf:
1234567891011121314151617181920212223 | #2014-12-11 by Seanuid=rootgid=rootuse chroot=nomax connections=10timeout=600strict modes=yesport=873pid file=/var/run/rsyncd.pidlock file=/var/run/rsyncd.locklog file=/var/log/rsyncd.log[module_test]path=/tmp/rsync_bak2comment=rsync test logsauth users=seanuid=seangid=seansecrets file=/etc/rsyncd.secretsread only=nolist=nohosts allow=172.29.88.204hosts deny=0.0.0.0/32 |
這里配置socket方式傳輸文件,端口873,[module_test]開始定義一個模塊,指定要同步的目錄(接收)path,授權用戶,密碼文件,允許哪臺服務器IP同步(發(fā)送)等。關于配置文件中選項的詳細說明依然參考rsync與inotifywait命令和配置選項說明。
經測試,上述配置文件每行后面不能使用#
來來注釋
/etc/rsyncd.secrets:
1 | sean:passw0rd |
一行一個用戶,用戶名:密碼。請注意這里的用戶名和密碼與操作系統(tǒng)的用戶名密碼無關,可以隨意指定,與/etc/rsyncd.conf
中的auth users
對應。
修改權限:chmod 600 /etc/rsyncd.d/rsync_server.pwd
。
修改/etc/xinetd.d/rsync
文件,disable 改為 no
1234567891011121314 | # default: off# description: The rsync server is a good addition to an ftp server, as it \# allows crc checksumming etc.service rsync{4disable = no4flags = IPv64socket_type = stream4wait = no4user = root4server = /usr/bin/rsync4server_args = --daemon4log_on_failure += USERID} |
執(zhí)行service xinetd restart
會一起重啟rsync后臺進程,默認使用配置文件/etc/rsyncd.conf
。也可以使用/usr/bin/rsync --daemon --config=/etc/rsyncd.conf
。
為了以防rsync寫入過多的無用日志到/var/log/message
(容易塞滿從而錯過重要的信息),建議注釋掉/etc/xinetd.conf
的success:
1 | # log_on_success = PID HOST DURATION EXIT |
如果使用了防火墻,要添加允許IP到873端口的規(guī)則。
123 | # iptables -A INPUT -p tcp -m state --state NEW -m tcp --dport 873 -j ACCEPT# iptables -L 查看一下防火墻是不是打開了 873端口# netstat -anp|grep 873 |
建議關閉selinux
,可能會由于強訪問控制導致同步報錯。
單向同步時,客戶端只需要一個包含密碼的文件。
/etc/rsync_client.pwd:
1 | passw0rd |
chmod 600 /etc/rsync_client.pwd
命令:
將本地/root/
目錄同步到遠程172.29.88.223的/tmp/rsync_bak2目錄(module_test指定):
1 | /usr/bin/rsync -auvrtzopgP --progress --password-file=/etc/rsync_client.pwd /root/ sean@172.29.88.223::module_test |
當然你也可以將遠程的/tmp/rsync_bak2目錄同步到本地目錄/root/tmp:
1 | /usr/bin/rsync -auvrtzopgP --progress --password-file=/etc/rsync_client.pwd sean@172.29.88.223::module_test /root/ |
從上面兩個命令可以看到,其實這里的服務器與客戶端的概念是很模糊的,rsync daemon都運行在遠程172.29.88.223上,第一條命令是本地主動推送目錄到遠程,遠程服務器是用來備份的;第二條命令是本地主動向遠程索取文件,本地服務器用來備份,也可以認為是本地服務器恢復的一個過程。
與傳統(tǒng)的cp、tar備份方式相比,rsync具有安全性高、備份迅速、支持增量備份等優(yōu)點,通過rsync可以解決對實時性要求不高的數(shù)據(jù)備份需求,例如定期的備份文件服務器數(shù)據(jù)到遠端服務器,對本地磁盤定期做數(shù)據(jù)鏡像等。
隨著應用系統(tǒng)規(guī)模的不斷擴大,對數(shù)據(jù)的安全性和可靠性也提出的更好的要求,rsync在高端業(yè)務系統(tǒng)中也逐漸暴露出了很多不足,首先,rsync同步數(shù)據(jù)時,需要掃描所有文件后進行比對,進行差量傳輸。如果文件數(shù)量達到了百萬甚至千萬量級,掃描所有文件將是非常耗時的。而且正在發(fā)生變化的往往是其中很少的一部分,這是非常低效的方式。其次,rsync不能實時的去監(jiān)測、同步數(shù)據(jù),雖然它可以通過crontab方式進行觸發(fā)同步,但是兩次觸發(fā)動作一定會有時間差,這樣就導致了服務端和客戶端數(shù)據(jù)可能出現(xiàn)不一致,無法在應用故障時完全的恢復數(shù)據(jù)?;谝陨显?,rsync+inotify組合出現(xiàn)了!
inotify是一種強大的、細粒度的、異步的文件系統(tǒng)事件監(jiān)控機制,Linux內核從2.6.13開始引入,允許監(jiān)控程序打開一個獨立文件描述符,并針對事件集監(jiān)控一個或者多個文件,例如打開、關閉、移動/重命名、刪除、創(chuàng)建或者改變屬性。
CentOS6自然已經支持:
使用ll /proc/sys/fs/inotify
命令,是否有以下三條信息輸出,如果沒有表示不支持。
1234 | total 0-rw-r--r-- 1 root root 0 Dec 11 15:23 max_queued_events-rw-r--r-- 1 root root 0 Dec 11 15:23 max_user_instances-rw-r--r-- 1 root root 0 Dec 11 15:23 max_user_watches |
/proc/sys/fs/inotify/max_queued_evnets
表示調用inotify_init時分配給inotify instance中可排隊的event的數(shù)目的最大值,超出這個值的事件被丟棄,但會觸發(fā)IN_Q_OVERFLOW事件。
/proc/sys/fs/inotify/max_user_instances
表示每一個real user ID可創(chuàng)建的inotify instatnces的數(shù)量上限。
/proc/sys/fs/inotify/max_user_watches
表示每個inotify instatnces可監(jiān)控的最大目錄數(shù)量。如果監(jiān)控的文件數(shù)目巨大,需要根據(jù)情況,適當增加此值的大小。
inotify-tools:
inotify-tools是為linux下inotify文件監(jiān)控工具提供的一套C的開發(fā)接口庫函數(shù),同時還提供了一系列的命令行工具,這些工具可以用來監(jiān)控文件系統(tǒng)的事件。 inotify-tools是用c編寫的,除了要求內核支持inotify外,不依賴于其他。inotify-tools提供兩種工具,一是inotifywait
,它是用來監(jiān)控文件或目錄的變化,二是inotifywatch
,它是用來統(tǒng)計文件系統(tǒng)訪問的次數(shù)。
下載inotify-tools-3.14-1.el6.x86_64.rpm,通過rpm包安裝:
123456 | # rpm -ivh /apps/crm/soft_src/inotify-tools-3.14-1.el6.x86_64.rpm warning: /apps/crm/soft_src/inotify-tools-3.14-1.el6.x86_64.rpm: Header V3 DSA/SHA1 Signature, key ID 4026433f: NOKEYPreparing... ########################################### [100%]1:inotify-tools ########################################### [100%]# rpm -qa|grep inotifyinotify-tools-3.14-1.el5.x86_64 |
監(jiān)控/root/tmp目錄文件的變化:
12 | /usr/bin/inotifywait -mrq --timefmt '%Y/%m/%d-%H:%M:%S' --format '%T %w %f' \-e modify,delete,create,move,attrib /root/tmp/ |
上面的命令表示,持續(xù)監(jiān)聽/root/tmp
目錄及其子目錄的文件變化,監(jiān)聽事件包括文件被修改、刪除、創(chuàng)建、移動、屬性更改,顯示到屏幕。執(zhí)行完上面的命令后,在/root/tmp
下創(chuàng)建或修改文件都會有信息輸出:
123456789101112131415 | 2014/12/11-15:40:04 /root/tmp/ new.txt2014/12/11-15:40:22 /root/tmp/ .new.txt.swp2014/12/11-15:40:22 /root/tmp/ .new.txt.swx2014/12/11-15:40:22 /root/tmp/ .new.txt.swx2014/12/11-15:40:22 /root/tmp/ .new.txt.swp2014/12/11-15:40:22 /root/tmp/ .new.txt.swp2014/12/11-15:40:23 /root/tmp/ .new.txt.swp2014/12/11-15:40:31 /root/tmp/ .new.txt.swp2014/12/11-15:40:32 /root/tmp/ 49132014/12/11-15:40:32 /root/tmp/ 49132014/12/11-15:40:32 /root/tmp/ 49132014/12/11-15:40:32 /root/tmp/ new.txt2014/12/11-15:40:32 /root/tmp/ new.txt~2014/12/11-15:40:32 /root/tmp/ new.txt... |
這一步的核心其實就是在客戶端創(chuàng)建一個腳本rsync.sh
,適用inotifywait
監(jiān)控本地目錄的變化,觸發(fā)rsync
將變化的文件傳輸?shù)竭h程備份服務器上。為了更接近實戰(zhàn),我們要求一部分子目錄不同步,如/root/tmp/log
和臨時文件。
排除不需要同步的文件或目錄有兩種做法,第一種是inotify監(jiān)控整個目錄,在rsync中加入排除選項,簡單;第二種是inotify排除部分不監(jiān)控的目錄,同時rsync中也要加入排除選項,可以減少不必要的網絡帶寬和CPU消耗。我們選擇第二種。
這個操作在客戶端進行,假設/tmp/src/mail/2014/
以及/tmp/src/mail/2015/cache/
目錄下的所有文件不用同步,所以不需要監(jiān)控,/tmp/src/
下的其他文件和目錄都同步。(其實對于打開的臨時文件,可以不監(jiān)聽modify
時間而改成監(jiān)聽close_write
)
inotifywait排除監(jiān)控目錄有--exclude
和--fromfile
兩種格式,并且可以同時使用,但主要前者可以用正則,而后者只能是具體的目錄或文件。
123 | # vi /etc/inotify_exclude.lst:/tmp/src/pdf@/tmp/src/2014 |
使用fromfile
格式只能用絕對路徑,不能使用諸如*
正則表達式去匹配,@
表示排除。
如果要排除的格式比較復雜,必須使用正則,那只能在inotifywait
中加入選項,如--exclude '(.*/*\.log|.*/*\.swp)$|^/tmp/src/mail/(2014|201.*/cache.*)'
,表示排除/tmp/src/mail/以下的2014目錄,和所有201*目錄下的帶cache的文件或目錄,以及/tmp/src目錄下所有的以.log或.swp結尾的文件。
使用inotifywait排除監(jiān)控目錄的情況下,必須同時使用rsync排除對應的目錄,否則只要有觸發(fā)同步操作,必然會導致不該同步的目錄也會同步。與inotifywait類似,rsync的同步也有--exclude
和--exclude-from
兩種寫法。
個人還是習慣將要排除同步的目錄卸載單獨的文件列表里,便于管理。使用--include-from=FILE
時,排除文件列表用絕對路徑,但FILE里面的內容請用相對路徑,如:/etc/rsyncd.d/rsync_exclude.lst
:
1234567891011 | mail/2014/mail/201*/201*/201*/.??*mail??*src/*.html*src/js/src/ext3/src/2014/20140[1-9]/src/201*/201*/201*/.??*membermail/membermail??*membermail/201*/201*/201*/.??* |
排除同步的內容包括,mail下的2014目錄,類似2015/201501/20150101/下的臨時或隱藏文件,等。
rsync.sh
下面是一個完整的同步腳本,請根據(jù)需要進行裁剪,rsync.sh
:
123456789101112131415161718192021222324252627282930313233 | #rsync auto sync script with inotify#2014-12-11 Sean#variablescurrent_date=$(date +%Y%m%d_%H%M%S)source_path=/tmp/src/log_file=/var/log/rsync_client.log#rsyncrsync_server=172.29.88.223rsync_user=seanrsync_pwd=/etc/rsync_client.pwdrsync_module=module_testINOTIFY_EXCLUDE='(.*/*\.log|.*/*\.swp)$|^/tmp/src/mail/(2014|20.*/.*che.*)'RSYNC_EXCLUDE='/etc/rsyncd.d/rsync_exclude.lst'#rsync client pwd checkif [ ! -e ${rsync_pwd} ];thenecho -e "rsync client passwod file ${rsync_pwd} does not exist!"exit 0fi#inotify_functioninotify_fun(){/usr/bin/inotifywait -mrq --timefmt '%Y/%m/%d-%H:%M:%S' --format '%T %w %f' \--exclude ${INOTIFY_EXCLUDE} -e modify,delete,create,move,attrib ${source_path} \| while read filedo/usr/bin/rsync -auvrtzopgP --exclude-from=${RSYNC_EXCLUDE} --progress --bwlimit=200 --password-file=${rsync_pwd} ${source_path} ${rsync_user}@${rsync_server}::${rsync_module} done}#inotify loginotify_fun >> ${log_file} 2>&1 & |
--bwlimit=200
用于限制傳輸速率最大200kb,因為在實際應用中發(fā)現(xiàn)如果不做速率限制,會導致巨大的CPU消耗。
在客戶端運行腳本# ./rsync.sh
即可實時同步目錄。
疑問
對于rsync的同步海量存在一個疑問,假如我的文件數(shù)很多即使在排除不監(jiān)控和不同步目錄的情況下依然有10萬個文件,僅文件列表就達10M,那么豈不是每一次有文件產生或修改都會觸發(fā)同步,很容易導致大部分情況下在傳輸文件列表和進行列表的比對,僅同步一個小文件而使用的網絡帶寬和CPU代價很高,特別是網絡狀況不佳時,上一次的列表還未傳送完,又有新的文件產生觸發(fā)發(fā)送文件列表。不知道rsync內部有沒有這樣的處理?
其他功能:雙向同步、sersync2實時同步多遠程服務器
關于Linux下同步工具inotify+rsync的使用方法就分享到這里了,希望以上內容可以對大家有一定的幫助,可以學到更多知識。如果覺得文章不錯,可以把它分享出去讓更多的人看到。