linux基礎(chǔ)-字符處理
創(chuàng)新互聯(lián),為您提供網(wǎng)站建設(shè)、網(wǎng)站制作、網(wǎng)站營銷推廣、網(wǎng)站開發(fā)設(shè)計(jì),對(duì)服務(wù)成都履帶攪拌車等多個(gè)行業(yè)擁有豐富的網(wǎng)站建設(shè)及推廣經(jīng)驗(yàn)。創(chuàng)新互聯(lián)網(wǎng)站建設(shè)公司成立于2013年,提供專業(yè)網(wǎng)站制作報(bào)價(jià)服務(wù),我們深知市場的競爭激烈,認(rèn)真對(duì)待每位客戶,為客戶提供賞心悅目的作品。 與客戶共同發(fā)展進(jìn)步,是我們永遠(yuǎn)的責(zé)任!
linux管道命令(pipe)
菜鳥教程
管道是一種通信機(jī)制,通常用于進(jìn)程間的通信,它表現(xiàn)出來的形式將前面每一個(gè)進(jìn)程的輸出直接作為下一個(gè)進(jìn)程的輸入。
管道命令使用 | 作為界定符號(hào)。
默認(rèn)情況下,sort命令以第一列進(jìn)行排序
反向排序
按指定列進(jìn)行排序,默認(rèn)是空白符,也可以用 -t 指定分隔符
第二列排序的時(shí)候可以加 -n 進(jìn)行數(shù)值排序
進(jìn)行排序后,排序結(jié)果會(huì)顯示在終端,但是原文件不會(huì)改變,可以用-o重定向或者另存。用 覆蓋某個(gè)文件會(huì)失敗,數(shù)據(jù)被清空,但是用 追加可以
為初學(xué)者提供的uniq命令教程及示例
uniq 命令用于檢查及刪除文本文件中重復(fù)出現(xiàn)的行列。uniq命令只有在相鄰的情況下才會(huì)刪除重復(fù)的行,因此一般與 sort 命令結(jié)合使用,此外,該命令也可以檢查文本文件中重復(fù)出現(xiàn)的行列,默認(rèn)區(qū)分大小寫。
準(zhǔn)備一個(gè)文件
準(zhǔn)備一個(gè)文件
以分割符指定分割某些特定的列
Linux tr 命令用于轉(zhuǎn)換或刪除文件中的字符。
tr 指令從標(biāo)準(zhǔn)輸入設(shè)備讀取數(shù)據(jù),經(jīng)過字符串轉(zhuǎn)譯后,將結(jié)果輸出到標(biāo)準(zhǔn)輸出設(shè)備。
語法:tr [OPTION]…SET1[SET2]
小寫轉(zhuǎn)換為大寫
刪除字符
Linux paste 命令用于合并文件的列。
paste 指令會(huì)把每個(gè)文件以列對(duì)列的方式,一列列地加以合并。
不加參數(shù)會(huì)默認(rèn)以制表符為分界列對(duì)列合并
-d可以設(shè)置以何種字符合并
使用s參數(shù)時(shí)。單個(gè)文件會(huì)將該文件的多行數(shù)據(jù)合并成一行顯示,多個(gè)文件會(huì)將各個(gè)文件單獨(dú)合并成一行之后再行對(duì)行合并
Linux split命令用于將一個(gè)文件分割成數(shù)個(gè)。
該指令將大文件分割成較小的文件,在默認(rèn)情況下將按照每1000行切割成一個(gè)小文件。
將根目錄文件信息寫入文件
對(duì)上面的文件9行為一個(gè)文件進(jìn)行分割
以1k字節(jié)分割文件
不加參數(shù)會(huì)同時(shí)顯示行數(shù),字?jǐn)?shù),Bytes數(shù),加上上述參數(shù)會(huì)單獨(dú)顯示其中一項(xiàng)
15 分鐘之后,我要去朋友家聚會(huì)。我打算從我的臺(tái)式機(jī)上把一部 700MB 大小的美國大片拷貝出來,帶到朋友家去看,可是我的兩個(gè)優(yōu)盤都只有 512MB,這讓我如何是好?
別急,用 10 分鐘趕快來認(rèn)識(shí)一下我們的 split 拆分小能手,一切問題將迎刃而解。當(dāng)遇到大文件而苦不堪言的時(shí)候,split 就會(huì)像天使一樣解救我們于水火之中。
合久必分
閑言少敘,我們現(xiàn)在就來介紹拆分的方法。先使用 dd 命令來生成一個(gè) 700MB 文件來作為我們的拆分對(duì)象:
美國大片的文件大小是 700MB,而我手邊僅有的兩個(gè)優(yōu)盤,都是 512MB 大小的。我打算把文件以 400MB 作為一個(gè)拆分單位,來進(jìn)行拆分。這里使用到了 split 的-b選項(xiàng),來指定每個(gè)拆分文件的大?。?/p>
看!分身完畢!咦,怎么多出了 xaa 和 xab 兩個(gè)文件,這么奇怪的名字?
是的,你沒看錯(cuò),在沒有明確指定拆分后文件的命名方式的情況下,split 會(huì)默認(rèn)采用 x 字符作為文件前綴,采用類似 aa、ab、ac 的字符串依次作為文件后綴。于是,就出現(xiàn)了我們上面看到的 xaa、xab 了。
從文件大小來看,如我們所愿,電影文件的確被切割成了一個(gè) 400MB 的文件、一個(gè) 300MB 的文件,終于可以裝到兩個(gè)優(yōu)盤里了。
知其然,知其所以然
知道了拆分命令后,我們來一起學(xué)習(xí)一下 split 的命令格式和常用選項(xiàng)。
split 的作用很好描述,就是將文件按照一定規(guī)則進(jìn)行拆分。一般情況下,我們可以按照文件大小來進(jìn)行拆分,如果是文本文件的話,還可以按照行數(shù)來進(jìn)行拆分,默認(rèn)是 1000 行作為一個(gè)拆分單位。
默認(rèn)情況下,分割后的文件的名稱會(huì)以 x 作為前綴,以 aa、ab、ac 這樣的雙字母格式作為后綴,形成 xaa、xab 這樣的名稱格式。
我們來一起看看 split 的命令格式:
split [-b ][-C ][-][-l ][要切割的文件][輸出文件名前綴][-a ]
最常用的選項(xiàng),都在這里了:
-b字節(jié):指定按多少字節(jié)進(jìn)行拆分,也可以指定 K、M、G、T 等單位。
-行數(shù)或-l行數(shù):指定每多少行要拆分成一個(gè)文件。
輸出文件名前綴:設(shè)置拆分后的文件的名稱前綴,split 會(huì)自動(dòng)在前綴后加上編號(hào),默認(rèn)從 aa 開始。
-a后綴長度:默認(rèn)的后綴長度是 2,也就是按 aa、ab、ac 這樣的格式依次編號(hào)。
分久必合
完成了美國大片的拆分,我趕赴朋友家,打開他的電腦,優(yōu)盤插上,使用 cat 命令將拆分文件 xaa 和 xab 合并成一個(gè)文件,可以看出合并后的文件和源文件的大小是一致的:
對(duì)了,如果是在 Windows 下的話,我們要先運(yùn)行 cmd,然后用 copy 命令來進(jìn)行文件的合并:
copy /b xaa + xab king_of_ring.avi
格式上和 Linux 有些區(qū)別,但原理是一樣的。
設(shè)置拆分文件的名稱前綴
上面例子中,我們沒有指定拆分文件的名稱前綴,結(jié)果拆分后的文件名都是 aa、ab 這樣的名稱,這樣的名稱既不達(dá)意也不美觀。
下面的例子,我們嘗試以 king_of_ring_part_ 作為拆分后文件的名稱前綴:
[root@roclinux ~]$ split -b 400m king_of_ring.avi king_of_ring_part_
文件名的可讀性是不是提高了不少,從文件名稱就可以看出來是美國大片的拆分文件啦。
設(shè)置數(shù)字后綴
如果大家看不慣以 aa、ab 這種字母作為文件后綴,我們還可以通過-d選項(xiàng)來指定數(shù)字形式的文件后綴:
[root@roclinux ~]$ split -b 400m -d king_of_ring.avi king_of_ring_part_
對(duì)于中國人來說,數(shù)字形式的后綴,增加了文件名稱的可讀性。
按照行數(shù)進(jìn)行拆分
前面我們講的是按照文件大?。ㄈ?400MB)進(jìn)行文件拆分的方法,但是并非所有情況都適合于用文件大小作為拆分單元。比如,我們希望把 /etc/passwd 文件按照一個(gè)文件 10 行記錄的方式進(jìn)行拆分,又該怎么操作呢?
[root@roclinux ~]$ split -d -10 /etc/passwd my_passwd_
合并后的校驗(yàn)不可少
需要注意的是,在通過網(wǎng)絡(luò)來傳輸大文件,或者在設(shè)備之間復(fù)制大文件的時(shí)候,可能會(huì)出現(xiàn)傳輸前后數(shù)據(jù)不一致的情況。
使用 split 來拆分大文件僅僅是故事的開始,操作完畢后化零為整、完璧歸趙才是完美的結(jié)局。因此需要在合并文件后進(jìn)行文件的完整性校驗(yàn),推薦使用 md5sum 來計(jì)算和比對(duì)前后兩個(gè)大文件的 md5 值。
如果前后一致,那么恭喜你,文件合并成功!
好了,split 學(xué)完了,我們也可以和朋友一起欣賞驚險(xiǎn)刺激的美國大片了!
linux有rz和sz命令,可以讓我們?cè)趙indow和本地虛擬機(jī)之間傳輸文件,但是有個(gè)麻煩的事情就是不能傳輸大于4G的文件
如果是傳送到linux,可以使用FileZilla軟件,那么從linux下拉到windows怎么解決呢,那就是使用split將文件拆分成小于4G的文件
上面講解了拆分,下面講講合并tar包
Linux中分割文件用split命令,這個(gè)命令可以將一個(gè)文件分割成指定大小的多個(gè)文件,split命令的用法是:
split -b 分割的大小 需要分割的文件名 分割后文件的前導(dǎo)文字
這里解釋一下,-b參數(shù)表示按照文件大小單位來進(jìn)行分割(split命令還有一個(gè)-l參數(shù),是根據(jù)文本文件的行數(shù)來進(jìn)行分割,這個(gè)-b參數(shù)是根據(jù)大小來分割的),-b參數(shù)后面跟的是分割的依據(jù)——文件大小,文件大小的單位可以是b、k、m,比如300m?!胺指詈笪募那皩?dǎo)文字”是干嘛的呢,其實(shí)是在分割后的文件名前面加上一個(gè)前綴。下面是一個(gè)例子,就假設(shè)需要分割的文件是/root/bigfile:
split -b 50m /root/bigfile chunk
這條命令產(chǎn)生的分割文件可能是:chunkaa、chunkab、chunkac,看到前導(dǎo)文字的作用了吧。
那么如何將分割后的文件再合并起來呢,還是接著上面的那個(gè)例子,用下面這條命令就可以了(先用cd /root切換到/root目錄):
cat chunk* bigfile
1)按2行切割 -l 2
2)指定切割后的文件前綴名 data_
3)指定切割后的文件后綴名為數(shù)字 -d
4)指定切割后的文件后綴名數(shù)字的長度? ? -a 4,即位寬(10進(jìn)制),這里長度可根據(jù)切割出來的文件有多少估算,到底拆分為幾個(gè)文件,由總行數(shù),和每個(gè)文件的行數(shù)決定,不用指定。
如果為-a 4文件的后綴數(shù)字從0000開始計(jì)算,依次為0001,0002,0003,0004
split -l 2 data.log -d -a 4 data_
將文件data.log進(jìn)行拆分,每個(gè)文件2行,如果文件總共有7行,則分為data_0000,data_0001,data_0002,data_0003
tar -zcvf cm-11.tar.gz cm-11
//將cm-11文件夾壓縮成cm-11.tar.gz
split -b 4000M -d -a 1 cm-11.tar.gz cm-11.tar.gz.
//使用split命令,-b 4000M 表示設(shè)置每個(gè)分割包的大小,單位還是可以k
// -d "參數(shù)指定生成的分割包后綴為數(shù)字的形式
//-a x來設(shè)定序列的長度(默認(rèn)值是2),這里設(shè)定序列的長度為1
執(zhí)行命令后,生成壓縮包如下:
tar -zcvf cm-11.tar.gz cm-11 | split -b 4000M -d -a 1 - cm-11.tar.gz.
//采用管道,其中 - 參數(shù)表示將所創(chuàng)建的文件輸出到標(biāo)準(zhǔn)輸出上
tar -zxvf cm-11.tar.gz
cat cm-11.tar.gz.* | tar -zxv
tar可以用來壓縮打包單文件、多個(gè)文件、單個(gè)目錄、多個(gè)目錄。
Linux打包命令 tar
tar命令可以用來壓縮打包單文件、多個(gè)文件、單個(gè)目錄、多個(gè)目錄。
常用格式:
單個(gè)文件壓縮打包 tar -czvf my.tar.gz file1
多個(gè)文件壓縮打包 tar -czvf my.tar.gz file1 file2,...(file )(也可以給file 文件mv 目錄在壓縮)
單個(gè)目錄壓縮打包 tar -czvf my.tar.gz dir1
多個(gè)目錄壓縮打包 tar -czvf my.tar.gz dir1 dir2
解包至當(dāng)前目錄:tar -xzvf my.tar.gz
cpio
含子目錄find x* | cpio -o /y/z.cpio
不含子目錄ls x* | cpio -o /y/z.cpio
解包: cpio -i /y/z.cpio
[root@linux ~]# tar [-cxtzjvfpPN] 文件與目錄 ....
參數(shù):
-c :建立一個(gè)壓縮文件的參數(shù)指令(create 的意思);
-x :解開一個(gè)壓縮文件的參數(shù)指令!
-t :查看 tarfile 里面的文件!
特別注意,在參數(shù)的下達(dá)中, c/x/t 僅能存在一個(gè)!不可同時(shí)存在!
因?yàn)椴豢赡芡瑫r(shí)壓縮與解壓縮。
-z :是否同時(shí)具有 gzip 的屬性?亦即是否需要用 gzip 壓縮?
-j :是否同時(shí)具有 bzip2 的屬性?亦即是否需要用 bzip2 壓縮?
-v :壓縮的過程中顯示文件!這個(gè)常用,但不建議用在背景執(zhí)行過程!
-f :使用檔名,請(qǐng)留意,在 f 之后要立即接檔名喔!不要再加參數(shù)!
例如使用『 tar -zcvfP tfile sfile』就是錯(cuò)誤的寫法,要寫成
『 tar -zcvPf tfile sfile』才對(duì)喔!
-p :使用原文件的原來屬性(屬性不會(huì)依據(jù)使用者而變)
-P :可以使用絕對(duì)路徑來壓縮!
-N :比后面接的日期(yyyy/mm/dd)還要新的才會(huì)被打包進(jìn)新建的文件中!
--exclude FILE:在壓縮的過程中,不要將 FILE 打包!