在linux中g(shù)rep命令是非常有用的,它和管道(|)配合使用,非常強(qiáng)大,用于搜索文本文件.如果想要在幾個(gè)文本文件中查找一字符串,可以使用‘grep’命令?!甮rep’在文本中搜索指定的字符串。
專注于為中小企業(yè)提供網(wǎng)站設(shè)計(jì)、網(wǎng)站制作服務(wù),電腦端+手機(jī)端+微信端的三站合一,更高效的管理,為中小企業(yè)遂平免費(fèi)做網(wǎng)站提供優(yōu)質(zhì)的服務(wù)。我們立足成都,凝聚了一批互聯(lián)網(wǎng)行業(yè)人才,有力地推動(dòng)了上千余家企業(yè)的穩(wěn)健成長,幫助中小企業(yè)通過網(wǎng)站建設(shè)實(shí)現(xiàn)規(guī)模擴(kuò)充和轉(zhuǎn)變。
假設(shè)您正在‘/usr/src/linux/Documentation’目錄下搜索帶字符串‘magic’的文件:
$ grep magic /usr/src/linux/Documentation/*
sysrq.txt:* How do I enable the magic SysRQ key?
sysrq.txt:* How do I use the magic SysRQ key?
其中文件‘sysrp.txt’包含該字符串,討論的是 SysRQ 的功能。
默認(rèn)情況下,‘grep’只搜索當(dāng)前目錄。如果此目錄下有許多子目錄,‘grep’會(huì)以如下形式列出:
grep: sound: Is a directory
這可能會(huì)使‘grep’的輸出難于閱讀。這里有兩種解決的辦法:
明確要求搜索子目錄:grep -r
或忽略子目錄:grep -d skip
當(dāng)然,如果預(yù)料到有許多輸出,您可以通過 管道 將其轉(zhuǎn)到‘less’上閱讀:
$ grep magic /usr/src/linux/Documentation/* | less
這樣,您就可以更方便地閱讀。
有一點(diǎn)要注意,您必需提供一個(gè)文件過濾方式(搜索全部文件的話用 *)。如果您忘了,‘grep’會(huì)一直等著,直到該程序被中斷。如果您遇到了這樣的情況,按 ,然后再試。
下面是一些有意思的命令行參數(shù):
grep -i pattern files :不區(qū)分大小寫地搜索。默認(rèn)情況區(qū)分大小寫,
grep -l pattern files :只列出匹配的文件名,
grep -L pattern files :列出不匹配的文件名,
grep -w pattern files :只匹配整個(gè)單詞,而不是字符串的一部分(如匹配‘magic’,而不是‘magical’),
grep -C number pattern files :匹配的上下文分別顯示[number]行,
grep pattern1 | pattern2 files :顯示匹配 pattern1 或 pattern2 的行,
grep pattern1 files | grep pattern2 :顯示既匹配 pattern1 又匹配 pattern2 的行。
這里還有些用于搜索的特殊符號:
\ 分別標(biāo)注單詞的開始與結(jié)尾。
例如:
grep man * 會(huì)匹配 ‘Batman’、‘manic’、‘man’等,
grep '\grep '\' 只匹配‘man’,而不是‘Batman’或‘manic’等其他的字符串。
'^':指匹配的字符串在行首,
'$':指匹配的字符串在行尾,
如果您不習(xí)慣命令行參數(shù),可以試試圖形界面的‘grep’,如 reXgrep 。這個(gè)軟件提供 AND、OR、NOT 等語法,還有漂亮的按鈕 :-) 。如果您只是需要更清楚的輸出,不妨試試 fungrep 。
Linux常用指令---grep(搜索過濾) (轉(zhuǎn))
Linux系統(tǒng)中g(shù)rep命令是一種強(qiáng)大的文本搜索工具,它能使用正則表達(dá)式搜索文本,并把匹?配的行打印出來。grep全稱是Global?Regular?Expression?Print,表示全局正則表達(dá)式版本,它的使用權(quán)限是所有用戶。
grep的工作方式是這樣的,它在一個(gè)或多個(gè)文件中搜索字符串模板。如果模板包括空格,則必須被引用,模板后的所有字符串被看作文件名。搜索的結(jié)果被送到標(biāo)準(zhǔn)輸出,不影響原文件內(nèi)容。
grep可用于shell腳本,因?yàn)間rep通過返回一個(gè)狀態(tài)值來說明搜索的狀態(tài),如果模板搜索成功,則返回0,如果搜索不成功,則返回1,如果搜索的文件不存在,則返回2。我們利用這些返回值就可進(jìn)行一些自動(dòng)化的文本處理工作。
1.命令格式:
grep?[option]?pattern?file
2.命令功能:
用于過濾/搜索的特定字符??墒褂谜齽t表達(dá)式能多種命令配合使用,使用上十分靈活。
3.命令參數(shù):
-a???--text???#不要忽略二進(jìn)制的數(shù)據(jù)。???
-A顯示行數(shù)???--after-context=顯示行數(shù)???#除了顯示符合范本樣式的那一列之外,并顯示該行之后的內(nèi)容。???
-b???--byte-offset???#在顯示符合樣式的那一行之前,標(biāo)示出該行第一個(gè)字符的編號。???
-B顯示行數(shù)???--before-context=顯示行數(shù)???#除了顯示符合樣式的那一行之外,并顯示該行之前的內(nèi)容。???
-c????--count???#計(jì)算符合樣式的列數(shù)。???
-C顯示行數(shù)????--context=顯示行數(shù)或-顯示行數(shù)???#除了顯示符合樣式的那一行之外,并顯示該行之前后的內(nèi)容。???
-d?動(dòng)作??????--directories=動(dòng)作???#當(dāng)指定要查找的是目錄而非文件時(shí),必須使用這項(xiàng)參數(shù),否則grep指令將回報(bào)信息并停止動(dòng)作。???
-e范本樣式??--regexp=范本樣式???#指定字符串做為查找文件內(nèi)容的樣式。???
-E??????--extended-regexp???#將樣式為延伸的普通表示法來使用。???
-f規(guī)則文件??--file=規(guī)則文件???#指定規(guī)則文件,其內(nèi)容含有一個(gè)或多個(gè)規(guī)則樣式,讓grep查找符合規(guī)則條件的文件內(nèi)容,格式為每行一個(gè)規(guī)則樣式。???
-F???--fixed-regexp???#將樣式視為固定字符串的列表。???
-G???--basic-regexp???#將樣式視為普通的表示法來使用。???
-h???--no-filename???#在顯示符合樣式的那一行之前,不標(biāo)示該行所屬的文件名稱。???
-H???--with-filename???#在顯示符合樣式的那一行之前,表示該行所屬的文件名稱。???
-i????--ignore-case???#忽略字符大小寫的差別。???
-l????--file-with-matches???#列出文件內(nèi)容符合指定的樣式的文件名稱。???
-L???--files-without-match???#列出文件內(nèi)容不符合指定的樣式的文件名稱。???
-n???--line-number???#在顯示符合樣式的那一行之前,標(biāo)示出該行的列數(shù)編號。???
-q???--quiet或--silent???#不顯示任何信息。???
-r???--recursive???#此參數(shù)的效果和指定“-d?recurse”參數(shù)相同。???
-s???--no-messages???#不顯示錯(cuò)誤信息。???
-v???--revert-match???#顯示不包含匹配文本的所有行。???
-V???--version???#顯示版本信息。???
-w???--word-regexp???#只顯示全字符合的列。???
-x????--line-regexp???#只顯示全列符合的列。???
-y???#此參數(shù)的效果和指定“-i”參數(shù)相同。
4.規(guī)則表達(dá)式:
grep的規(guī)則表達(dá)式:
^??#錨定行的開始?如:'^grep'匹配所有以grep開頭的行。????
$??#錨定行的結(jié)束?如:'grep$'匹配所有以grep結(jié)尾的行。????
.??#匹配一個(gè)非換行符的字符?如:'gr.p'匹配gr后接一個(gè)任意字符,然后是p。????
*??#匹配零個(gè)或多個(gè)先前字符?如:'*grep'匹配所有一個(gè)或多個(gè)空格后緊跟grep的行。????
.*???#一起用代表任意字符。???
[]???#匹配一個(gè)指定范圍內(nèi)的字符,如'[Gg]rep'匹配Grep和grep。????
[^]??#匹配一個(gè)不在指定范圍內(nèi)的字符,如:'[^A-FH-Z]rep'匹配不包含A-R和T-Z的一個(gè)字母開頭,緊跟rep的行。????
\(..\)??#標(biāo)記匹配字符,如'\(love\)',love被標(biāo)記為1。????
\??????#錨定單詞的開始,如:'\
\??????#錨定單詞的結(jié)束,如'grep\'匹配包含以grep結(jié)尾的單詞的行。????
x\{m\}??#重復(fù)字符x,m次,如:'0\{5\}'匹配包含5個(gè)o的行。????
x\{m,\}??#重復(fù)字符x,至少m次,如:'o\{5,\}'匹配至少有5個(gè)o的行。????
x\{m,n\}??#重復(fù)字符x,至少m次,不多于n次,如:'o\{5,10\}'匹配5--10個(gè)o的行。???
\w????#匹配文字和數(shù)字字符,也就是[A-Za-z0-9],如:'G\w*p'匹配以G后跟零個(gè)或多個(gè)文字或數(shù)字字符,然后是p。???
\W????#\w的反置形式,匹配一個(gè)或多個(gè)非單詞字符,如點(diǎn)號句號等。???
\b????#單詞鎖定符,如:?'\bgrep\b'只匹配grep。??
POSIX字符:
為了在不同國家的字符編碼中保持一至,POSIX(The?Portable?Operating?System?Interface)增加了特殊的字符類,如[:alnum:]是[A-Za-z0-9]的另一個(gè)寫法。要把它們放到[]號內(nèi)才能成為正則表達(dá)式,如[A-?Za-z0-9]或[[:alnum:]]。在linux下的grep除fgrep外,都支持POSIX的字符類。
[:alnum:]????#文字?jǐn)?shù)字字符???
[:alpha:]????#文字字符???
[:digit:]????#數(shù)字字符???
[:graph:]????#非空字符(非空格、控制字符)???
[:lower:]????#小寫字符???
[:cntrl:]????#控制字符???
[:print:]????#非空字符(包括空格)???
[:punct:]????#標(biāo)點(diǎn)符號???
[:space:]????#所有空白字符(新行,空格,制表符)???
[:upper:]????#大寫字符???
[:xdigit:]???#十六進(jìn)制數(shù)字(0-9,a-f,A-F)??
5.使用實(shí)例:
實(shí)例1:查找指定進(jìn)程
命令:
ps?-ef|grep?svn
輸出:
[root@localhost?~]#?ps?-ef|grep?svn
root?4943???1??????0??Dec05?????00:00:00?svnserve?-d?-r?/opt/svndata/grape/
root?16867?16838??0?19:53?pts/0????00:00:00?grep?svn
[root@localhost?~]#
說明:
第一條記錄是查找出的進(jìn)程;第二條結(jié)果是grep進(jìn)程本身,并非真正要找的進(jìn)程。
實(shí)例2:查找指定進(jìn)程個(gè)數(shù)
命令:
ps?-ef|grep?svn?-c
ps?-ef|grep?-c?svn
輸出:
[root@localhost?~]#?ps?-ef|grep?svn?-c
2
[root@localhost?~]#?ps?-ef|grep?-c?svn?
2
[root@localhost?~]#
說明:
實(shí)例3:從文件中讀取關(guān)鍵詞進(jìn)行搜索
命令:
cat?test.txt?|?grep?-f?test2.txt
輸出:
[root@localhost?test]#?cat?test.txt?
hnlinux
peida.cnblogs.com
ubuntu
ubuntu?linux
redhat
Redhat
linuxmint
[root@localhost?test]#?cat?test2.txt?
linux
Redhat
[root@localhost?test]#?cat?test.txt?|?grep?-f?test2.txt
hnlinux
ubuntu?linux
Redhat
linuxmint
[root@localhost?test]#
說明:
輸出test.txt文件中含有從test2.txt文件中讀取出的關(guān)鍵詞的內(nèi)容行
實(shí)例3:從文件中讀取關(guān)鍵詞進(jìn)行搜索?且顯示行號
命令:
cat?test.txt?|?grep?-nf?test2.txt
輸出:
[root@localhost?test]#?cat?test.txt?
hnlinux
peida.cnblogs.com
ubuntu
ubuntu?linux
redhat
Redhat
linuxmint
[root@localhost?test]#?cat?test2.txt?
linux
Redhat
[root@localhost?test]#?cat?test.txt?|?grep?-nf?test2.txt
1:hnlinux
4:ubuntu?linux
6:Redhat
7:linuxmint
[root@localhost?test]#
說明:
輸出test.txt文件中含有從test2.txt文件中讀取出的關(guān)鍵詞的內(nèi)容行,并顯示每一行的行號
實(shí)例5:從文件中查找關(guān)鍵詞
命令:
grep?'linux'?test.txt
輸出:
[root@localhost?test]#?grep?'linux'?test.txt?
hnlinux
ubuntu?linux
linuxmint
[root@localhost?test]#?grep?-n?'linux'?test.txt?
1:hnlinux
4:ubuntu?linux
7:linuxmint
[root@localhost?test]#
說明:
實(shí)例6:從多個(gè)文件中查找關(guān)鍵詞
命令:
grep?'linux'?test.txt?test2.txt
輸出:
[root@localhost?test]#?grep?-n?'linux'?test.txt?test2.txt?
test.txt:1:hnlinux
test.txt:4:ubuntu?linux
test.txt:7:linuxmint
test2.txt:1:linux
[root@localhost?test]#?grep?'linux'?test.txt?test2.txt?
test.txt:hnlinux
test.txt:ubuntu?linux
test.txt:linuxmint
test2.txt:linux
[root@localhost?test]#
說明:
多文件時(shí),輸出查詢到的信息內(nèi)容行時(shí),會(huì)把文件的命名在行最前面輸出并且加上":"作為標(biāo)示符
實(shí)例7:grep不顯示本身進(jìn)程
命令:
ps?aux|grep?\[s]sh
ps?aux?|?grep?ssh?|?grep?-v?"grep"
輸出:
[root@localhost?test]#?ps?aux|grep?ssh
root???2720??0.0??0.0??62656??1212????????Ss???Nov02???0:00?/usr/sbin/sshd
root??16834??0.0??0.0??88088??3288????????Ss???19:53???0:00?sshd:?root@pts/0?
root??16901??0.0??0.0??61180???764?pts/0??S+???20:31???0:00?grep?ssh
[root@localhost?test]#?ps?aux|grep?\[s]sh]
[root@localhost?test]#?ps?aux|grep?\[s]sh
root???2720??0.0??0.0??62656??1212????????Ss???Nov02???0:00?/usr/sbin/sshd
root??16834??0.0??0.0??88088??3288????????Ss???19:53???0:00?sshd:?root@pts/0?
[root@localhost?test]#?ps?aux?|?grep?ssh?|?grep?-v?"grep"
root???2720??0.0??0.0??62656??1212????????Ss???Nov02???0:00?/usr/sbin/sshd
root??16834??0.0??0.0??88088??3288????????Ss???19:53???0:00?sshd:?root@pts/0
說明:
實(shí)例8:找出已u開頭的行內(nèi)容
命令:
cat?test.txt?|grep?^u
輸出:
[root@localhost?test]#?cat?test.txt?|grep?^u
ubuntu
ubuntu?linux
[root@localhost?test]#
說明:
實(shí)例9:輸出非u開頭的行內(nèi)容
命令:
cat?test.txt?|grep?^[^u]
輸出:
[root@localhost?test]#?cat?test.txt?|grep?^[^u]
hnlinux
peida.cnblogs.com
redhat
Redhat
linuxmint
[root@localhost?test]#
說明:
實(shí)例10:輸出以hat結(jié)尾的行內(nèi)容
命令:
cat?test.txt?|grep?hat$
輸出:
[root@localhost?test]#?cat?test.txt?|grep?hat$
redhat
Redhat
[root@localhost?test]#
說明:
實(shí)例11:輸出ip地址
命令:
ifconfig?eth0|grep?-E?"([0-9]{1,3}\.){3}[0-9]"
輸出:
[root@localhost?test]#?ifconfig?eth0|grep?"[0-9]\{1,3\}\.[0-9]\{1,3\}\.[0-9]\{1,3\}\.[0-9]\{1,3\}"
inet?addr:192.168.120.204??Bcast:192.168.120.255??Mask:255.255.255.0
[root@localhost?test]#?ifconfig?eth0|grep?-E?"([0-9]{1,3}\.){3}[0-9]"
inet?addr:192.168.120.204??Bcast:192.168.120.255??Mask:255.255.255.0
[root@localhost?test]#
說明:
實(shí)例12:顯示包含ed或者at字符的內(nèi)容行
命令:
cat?test.txt?|grep?-E?"ed|at"
輸出:
[root@localhost?test]#?cat?test.txt?|grep?-E?"peida|com"
peida.cnblogs.com
[root@localhost?test]#?cat?test.txt?|grep?-E?"ed|at"
redhat
Redhat
[root@localhost?test]#
說明:
實(shí)例13:顯示當(dāng)前目錄下面以.txt?結(jié)尾的文件中的所有包含每個(gè)字符串至少有7個(gè)連續(xù)小寫字符的字符串的行
命令:
grep?'[a-z]\{7\}'?*.txt
輸出:
[root@localhost?test]#?grep?'[a-z]\{7\}'?*.txt
test.txt:hnlinux
test.txt:peida.cnblogs.com
test.txt:linuxmint
[root@localhost?test]#
實(shí)例14:日志文件過大,不好查看,我們要從中查看自己想要的內(nèi)容,或者得到同一類數(shù)據(jù),比如說沒有404日志信息的
命令:
grep?'.'?access1.log|grep?-Ev?'404'??access2.log
grep?'.'?access1.log|grep?-Ev?'(404|/photo/|/css/)'??access2.log
grep?'.'?access1.log|grep?-E?'404'??access2.log
輸出:
[root@localhost?test]#?grep?“.”access1.log|grep?-Ev?“404”??access2.log
說明:上面3句命令前面兩句是在當(dāng)前目錄下對access1.log文件進(jìn)行查找,找到那些不包含404的行,把它們放到access2.log中,后面去掉’v’,即是把有404的行放入access2.log
xargs 是給命令傳遞參數(shù)的一個(gè)過濾器,也是組合多個(gè)命令的一個(gè)工具,它能夠捕獲一個(gè)命令的輸出,然后傳遞給另外一個(gè)命令。之所以會(huì)用到這個(gè)命令,關(guān)鍵是由于 很多命令不支持管道來傳遞參數(shù) ,而日常工作中就有這個(gè)需要,所以就有了 xargs 命令。
我們經(jīng)常會(huì)用grep命令在文件中查找需要的內(nèi)容,比如現(xiàn)在一個(gè)文件夾里面有9個(gè)文件,有三種格式txt, csv和gz壓縮文件。
123里面存的內(nèi)容都一樣為
456里面存的內(nèi)容也一樣為
789里面存的都是
如果我現(xiàn)在要從所有的文件里面找“apple”
我會(huì)得到下面的結(jié)果,你會(huì)發(fā)現(xiàn) grep不能從gz文件中查找內(nèi)容
zgrep 這個(gè)命令可以解決這個(gè)問題,這樣就不需要先解壓然后再去查找了
會(huì)得到如下結(jié)果,顯示了所有文件格式中找到的“apple”,并且顯示了匹配的行號
如果只想在符合某種特征的文件中找你感興趣的內(nèi)容呢?比如在文件名中包含123的文件中查找“apple”。這時(shí)候就需要管道了,你需要先找到這樣的文件然后再從中找“apple”
第一步找到名字中包含123的文件
會(huì)得到文件名中包含123的所有文件
第二步查找“apple”
然后我們再來從中找“apple”,你會(huì)發(fā)現(xiàn)下面這條命令不work,你啥都得不到
這就是我們開篇提到的, 很多命令不支持管道來傳遞參數(shù)。 這個(gè)時(shí)候 xargs 就派上用場了
同時(shí)用上 zgrep ,這樣gz文件也一起找了
那么,如果我們想從某一種特定格式的文件中(比如csv文件)找特定的內(nèi)容該怎么做呢?大家應(yīng)該能觸類旁通,舉一反三了吧!
Linux xargs grep zgrep命令
Linux下常用文本處理命令大全
Linux下面有很多經(jīng)典的非常有用的命令,其中處理文本的命令就有很多。下面就讓我們一起看看這些經(jīng)典的Linux文本處理命令有哪些吧。
一. sort
文件排序, 通常用在管道中當(dāng)過濾器來使用. 這個(gè)命令可以依據(jù)指定的關(guān)鍵字或指定的字符位置, 對文件行進(jìn)行排序. 使用-m選項(xiàng), 它將會(huì)合并預(yù)排序的輸入文件. 想了解這個(gè)命令的全部參數(shù)請參考這個(gè)命令的info頁.
二. tsort
拓?fù)渑判? 讀取以空格分隔的有序?qū)? 并且依靠輸入模式進(jìn)行排序.
三. uniq
這個(gè)過濾器將會(huì)刪除一個(gè)已排序文件中的重復(fù)行. 這個(gè)命令經(jīng)常出現(xiàn)在sort命令的管道后邊.
四. expand, unexpand
expand命令將會(huì)把每個(gè)tab轉(zhuǎn)化為一個(gè)空格. 這個(gè)命令經(jīng)常用在管道中.
unexpand命令將會(huì)把每個(gè)空格轉(zhuǎn)化為一個(gè)tab. 效果與expand命令相反.
五. cut
一個(gè)從文件中提取特定域的工具. 這個(gè)命令與awk中使用的print $N命令很相似, 但是更受限. 在腳本中使用cut命令會(huì)比使用awk命令來得容易一些. 最重要的選項(xiàng)就是-d(字段定界符)和-f(域分隔符)選項(xiàng).
六. paste
將多個(gè)文件, 以每個(gè)文件一列的形式合并到一個(gè)文件中, 合并后文件中的每一列就是原來的一個(gè)文件. 與cut結(jié)合使用, 經(jīng)常用于創(chuàng)建系統(tǒng)log文件.
七. join
這個(gè)命令與paste命令屬于同類命令. 但是它能夠完成某些特殊的目地. 這個(gè)強(qiáng)力工具能夠以一種特殊的形式來合并兩個(gè)文件, 這種特殊的形式本質(zhì)上就是一個(gè)關(guān)聯(lián)數(shù)據(jù)庫的簡單版本.
join命令只能夠操作兩個(gè)文件. 它可以將那些具有特定標(biāo)記域(通常是一個(gè)數(shù)字標(biāo)簽)的行合并起來, 并且將結(jié)果輸出到stdout. 被加入的文件應(yīng)該事先根據(jù)標(biāo)記域進(jìn)行排序以便于能夠正確的匹配.
八. head
把文件的頭部內(nèi)容打印到stdout上(默認(rèn)為10行, 可以自己修改). 這個(gè)命令有一些比較有趣的選項(xiàng).
九. tail
將一個(gè)文件結(jié)尾部分的內(nèi)容輸出到stdout中(默認(rèn)為10行). 通常用來跟蹤一個(gè)系統(tǒng)logfile的.修改情況, 如果使用-f選項(xiàng)的話, 這個(gè)命令將會(huì)繼續(xù)顯示添加到文件中的行.
十. wc
wc可以統(tǒng)計(jì)文件或I/O流中的”單詞數(shù)量”:
十一. fold
將輸入按照指定寬度進(jìn)行折行. 這里有一個(gè)非常有用的選項(xiàng)-s, 這個(gè)選項(xiàng)可以使用空格進(jìn)行斷行(譯者: 事實(shí)上只有外文才需要使用空格斷行, 中文是不需要的)(請參考例子 12-23和例子 A-1).
十二. fmt
一個(gè)簡單的文件格式器, 通常用在管道中, 將一個(gè)比較長的文本行輸出進(jìn)行”折行”.
十三. col
這個(gè)命令用來濾除標(biāo)準(zhǔn)輸入的反向換行符號. 這個(gè)工具還可以將空白用等價(jià)的tab來替換. col工具最主要的應(yīng)用還是從特定的文本處理工具中過濾輸出, 比如groff和tbl. (譯者: 主要用來將man頁轉(zhuǎn)化為文本.)
十四. column
列格式化工具. 通過在合適的位置插入tab, 這個(gè)過濾工具會(huì)將列類型的文本轉(zhuǎn)化為”易于打印”的表格式進(jìn)行輸出.
十五. colrm
列刪除過濾器. 這個(gè)工具將會(huì)從文件中刪除指定的列(列中的字符串)并且寫到文件中, 如果指定的列不存在, 那么就回到stdout. colrm 2 4 filename將會(huì)刪除filename文件中每行的第2到第4列之間的所有字符. p="" /filename將會(huì)刪除filename文件中每行的第2到第4列之間的所有字符.
Caution: 如果這個(gè)文件包含tab和不可打印字符, 那將會(huì)引起不可預(yù)期的行為. 在這種情況下, 應(yīng)該通過管道的手段使用expand和unexpand來預(yù)處理colrm.
十六. nl
計(jì)算行號過濾器. nl filename將會(huì)把filename文件的所有內(nèi)容都輸出到stdout上, 但是會(huì)在每個(gè)非空行的前面加上連續(xù)的行號. 如果沒有filename參數(shù), 那么就操作stdin.
nl命令的輸出與cat -n非常相似, 然而, 默認(rèn)情況下nl不會(huì)列出空行.
十七. pr
格式化打印過濾器. 這個(gè)命令會(huì)將文件(或stdout)分頁, 將它們分成合適的小塊以便于硬拷貝打印或者在屏幕上瀏覽. 使用這個(gè)命令的不同的參數(shù)可以完成好多任務(wù), 比如對行和列的操作, 加入行, 設(shè)置頁邊, 計(jì)算行號, 添加頁眉, 合并文件等等. pr命令集合了許多命令的功能, 比如nl, paste, fold, column, 和expand.
pr -o 5 –width=65 fileZZZ | more 這個(gè)命令對fileZZZ進(jìn)行了比較好的分頁, 并且打印到屏幕上. 文件的縮進(jìn)被設(shè)置為5, 總寬度設(shè)置為65.
一個(gè)非常有用的選項(xiàng)-d, 強(qiáng)制隔行打印(與sed -G效果相同).
十八. gettext
GNU gettext包是專門用來將程序的輸出翻譯或者本地化為不同國家語言的工具集. 在最開始的時(shí)候僅僅支持C語言, 現(xiàn)在已經(jīng)支持了相當(dāng)數(shù)量的其它程序語言和腳本語言.
想要查看gettext程序如何在shell腳本中使用. 請參考info頁.
十九. msgfmt
一個(gè)產(chǎn)生二進(jìn)制消息目錄的程序. 這個(gè)命令主要用來本地化.
二十. iconv
一個(gè)可以將文件轉(zhuǎn)化為不同編碼格式(字符集)的工具. 這個(gè)命令主要用來本地化.
二十一. recode
可以認(rèn)為這個(gè)命令是上邊iconv命令的專業(yè)版本. 這個(gè)非常靈活的并可以把整個(gè)文件都轉(zhuǎn)換為不同編碼格式的工具并不是Linux標(biāo)準(zhǔn)安裝的一部分.
二十二. TeX, gs
TeX和Postscript都是文本標(biāo)記語言, 用來對打印和格式化的視頻顯示進(jìn)行預(yù)拷貝.
TeX是Donald Knuth精心制作的排版系統(tǒng). 通常情況下, 通過編寫腳本的手段來把所有的選項(xiàng)和參數(shù)封裝起來一起傳到標(biāo)記語言中是一件很方便的事情.