sort命令是對文件進(jìn)行排序,并將排序的結(jié)果輸出到屏幕,不影響原文件
創(chuàng)新互聯(lián)建站專注于南和企業(yè)網(wǎng)站建設(shè),成都響應(yīng)式網(wǎng)站建設(shè)公司,商城開發(fā)。南和網(wǎng)站建設(shè)公司,為南和等地區(qū)提供建站服務(wù)。全流程按需策劃設(shè)計(jì),專業(yè)設(shè)計(jì),全程項(xiàng)目跟蹤,創(chuàng)新互聯(lián)建站專業(yè)和態(tài)度為您提供的服務(wù)
以行為單位,將每一行作為一個(gè)單位,相互比較,比較原則是從首字符向后,以此按ASCII碼進(jìn)行比較,最后升序輸出
參數(shù)
-b 忽略每行前面開始處的空格
-d 只按照英文字母,數(shù)字,空格字符排序,忽略其他字符
-m 將幾個(gè)排序好的文件進(jìn)行合并
-n 依照數(shù)值的大小進(jìn)行排序,如果是按照數(shù)值大小排序一定要加 -n ,否則就會(huì)出現(xiàn) 10 比2 小的情況,因?yàn)槟J(rèn)比較數(shù)值是先比較第1位的,后面的位不考慮
-o 將排序好的結(jié)果輸出到文件, 也可以使用重定向符號 輸出到文件中
-r 以相反的順序來排序, 默認(rèn)是升序
sort 是將文件的每一行作為一個(gè)單位,相互比較,比較原則是從首字符向后,依次按照ASCII碼值進(jìn)行比較,默認(rèn)將他們按照升序輸出
降序
在輸出中去重
將排序結(jié)果輸出到原文件
sort的默認(rèn)輸出是輸出到標(biāo)準(zhǔn)輸出,如果想把結(jié)果輸出到文件,需要 sort file newfile,但是如果想把結(jié)果輸出到原文件這樣就不行了,這時(shí)就需要 使用sort -o
以數(shù)值來排序
sort 默認(rèn)是按照字符串排序的,這樣就會(huì)出現(xiàn)10比3小的情況,sort -n 就可以告訴sort 以整數(shù)排序
-t 后面跟 分隔符
-k 后面跟數(shù)字,表示用第幾列排序
如 sort -t : -k 2 表示把每行 以:號分割,按照第二列排序
banana:30:5.5
orange:20:3.4
apple:10:2.5
我們可以看到,當(dāng)baidu 和soho都是100的時(shí)候,baidu排在前面,當(dāng)當(dāng)前域按照默認(rèn)規(guī)矩,是從第一個(gè)域開始進(jìn)行升序排序,因此baidu排在了sohu前面。
sort 支持 -k 2 -k3這種模式,如果你需要,你可以繼續(xù)這么寫下去
你仔細(xì)看看,在-k 3后面偷偷加上了一個(gè)小寫字母r,r和-r的作用是一樣,你也可以把前面的-n去掉 在r后面加上n,如下
其實(shí)-k 選項(xiàng) 功能很強(qiáng)大,語法[ FStart [ .CStart ] ] [ Modifier ] [ , [ FEnd [ .CEnd ] ][ Modifier ] ]
從逗號前后 分為兩大部分,即-k 2,2,是嚴(yán)格使用第一個(gè)域排序,如果只設(shè)置-k 2 其實(shí)是按照從第一個(gè)域到行尾。逗號分開的每部分又有一個(gè)點(diǎn)表示子域,即-k 1.2表示 按照第一個(gè)域的第二個(gè)字符排序,Modifiers就是我們用到的n和r 如 -k 1.2nr 具體我們看下面的例子。
我們使用了-k 1.2,這就表示對第一個(gè)域的第二個(gè)字符開始到本域的最后一個(gè)字符為止的字符串進(jìn)行排序。你會(huì)發(fā)現(xiàn)baidu因?yàn)榈诙€(gè)字母是a而名列榜首。sohu和 google第二個(gè)字符都是o,但sohu的h在google的o前面,所以兩者分別排在第二和第三。這和之前說到的按照默認(rèn)的排序規(guī)則 是不同的,當(dāng)?shù)谝粋€(gè)域的第二個(gè)字符相同時(shí),他不會(huì)去按照第一個(gè)字符排序,而是按照后面的字符排序,這是因?yàn)?k 1.2是對第一個(gè)域的第二個(gè)字符開始到本域的最后一個(gè)字符為止的字符串進(jìn)行排序。而之前的夸域其實(shí)是一種假象。
-u只識別用-k設(shè)定的域,發(fā)現(xiàn)相同,就將后續(xù)相同的行都刪除
但是這時(shí)候,卻一行也沒有刪除。原來-u是會(huì)權(quán)衡所有-k選項(xiàng),將都相同的才會(huì)刪除,只要其中有一級不同都不會(huì)輕易刪除的
可以用到b、d、f、i、n 或 r。
其中n和r你肯定已經(jīng)很熟悉了。
b表示忽略本域的簽到空白符號。
d表示對本域按照字典順序排序(即,只考慮空白和字母)。
f表示對本域忽略大小寫進(jìn)行排序。
i表示忽略“不可打印字符”,只針對可打印字符進(jìn)行排序。(有些ASCII就是不可打印字符,比如\a是報(bào)警,\b是退格,\n是換行,\r是回車等等)
一個(gè)比較經(jīng)典的問題:
如果線上機(jī)器的磁盤占用率超級高,怎么辦?
這時(shí)候優(yōu)先想到的肯定是,定位到占用磁盤空間最大的那些文件,然后把可以刪的給刪掉。
那么,問題來了,如何定位到占用磁盤空間最大的文件?
一個(gè)辦法是執(zhí)行如下命令:
里面涉及三個(gè)指令:du、sort、more
既然用到了,就順便多了解一下這三個(gè)指令的用法,算是做下個(gè)人筆記。
首先是du
作用:用來查看文件所占用的磁盤情況。
格式:du [選項(xiàng)] [文件]
可用選項(xiàng)(如下為du --help展示的內(nèi)容):
操作示例:
對幾個(gè)比較常用的選項(xiàng)單獨(dú)拿出來,在機(jī)器上實(shí)際操作,效果如下:
首先,當(dāng)前目錄如下:
du:
其實(shí)吧,從圖里面可以看到,使用“du”的時(shí)候,最后一行就當(dāng)前目錄的磁盤使用總量,所以,感覺一般情況下-c這個(gè)選項(xiàng)并沒有什么用。
du -s:只計(jì)算總量
不過,注意:-s與-a不能同時(shí)存在,會(huì)報(bào)錯(cuò)的。
sort
作用:對輸出的結(jié)果進(jìn)行排序
可用選項(xiàng):
-r:代表逆序排序
-n:按照字符串?dāng)?shù)值排序
-g:按照常規(guī)數(shù)值排序
-f:忽略字母大小寫
實(shí)測效果:
首先是測試文件的原始狀態(tài):
測試一:sort
可以發(fā)現(xiàn):
空行排在了第一位;
不管數(shù)字有多大,字符串都會(huì)排在數(shù)字的后面;
數(shù)字之間排序的時(shí)候,優(yōu)先考慮首位數(shù)字(感覺是把數(shù)字也當(dāng)成了一個(gè)字符串進(jìn)行排序);
more
作用:用于一頁一頁地展示文件內(nèi)容。
幾個(gè)常用操作:
空格:翻到下一頁
b:翻到上一頁
/:啟動(dòng)字符串搜索(類似于vim)
此外:
more +n XXX:從XXX文件的第n行開始展示
more -n XXX:展示XXX文件,并且將n行視為一頁,也就是按空格時(shí),只會(huì)顯示后續(xù)的N行
cat
作用:一次性的展示所有文件內(nèi)容
cat有兩個(gè)比較有用的選項(xiàng):
-n:輸出所有行號
-b:只對非空行輸出行號
此外,
cat支持同時(shí)輸出多個(gè)文件的內(nèi)容:cat XXX YYYY ZZZZ
并且,cat可以與more結(jié)合使用:cat XXX | more 或者 cat XXX YYYY ZZZZ | more 或者 cat -n XXX | more
less:
作用:對文件或者輸出內(nèi)容進(jìn)行分頁展示,并且less可以用于打開多個(gè)文件
常用操作:
j:向上滾動(dòng)一行
k:向下滾動(dòng)一行(類似于vim)
g:跳到第一行
G:跳到最后一行
b:向上翻一頁
空格:翻頁
n%:跳轉(zhuǎn)到整個(gè)文件的n%處
:e :在使用less打開多個(gè)文件時(shí),使用“:e”選擇跳轉(zhuǎn)到其他文件去
/:進(jìn)行字符串搜索
v:啟動(dòng)編輯
常用選項(xiàng):
-N:在每一行前面都顯示行號
-m:顯示讀取文件的百分比
-M:顯示讀取文件的百分比、行號和總行數(shù)
注意:
其他兩個(gè)比較簡單的指令:
head:顯示一個(gè)文件的前N行
用法:head -n 行數(shù) 文件名
tail:顯示一個(gè)文件的最后N行
用法:tail -n 行數(shù) 文件名
不過,使用tai的時(shí)候,因?yàn)?f選項(xiàng)可以自動(dòng)顯示新增加的內(nèi)容,所以經(jīng)常會(huì)使用如下方式:
tail -f 文件名