linux基礎(chǔ)-字符處理
為荔波等地區(qū)用戶提供了全套網(wǎng)頁設(shè)計制作服務(wù),及荔波網(wǎng)站建設(shè)行業(yè)解決方案。主營業(yè)務(wù)為成都做網(wǎng)站、成都網(wǎng)站設(shè)計、荔波網(wǎng)站設(shè)計,以傳統(tǒng)方式定制建設(shè)網(wǎng)站,并提供域名空間備案等一條龍服務(wù),秉承以專業(yè)、用心的態(tài)度為用戶提供真誠的服務(wù)。我們深信只要達(dá)到每一位用戶的要求,就會得到認(rèn)可,從而選擇與我們長期合作。這樣,我們也可以走得更遠(yuǎn)!
linux管道命令(pipe)
菜鳥教程
管道是一種通信機制,通常用于進程間的通信,它表現(xiàn)出來的形式將前面每一個進程的輸出直接作為下一個進程的輸入。
管道命令使用 | 作為界定符號。
默認(rèn)情況下,sort命令以第一列進行排序
反向排序
按指定列進行排序,默認(rèn)是空白符,也可以用 -t 指定分隔符
第二列排序的時候可以加 -n 進行數(shù)值排序
進行排序后,排序結(jié)果會顯示在終端,但是原文件不會改變,可以用-o重定向或者另存。用 覆蓋某個文件會失敗,數(shù)據(jù)被清空,但是用 追加可以
為初學(xué)者提供的uniq命令教程及示例
uniq 命令用于檢查及刪除文本文件中重復(fù)出現(xiàn)的行列。uniq命令只有在相鄰的情況下才會刪除重復(fù)的行,因此一般與 sort 命令結(jié)合使用,此外,該命令也可以檢查文本文件中重復(fù)出現(xiàn)的行列,默認(rèn)區(qū)分大小寫。
準(zhǔn)備一個文件
準(zhǔn)備一個文件
以分割符指定分割某些特定的列
Linux tr 命令用于轉(zhuǎn)換或刪除文件中的字符。
tr 指令從標(biāo)準(zhǔn)輸入設(shè)備讀取數(shù)據(jù),經(jīng)過字符串轉(zhuǎn)譯后,將結(jié)果輸出到標(biāo)準(zhǔn)輸出設(shè)備。
語法:tr [OPTION]…SET1[SET2]
小寫轉(zhuǎn)換為大寫
刪除字符
Linux paste 命令用于合并文件的列。
paste 指令會把每個文件以列對列的方式,一列列地加以合并。
不加參數(shù)會默認(rèn)以制表符為分界列對列合并
-d可以設(shè)置以何種字符合并
使用s參數(shù)時。單個文件會將該文件的多行數(shù)據(jù)合并成一行顯示,多個文件會將各個文件單獨合并成一行之后再行對行合并
Linux split命令用于將一個文件分割成數(shù)個。
該指令將大文件分割成較小的文件,在默認(rèn)情況下將按照每1000行切割成一個小文件。
將根目錄文件信息寫入文件
對上面的文件9行為一個文件進行分割
以1k字節(jié)分割文件
不加參數(shù)會同時顯示行數(shù),字?jǐn)?shù),Bytes數(shù),加上上述參數(shù)會單獨顯示其中一項
1.列出文件清單命令:ls
ls命令能夠列出當(dāng)前目錄下的所有內(nèi)容。ls 命令的執(zhí)行方式為:
# ls [-選項] [文件名或者目錄名]
進入到Linux命令行中后,我們至少要知道當(dāng)前所處的位置有哪些內(nèi)容,這些信息就可以使用ls命令來獲得。
在Linux中,ls命令是最常使用的命令之一,因為在命令行下要隨時查看目錄內(nèi)容。如果不加任何選項的話,ls命令僅列出當(dāng)前目錄下的文件和目錄名,例如,想要查看/etc目錄下的內(nèi)容,可以使用下列命令:
# ls /etc
如果想要列出當(dāng)前目錄下所有文件,則可以使用下列命令:
# ls -a
2、cat命令
功能:在標(biāo)準(zhǔn)輸出上顯示文件。
語法:cat [-vTEuAte] 文件
例子: cat example.txt
cat -A exam2.txt
cat file1 file2 file2
3、more命令
功能:在終端屏幕按屏顯示文本文件。
語法: more [-pcdls] 文件
例子: more example.c
more -dc example.c
more -c -10 example.c
4、less命令
less命令的功能幾乎和more命令一樣,也是用來按頁顯示文件,不同之處在于less命令在顯示文件時允許用戶既
可以向前又可以向后翻閱文件。
5、head命令
功能:顯示指定文件的前若干行。缺省設(shè)置為顯示10行
語法:head [-n] 文件
例子: head example.c
head -3 example.c
6、tail命令
功能:顯示指定文件的末尾若干行。缺省設(shè)置為顯示10行
語法:tail [+ / - num ] [參數(shù)] 文件
+num 從第num行以后開始顯示。- num 從距文件尾num行處開始顯示。
例子: tail example.c
tail -4 example.c
7、grep、fgrep和egrep命令
功能:
這組命令以指定模式搜索文件,并通知用戶在什么文件中搜索到與指定的模式匹配的字符串,并打印出所有包含該字符串的文本行,在該文本行的最前面是該行所在的文件名。grep命令一次只能搜索一個指定的模式;egrep命令檢索擴展的正則表達(dá)式(包括表達(dá)式組和可選項);fgrep命令檢索固定字符串,它不識別正則表達(dá)式,是快速搜索命令。
語法:
grep [-EFbcihlnvxef] [查找模式] [文件名1,文件名2,……]
egrep [選項] [查找模式] [文件名1,文件名2,……]
fgrep [選項] [查找模式] [文件名1,文件名2,……]
例子: grep "text file" example
grep data *
grep goto *.c
sort 是將文件的每一行作為一個單位,相互比較,比較原則是從首字符向后,依次按照ASCII碼值進行比較,默認(rèn)將他們按照升序輸出
降序
在輸出中去重
將排序結(jié)果輸出到原文件
sort的默認(rèn)輸出是輸出到標(biāo)準(zhǔn)輸出,如果想把結(jié)果輸出到文件,需要 sort file newfile,但是如果想把結(jié)果輸出到原文件這樣就不行了,這時就需要 使用sort -o
以數(shù)值來排序
sort 默認(rèn)是按照字符串排序的,這樣就會出現(xiàn)10比3小的情況,sort -n 就可以告訴sort 以整數(shù)排序
-t 后面跟 分隔符
-k 后面跟數(shù)字,表示用第幾列排序
如 sort -t : -k 2 表示把每行 以:號分割,按照第二列排序
banana:30:5.5
orange:20:3.4
apple:10:2.5
我們可以看到,當(dāng)baidu 和soho都是100的時候,baidu排在前面,當(dāng)當(dāng)前域按照默認(rèn)規(guī)矩,是從第一個域開始進行升序排序,因此baidu排在了sohu前面。
sort 支持 -k 2 -k3這種模式,如果你需要,你可以繼續(xù)這么寫下去
你仔細(xì)看看,在-k 3后面偷偷加上了一個小寫字母r,r和-r的作用是一樣,你也可以把前面的-n去掉 在r后面加上n,如下
其實-k 選項 功能很強大,語法[ FStart [ .CStart ] ] [ Modifier ] [ , [ FEnd [ .CEnd ] ][ Modifier ] ]
從逗號前后 分為兩大部分,即-k 2,2,是嚴(yán)格使用第一個域排序,如果只設(shè)置-k 2 其實是按照從第一個域到行尾。逗號分開的每部分又有一個點表示子域,即-k 1.2表示 按照第一個域的第二個字符排序,Modifiers就是我們用到的n和r 如 -k 1.2nr 具體我們看下面的例子。
我們使用了-k 1.2,這就表示對第一個域的第二個字符開始到本域的最后一個字符為止的字符串進行排序。你會發(fā)現(xiàn)baidu因為第二個字母是a而名列榜首。sohu和 google第二個字符都是o,但sohu的h在google的o前面,所以兩者分別排在第二和第三。這和之前說到的按照默認(rèn)的排序規(guī)則 是不同的,當(dāng)?shù)谝粋€域的第二個字符相同時,他不會去按照第一個字符排序,而是按照后面的字符排序,這是因為-k 1.2是對第一個域的第二個字符開始到本域的最后一個字符為止的字符串進行排序。而之前的夸域其實是一種假象。
-u只識別用-k設(shè)定的域,發(fā)現(xiàn)相同,就將后續(xù)相同的行都刪除
但是這時候,卻一行也沒有刪除。原來-u是會權(quán)衡所有-k選項,將都相同的才會刪除,只要其中有一級不同都不會輕易刪除的
可以用到b、d、f、i、n 或 r。
其中n和r你肯定已經(jīng)很熟悉了。
b表示忽略本域的簽到空白符號。
d表示對本域按照字典順序排序(即,只考慮空白和字母)。
f表示對本域忽略大小寫進行排序。
i表示忽略“不可打印字符”,只針對可打印字符進行排序。(有些ASCII就是不可打印字符,比如\a是報警,\b是退格,\n是換行,\r是回車等等)