正則表達式是對字符串操作的一種邏輯公式,就是用事先定義好的一些特定字符、及這些特定字符的組合,組成一個“規(guī)則字符串”,這個“規(guī)則字符串”用來表達對字符串的一種過濾邏輯。
成都創(chuàng)新互聯(lián)主營嘉祥網(wǎng)站建設的網(wǎng)絡公司,主營網(wǎng)站建設方案,重慶APP軟件開發(fā),嘉祥h5成都微信小程序搭建,嘉祥網(wǎng)站營銷推廣歡迎嘉祥等地區(qū)企業(yè)咨詢
正則表達式的字符串表達方法根據(jù)不同的嚴謹程度與功能分為基本正則表達式與擴展正則表達式?;A正則表達式是常用的正則表達式的最基礎的部分。在 Linux 系統(tǒng)中常見的文件處理工具中 grep 與 sed 支持基礎正則表達式,而 egrep 與 awk 支持擴展正則表達式。
1)查找特定字符
-n:顯示行號 -i:不區(qū)分大小寫
查找出目標文件中帶有“the”的字符
[root@localhost conf]# grep -n 'the' httpd.conf
若反向查找,查找不包含“the”字符的行,則需要通過“-vn”選項實現(xiàn)
[root@localhost conf]# grep -vn 'the' httpd.conf
2)利用中括號“[ ]”來查找集合字符(先創(chuàng)建一個自定義的文本文件a.txt)
想要查找“shirt”與“short”這兩個字符串時,可以發(fā)現(xiàn)這兩個字符串均包含“sh” 與“rt”。此時執(zhí)行以下命令即可同時查找到“shirt”與“short”這兩個字符串?!癧]”中無論有幾個字符,都僅代表一個字符,也就是說“[io]”表示匹配“i”或者“o”。
#a.txt實驗文本
short
shirt
oo
tools
wood
woooooood
Wood
the football
this the web
123123
456456.
[root@localhost ~]# grep -n 'sh[io]rt' a.txt
若要查找包含重復單個字符“oo”時,只需要執(zhí)行以下命令即可
[root@localhost ~]# grep -n 'oo' a.txt
若查找“oo”前面不是“w”的字符串,只需要通過集合字符的反向選擇“[^]”來實現(xiàn)該目的
[root@localhost ~]# grep -n '[^w]oo' a.txt
在上述命令的執(zhí)行結(jié)果中發(fā)現(xiàn)“wooooood”也符合匹配規(guī)則,包含“w”。其實通過執(zhí)行結(jié)果就可以看出,符合匹配標準的字符加粗顯示,而上述結(jié)果中可以得知,“#wooooood #”中加粗顯示的是“oooooo”,而“oo”前面的“o”是符合匹配規(guī)則的。
若不希望“oo”前面存在小寫字母a-z A-Z 數(shù)字0-9
[root@localhost ~]# grep -n '[^a-z]oo' a.txt
3)查找行首“^”與行尾字符“$”
基礎正則表達式包含兩個定位元字符:“^”(行首)與“$”(行尾)。在上面的示例中,查詢“the”字符串時出現(xiàn)了很多包含“the”的行,如果想要查詢以“the”字符串為行首的行,則可以通過“^”元字符來實現(xiàn)。
[root@localhost ~]# grep -n '^the' test.txt
查詢以小寫字母開頭的行可以通過“^[a-z]”規(guī)則來過濾,查詢大寫字母開頭的行則使用“^[A-Z]”規(guī)則,若查詢不以字母開頭的行則使用“^[^a-zA-Z]”規(guī)則。
[root@localhost ~]# grep -n '^[^a-zA-Z]' a.txt
“^”符號在元字符集合“[]”符號內(nèi)外的作用是不一樣的,在“[]”符號內(nèi)表示反向選擇,在“[]”符號外則代表定位行首。反之,若想查找以某一特定字符結(jié)尾的行則可以使用“$”定位符。例如,執(zhí)行以下命令即可實現(xiàn)查詢以小數(shù)點(.)結(jié)尾的行。因為小數(shù)點(.) 在正則表達式中也是一個元字符(后面會講到),所以在這里需要用轉(zhuǎn)義字符“\”將具有特 殊意義的字符轉(zhuǎn)化成普通字符??招惺褂胇$即可。
[root@localhost ~]# grep -n '\.$' a.txt
4)查找任意一個字符“.”與重復字符“*”
前面提到,在正則表達式中小數(shù)點(.)也是一個元字符,代表任意一個字符。例如, 執(zhí)行以下命令就可以查找“w??d”的字符串,即共有四個字符,以 w 開頭 d 結(jié)尾。
在上述結(jié)果中,“wood”字符串“w..d”匹配規(guī)則。若想要查詢 oo、ooo、ooooo 等資料,則需要使用星號()元字符。但需要注意的是,“”代表的是重復零個或多個前面的單字符。
[root@localhost ~]# grep -n 'oo*' a.txt
查詢以 w 開頭 d 結(jié)尾,中間的字符可有可無的字符串。
[root@localhost ~]# grep -n 'w.d' a.txt
查詢?nèi)我鈹?shù)字所在行。
[root@localhost ~]# grep -n '[0-9][0-9]' a.txt
5)查找連續(xù)字符范圍“{}”
查詢以 w 開頭以 d 結(jié)尾,中間包含 2~5 個 o 的字符串。
[root@localhost ~]# grep -n 'wo{2,5}d' a.txt
查詢以 w 開頭以 d 結(jié)尾,中間包含 2 個 o 以上的字符串。
[root@localhost ~]# grep -n 'wo{2,}d' a.txt
通常情況下會使用基礎正則表達式就已經(jīng)足夠了,但有時為了簡化整個指令,需要使用范圍更廣的擴展正則表達式。
grep 命令僅支持基礎正則表達式,如果使用擴展正則表達式,需要使用 egrep 或 awk 命令。
另外有需要云服務器可以了解下創(chuàng)新互聯(lián)cdcxhl.cn,海內(nèi)外云服務器15元起步,三天無理由+7*72小時售后在線,公司持有idc許可證,提供“云服務器、裸金屬服務器、高防服務器、香港服務器、美國服務器、虛擬主機、免備案服務器”等云主機租用服務以及企業(yè)上云的綜合解決方案,具有“安全穩(wěn)定、簡單易用、服務可用性高、性價比高”等特點與優(yōu)勢,專為企業(yè)上云打造定制,能夠滿足用戶豐富、多元化的應用場景需求。