這篇文章主要為大家展示了“PHP中支持幾種風(fēng)格的正則表達式語法”,內(nèi)容簡而易懂,條理清晰,希望能夠幫助大家解決疑惑,下面讓小編帶領(lǐng)大家一起研究并學(xué)習(xí)一下“PHP中支持幾種風(fēng)格的正則表達式語法”這篇文章吧。
讓客戶滿意是我們工作的目標,不斷超越客戶的期望值來自于我們對這個行業(yè)的熱愛。我們立志把好的技術(shù)通過有效、簡單的方式提供給客戶,將通過不懈努力成為客戶在信息化領(lǐng)域值得信任、有價值的長期合作伙伴,公司提供的服務(wù)項目有:主機域名、虛擬空間、營銷軟件、網(wǎng)站建設(shè)、庫倫網(wǎng)站維護、網(wǎng)站推廣。
PHP支持兩種風(fēng)格的正則表達式語法:POSIX和Perl。POSIX風(fēng)格的正則表達式更容易掌握,但不能安全用于二進制模式,而Perl兼容的正則表達式相對比較復(fù)雜。
正則表達式就是有普通字符(如a~z)和特殊字符(稱為元字符)組成的字符串模式。使用正則表達式可以完成以下功能:①測試字符串的某個模式;②替換文本;③根據(jù)模式匹配從字符串中提取一個子字符串。
一、POSIX風(fēng)格的正則表達式
1.編寫正則表達式
正則表達式是有普通字符和元字符組成的,通過元字符和普通字符的不同組合,可以寫出不同意義的正則表達式。
POSIX正則表達式語法格式列表
字符 | 描述 |
\ | 轉(zhuǎn)義字符,用于轉(zhuǎn)義特殊字符。 |
^ | 匹配輸入字符串的開始位置。 |
$ | 匹配輸入字符串的結(jié)束位置。 |
* | 匹配前面的子表達式零次或多次。 |
+ | 匹配前面的子表達式一次或多次。 |
? | 匹配前面的子表達式零次或一次。 |
{n} | n是一個非負整數(shù),匹配確定的n次。 |
{n,} | n是一個非負整數(shù),至少匹配n次。 |
{n,m} | m和n均是非負整數(shù),其中n<=m,最少匹配n次且最多匹配m次。注意在逗號和兩個數(shù)之間不能有空格。 |
? | 當該字符緊跟在任何一個其他限制符(*,+,?,{n},{n,},{n,m})后面時,匹配模式是非貪婪的。非貪婪模式盡可能少地匹配所搜索的字符串,而默認的貪婪模式則盡可能多地匹配所搜索的字符串。 |
. | 匹配除"\n"之外的任何單個字符,要匹配包括'\n'在內(nèi)的任何字符,可以使用'[.\n]'的模式。 |
(pattern) | 匹配pattern并獲取這一匹配。所獲取的匹配保存到相應(yīng)的數(shù)組中。要匹配圓括號字符,請使用'\('或'\)'。 |
(?:pattern) | 匹配pattern但不獲取匹配結(jié)果,也就是說這是一個非獲取匹配,不進行存儲。這在使用''或"|"來組合一個模式的各個部分時很有用。 |
(?=pattern) | 正向預(yù)查,在任何匹配pattern的字符串開始出匹配查找字符串。這是一個非獲取匹配,也就是說,該匹配不需要獲取供以后使用。預(yù)查不消耗字符,也就是說,在一個匹配發(fā)生后,在會后一次匹配之后立即開始下一次匹配的搜索,而不是從包含預(yù)查的字符之后開始。 |
(?!pattern) | 負向預(yù)查,在任何不匹配pattern的字符串開始處匹配查找字符串。這是一個非獲取匹配,也就是說該匹配不需要獲取供以后使用。預(yù)查不消耗字符,也就是說,在一個匹配發(fā)生后,在會后一次匹配之后立即開始下一次匹配的搜索,而不是從包含預(yù)查的字符之后開始。 |
x|y | 匹配x或y。 |
[xyz] | 字符集合。匹配所包含的任意一個字符。 |
[^xyz] | 負值匹配字符集。匹配未包含的任意字符。 |
[a-z] | 字符范圍。匹配制定范圍內(nèi)的任意字符。 |
[^a-z] | 負值字符范圍。匹配不在指定范圍內(nèi)的任意字符。 |
注意:在PHP中最好將正則表達式放在單引號中。
2.字符串的匹配
在PHP中,用于匹配POSIX風(fēng)格正則表達式的函數(shù)有ereg()和eregi()函數(shù)。
使用ereg()函數(shù)可以查找字符串與子字符串匹配的情況,并返回匹配字符串的長度,還可以借助參數(shù)返回匹配字符的數(shù)組。語法:
int ereg(string ($pattern), string $string[, array $reg])
ereg()函數(shù)在字符串$string中查找與給定正則表達式$pattern相匹配的子字符串。$pattern中可以使用圓括號“()”將一些子模式括起來獲取這一匹配。如果找到與$pattern圓括號內(nèi)的子模式相匹配的子串并且函數(shù)調(diào)用了第三個參數(shù)$regs,則匹配項將被存入$regs數(shù)組中。$regs[1]包含第一個左圓括號開始的紫川,$regs[2]包含第二個子串,以此類推。$regs[0]好漢整個匹配的字符串。如果在$string中找到$pattern模式的匹配,則返回所匹配字符串的長度,如果沒有找到匹配或出錯則返回FALSE。如果沒有傳入可選參數(shù)$regs或者所匹配的字符串長度為0,則本函數(shù)返回1.
eregi()函數(shù)功能與ereg()函數(shù)基本相同,不過ereg()函數(shù)區(qū)分大小寫,eregi()函數(shù)不區(qū)分大小寫。
3.字符串的替換
POSIX風(fēng)格的正則表達式函數(shù)ereg_replace()函數(shù)與str_replace()函數(shù)一樣,可以將查到的字符串替換為指定字符串。而ereg_replace()函數(shù)能實現(xiàn)更為復(fù)雜的字符串操作。ereg_replace()函數(shù)語法格式:
string ereg_replace(string $pattern,string $replacement,string $string)
函數(shù)使用字符串$replacement替換字符串$string中的$pattern匹配的部分,并返回替換后的字符串。若未找到匹配項,則原樣返回。
如果$pattern包含有括號的子集,則$replacement可以包含形如“\\$num”的子串,$num表示一個數(shù)字,這些子串將被替換為正則表達式中的$num個括號內(nèi)的子串,這種用法成為逆向引用。
eregi_replacement()函數(shù)不區(qū)分大小寫。
4.分割數(shù)組
使用split()函數(shù)可以完成與explode()函數(shù)一樣的功能,而且可以根據(jù)給出的正則表達式來分割字符串,并返回一個數(shù)組。
array split(string $pattern,string $string[,int $limit])
本函數(shù)使用$pattern作為邊界對字符串$string進行分割,并將分割后的子字符串保存在數(shù)組中返回。如果設(shè)定了$limit,則返回的數(shù)組最多包含$limit個單元,而其中最后一個單元包含了$string中生育的所有部分。
spliti()函數(shù)不區(qū)分大小寫。
5.產(chǎn)生正則表達式
使用sql_regcase()函數(shù)可以產(chǎn)生不區(qū)分大小寫的正則表達式。
string sql_regcase(string $string)
函數(shù)返回與$string相匹配的正則表達式,不區(qū)分大小寫字母。返回的表達式是將$string中的每個字母字符轉(zhuǎn)換為方括號表達式,該方括號表達式包含了該子母的大小寫形式。其他字符保留不變。
二、Perl兼容的正則表達式
1.編寫正則表達式
Perl兼容的正則表達式必須包含在定界符中,除數(shù)字、字幕、反斜線外的任何字符后可以作為定界符,另外,如果定界符要出現(xiàn)在表達式中需要使用轉(zhuǎn)義符轉(zhuǎn)義。
Perl兼容的正則表達式擴充的語法格式
字符 | 描述 |
\b | 匹配一個單詞邊界,也就是指單詞和空格間的位置。 |
\B | 匹配非單詞邊界。 |
\cx | 匹配由x指明的控制字符。x的值必須為A~Z或a~z之一。否則,將‘c’是為一個原義的‘c’字符 |
\d | 匹配一個數(shù)字字符。 |
\D | 匹配一個非數(shù)字字符。 |
\f | 匹配一個換頁符。 |
\n | 匹配一個換行符。 |
\r | 匹配一個回車符。 |
\s | 匹配任何空白字符,包括空格、制表符、換頁符等。 |
\S | 匹配任何非空白字符。 |
\t | 匹配一個制表符 |
\v | 匹配一個垂直制表符 |
\w | 匹配包括下劃線的任何單詞字符。 |
\W | 匹配任何飛單詞字符。等價于[^A-Za-z0-9] |
\xn | 匹配n,其中n為十六進制轉(zhuǎn)義值。十六進制轉(zhuǎn)義值必須為確定的兩個數(shù)字長。正則表達式中可以使用ASCII碼 |
\num | 匹配num,其中num是一個正整數(shù)。對所獲取的匹配的引用。 |
\n | 標志一個八進制轉(zhuǎn)義值或一個后向引用。如果\n之前至少有n個獲取得子表達式,則n為后向引用。否則,如果n為八進制數(shù)字(0~7),則n為一個八進制轉(zhuǎn)義值。 |
\nm | 標志一個八進制轉(zhuǎn)義值或一個后向引用。如果\nm之前至少有nm個獲取得子表達式,則nm為后向引用。如果\nm之前至少有n個獲取,則n為一個后跟文字m的后向引用。如果前面的田間都不滿足,若n和m均為八進制數(shù)字(0-7),則\nm將匹配八進制轉(zhuǎn)義值nm |
\nml | 如果n為八進制數(shù)字(0-3),且m和l均為八進制數(shù)字(0-7),則匹配八進制轉(zhuǎn)義值nml |
\un | 匹配n,其中n是用4個十六進制數(shù)字表示的Unicode字符。 |
2.字符串匹配
使用preg_match()函數(shù)進行字符串的查找。語法格式如下:
int preg_match(string $pattern,string $subject[,array $matchs[,int $flags]])
在$subject字符串中搜索與$pattern給出的正則表達式相匹配的內(nèi)容。preg_match()函數(shù)返回$pattern所匹配的次數(shù)。不是0次就是1次,因為preg_match()函數(shù)在第一次匹配之后將停止搜索。
函數(shù)如果提供了$matchs參數(shù),則其會被搜索的結(jié)果所填充。$matchs[0]將包含與整個模式匹配的文本,$matchs[1]將包含與第一個捕獲的括號中的子模式所匹配的文本,以此類推。
preg_relpace()函數(shù)語法格式中$flags是可選參數(shù),值可以是PREG_OFFSET_CAPTURE。如果設(shè)定本標記,對每個出現(xiàn)的匹配結(jié)果也同時返回其附屬的字符串偏移量。這改變了返回的數(shù)組的值,使其中的每個單元也是一個數(shù)組,其中第一項為匹配字符串,第二項為偏移量。
Perl兼容的正則表達式還有一個字符串匹配函數(shù)preg_match_all()。
int preg_match_all(string $pattern, string $subject,array $matchs[,int $flags])
該函數(shù)的語法格式與preg_match()函數(shù)相同,作用也是搜索指定字符串并放到相應(yīng)數(shù)組中。不同的是,preg_match()函數(shù)在搜索到第一個匹配結(jié)果時就停止匹配,而preg_match_all()函數(shù)搜索到第一個匹配結(jié)果后會從第一個匹配項的末尾開始繼續(xù)搜索,知道搜索完整個字符串。preg_match_all()函數(shù)單數(shù)$flags的值可以取以下三種:
ⅠPREG_PATTERN_ORDER.默認項,表示$matchs[0]為全部模式匹配的數(shù)組,$match[1]為第一個括號中的子模式所匹配的字符串組成的數(shù)組,以此類推。
ⅡPREG_SET_ORDER.如果設(shè)定此標記,則$matches[0]為第一組匹配項的數(shù)組,$matchs[1]為第二組匹配項的數(shù)組,以此類推。
ⅢPREG_OFFSET_CAPTURE.此標記可以和其他兩個標記組合使用,如果設(shè)定本標記,對每個出現(xiàn)的匹配結(jié)果也同時返回其附屬的字符串偏移量。
3.字符串替換
使用preg_replace()函數(shù)可以在字符串中查找匹配的子字符串,并用指定字符串替換子字符串。
mixed preg_replace(mixed $pattern, mixed $replacement,mixed $subject[,int $limit])
在$subject中搜索$pattern模式的匹配項并替換為$replacement。如果制定了$limit,則僅替換$limit個匹配項,如果省略$limit或者其值為-1,則所有的匹配項都會被替換。
函數(shù)語法格式中,如果$subject是個數(shù)組,則會對$subject中的每個項目執(zhí)行搜索和替換,并返回一個新數(shù)組。如果$pattern和$replacement都是數(shù)組,則$preg_replace()函數(shù)會依次從$pattern中取出值來對$subject進行搜索和替換。
4.字符串分割
preg_split()函數(shù)可以使用正則表達式作為邊界分割一個字符串,并將字符串存入一個數(shù)組返回,作用于split()函數(shù)類似。
array preg_split(string $pattern ,string $subject[,int $limit[,int $length]])
本函數(shù)區(qū)分大小寫,返回一個數(shù)組,數(shù)組包含一個$subject中沿著與$pattern匹配的邊界所分割的子串。$limit是可選參數(shù),如果指定則最多返回$limit個字串,如果省略或為-1,則沒有限制。$flags的值可以是以下三種:
ⅠPREG_SPLIT_NO_EMPTY.如果設(shè)定本標記,則函數(shù)只返回非空的字符串。
ⅡPREG_SPLIT_DELIM_CAPTURE,如果設(shè)定本標記,定界符模式的括號表達式的匹配項也會被捕獲并返回。
ⅢPREG_SPLIT_OFFSET_CAPTURE.如果設(shè)定本標記,對每個出現(xiàn)的匹配結(jié)果也同時返回其附屬的字符串偏移量。
5.返回匹配的數(shù)組單元
使用preg_grep()函數(shù)可以根據(jù)條件查找指定的數(shù)組,并將符合條件的數(shù)組單元返回。
array preg_grep(string $pattern,array $input[,int $flags])
函數(shù)返回一個數(shù)組,數(shù)組包含$input數(shù)組中與$pattern相匹配的數(shù)組單元。$flags是可選參數(shù),值可以是PREG_GREP_INVERT,表示返回輸入數(shù)組中不匹配給定$pattern的單元。
preg_grep()函數(shù)返回的數(shù)組使用原來數(shù)組的鍵名進行索引。
以上是“PHP中支持幾種風(fēng)格的正則表達式語法”這篇文章的所有內(nèi)容,感謝各位的閱讀!相信大家都有了一定的了解,希望分享的內(nèi)容對大家有所幫助,如果還想學(xué)習(xí)更多知識,歡迎關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道!