這篇文章給大家分享的是有關(guān)常用php正則表達(dá)式有哪些的內(nèi)容。小編覺(jué)得挺實(shí)用的,因此分享給大家做個(gè)參考,一起跟隨小編過(guò)來(lái)看看吧。
成都創(chuàng)新互聯(lián)公司主營(yíng)淶源網(wǎng)站建設(shè)的網(wǎng)絡(luò)公司,主營(yíng)網(wǎng)站建設(shè)方案,成都App制作,淶源h5微信小程序搭建,淶源網(wǎng)站營(yíng)銷推廣歡迎淶源等地區(qū)企業(yè)咨詢
具體內(nèi)容請(qǐng)看下文吧
$str = preg_replace("/()(.*?)(<\/a>)/", '\1\2\3', $str);
其中用了三個(gè)子模式(每個(gè)圓括號(hào)中內(nèi)容為一個(gè)子模式),第一個(gè)是鏈接開(kāi)始標(biāo)簽,第二個(gè)是鏈接文本,第三個(gè)是
然后第二個(gè)參數(shù)中\(zhòng)1、\2、\3就表示這三個(gè)部分,要替換成什么樣子還不簡(jiǎn)單?
獲取頁(yè)面中的所有鏈接地址的PHP函數(shù)
下面這個(gè)用PHP寫(xiě)的函數(shù),可以獲取任意的字符串$string中的所有鏈接地址($string可以是從一個(gè)HTML頁(yè)面文件直接讀取出來(lái)的字符串),結(jié)果保存在一個(gè)數(shù)組中返回.該函數(shù)自動(dòng)把電子郵件地址排除在外,而且返回的數(shù)組中不會(huì)有重復(fù)元素.
function GetAllLink($string) { $string = str_replace("\r","",$string); $string = str_replace("\n","",$string); $regex[url] = "((http|https|ftp|telnet|news):\/\/)?([a-z0-9_\-\/\.]+\.[][a-z0-9:;@=_~%\?\/\.\,\+\-]+)"; $regex[email] = "([a-z0-9_\-]+)@([a-z0-9_\-]+\.[a-z0-9\-\._\-]+)"; //去掉標(biāo)簽之間的文字 $string = eregi_replace(">[^<>]+<","><", $string); //去掉JAVASCRIPT代碼 $string = eregi_replace("","", $string); //去掉非的HTML標(biāo)簽 $string = eregi_replace("<[^a][^<>]*>","", $string); //去掉EMAIL鏈接 $string = eregi_replace("]*>","", $string); //替換需要的網(wǎng)頁(yè)鏈接 $string = eregi_replace("]*>","\\3\t", $string); $output[0] = strtok($string, "\t"); while(($temp = strtok("\t"))) { if($temp && !in_array($temp, $output)) $output[++$i] = $temp; } return $output; }
以下是以PHP的語(yǔ)法所寫(xiě)的示例
驗(yàn)證字符串是否只含數(shù)字與英文,字符串長(zhǎng)度并在4~16個(gè)字符之間
簡(jiǎn)易的臺(tái)灣身分證字號(hào)驗(yàn)證
下面的代碼實(shí)現(xiàn)文字中的代碼塊,功能就如你在創(chuàng)新互聯(lián)看到的代碼一樣。
function codedisp($code) { global $discuzcodes; $discuzcodes['pcodecount']++; $code = htmlspecialchars(str_replace('\\"', '"', preg_replace("/^[\n\r]*(.+?)[\n\r]*$/is", "\\1", $code))); $discuzcodes['codehtml'][$discuzcodes['pcodecount']] = "代碼如下:".fhtml2($code)."
"; $discuzcodes['codecount']++; return "[\tDISCUZ_CODE_$discuzcodes[pcodecount]\t]"; } $message = preg_replace("/\s*\[code\](.+?)\[\/code\]\s*/ies", "codedisp('\\1')", $message); $message = preg_replace("/\s*\[html\](.+?)\[\/html\]\s*/ies", "htmldisp('\\1')", $message);
匹配中文字符的正則表達(dá)式: [\u4e00-\u9fa5]
評(píng)注:匹配中文還真是個(gè)頭疼的事,有了這個(gè)表達(dá)式就好辦了
匹配雙字節(jié)字符(包括漢字在內(nèi)):[^\x00-\xff]
評(píng)注:可以用來(lái)計(jì)算字符串的長(zhǎng)度(一個(gè)雙字節(jié)字符長(zhǎng)度計(jì)2,ASCII字符計(jì)1)
匹配空白行的正則表達(dá)式:\n\s*\r
評(píng)注:可以用來(lái)刪除空白行
匹配HTML標(biāo)記的正則表達(dá)式:<(\S*?)[^>]*>.*?\1>|<.*? />
評(píng)注:網(wǎng)上流傳的版本太糟糕,上面這個(gè)也僅僅能匹配部分,對(duì)于復(fù)雜的嵌套標(biāo)記依舊無(wú)能為力
匹配首尾空白字符的正則表達(dá)式:^\s*|\s*$
評(píng)注:可以用來(lái)刪除行首行尾的空白字符(包括空格、制表符、換頁(yè)符等等),非常有用的表達(dá)式
匹配Email地址的正則表達(dá)式:\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*
評(píng)注:表單驗(yàn)證時(shí)很實(shí)用
匹配網(wǎng)址URL的正則表達(dá)式:[a-zA-z]+://[^\s]*
評(píng)注:網(wǎng)上流傳的版本功能很有限,上面這個(gè)基本可以滿足需求
匹配帳號(hào)是否合法(字母開(kāi)頭,允許5-16字節(jié),允許字母數(shù)字下劃線):^[a-zA-Z][a-zA-Z0-9_]{4,15}$
評(píng)注:表單驗(yàn)證時(shí)很實(shí)用
匹配國(guó)內(nèi)電話號(hào)碼:\d{3}-\d{8}|\d{4}-\d{7}
評(píng)注:匹配形式如 0511-4405222 或 021-87888822
匹配騰訊QQ號(hào):[1-9][0-9]{4,}
評(píng)注:騰訊QQ號(hào)從10000開(kāi)始
匹配中國(guó)郵政編碼:[1-9]\d{5}(?!\d)
評(píng)注:中國(guó)郵政編碼為6位數(shù)字
匹配身份證:\d{15}|\d{18}
評(píng)注:中國(guó)的身份證為15位或18位
匹配ip地址:\d+\.\d+\.\d+\.\d+
評(píng)注:提取ip地址時(shí)有用
匹配特定數(shù)字:
^[1-9]\d*$ //匹配正整數(shù)
^-[1-9]\d*$ //匹配負(fù)整數(shù)
^-?[1-9]\d*$ //匹配整數(shù)
^[1-9]\d*|0$ //匹配非負(fù)整數(shù)(正整數(shù) + 0)
^-[1-9]\d*|0$ //匹配非正整數(shù)(負(fù)整數(shù) + 0)
^[1-9]\d*\.\d*|0\.\d*[1-9]\d*$ //匹配正浮點(diǎn)數(shù)
^-([1-9]\d*\.\d*|0\.\d*[1-9]\d*)$ //匹配負(fù)浮點(diǎn)數(shù)
^-?([1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0)$ //匹配浮點(diǎn)數(shù)
^[1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0$ //匹配非負(fù)浮點(diǎn)數(shù)(正浮點(diǎn)數(shù) + 0)
^(-([1-9]\d*\.\d*|0\.\d*[1-9]\d*))|0?\.0+|0$ //匹配非正浮點(diǎn)數(shù)(負(fù)浮點(diǎn)數(shù) + 0)
評(píng)注:處理大量數(shù)據(jù)時(shí)有用,具體應(yīng)用時(shí)注意修正
匹配特定字符串:
^[A-Za-z]+$ //匹配由26個(gè)英文字母組成的字符串
^[A-Z]+$ //匹配由26個(gè)英文字母的大寫(xiě)組成的字符串
^[a-z]+$ //匹配由26個(gè)英文字母的小寫(xiě)組成的字符串
^[A-Za-z0-9]+$ //匹配由數(shù)字和26個(gè)英文字母組成的字符串
^\w+$ //匹配由數(shù)字、26個(gè)英文字母或者下劃線組成的字符串
下面是一些特殊字符:
正則表達(dá)式中的特殊字符: (學(xué)習(xí)參考書(shū)-<<精通正則表達(dá)式>>)
字符
意義:對(duì)于字符,通常表示按字面意義,指出接著的字符為特殊字符,不作解釋。
例如:/b/匹配字符'b',通過(guò)在b 前面加一個(gè)反斜杠,也就是/b/,則該字符變成特殊字符,表示
匹配一個(gè)單詞的分界線。
或者:
對(duì)于幾個(gè)字符,通常說(shuō)明是特殊的,指出緊接著的字符不是特殊的,而應(yīng)該按字面解釋。
例如:*是一個(gè)特殊字符,匹配任意個(gè)字符(包括0個(gè)字符);例如:/a*/意味匹配0個(gè)或多個(gè)a。
為了匹配字面上的*,在a前面加一個(gè)反斜杠;例如:/a*/匹配'a*'。
字符^
意義:表示匹配的字符必須在最前邊。
例如:/^A/不匹配"an A,"中的'A',但匹配"An A."中最前面的'A'。
字符$
意義:與^類似,匹配最末的字符。
例如:/t$/不匹配"eater"中的't',但匹配"eat"中的't'。
字符*
意義:匹配*前面的字符0次或n次。
例如:/bo*/匹配"A ghost booooed"中的'boooo'或"A bird warbled"中的'b',但不匹配"A goat g
runted"中的任何字符。
字符+
意義:匹配+號(hào)前面的字符1次或n次。等價(jià)于{1,}。
例如:/a+/匹配"candy"中的'a'和"caaaaaaandy."中的所有'a'。
字符?
意義:匹配?前面的字符0次或1次。
例如:/e?le?/匹配"angel"中的'el'和"angle."中的'le'。
字符.
意義:(小數(shù)點(diǎn))匹配除換行符外的所有單個(gè)的字符。
例如:/.n/匹配"nay, an apple is on the tree"中的'an'和'on',但不匹配'nay'。
字符(x)
意義:匹配'x'并記錄匹配的值。
例如:/(foo)/匹配和記錄"foo bar."中的'foo'。匹配子串能被結(jié)果數(shù)組中的素[1], ..., [n] 返
回,或被RegExp對(duì)象的屬性$1, ..., $9返回。
字符x|y
意義:匹配'x'或者'y'。
例如:/green|red/匹配"green apple"中的'green'和"red apple."中的'red'。
字符{n}
意義:這里的n是一個(gè)正整數(shù)。匹配前面的n個(gè)字符。
例如:/a{2}/不匹配"candy,"中的'a',但匹配"caandy," 中的所有'a'和"caaandy."中前面的兩個(gè)
'a'。
字符{n,}
意義:這里的n是一個(gè)正整數(shù)。匹配至少n個(gè)前面的字符。
例如:/a{2,}不匹配"candy"中的'a',但匹配"caandy"中的所有'a'和"caaaaaaandy."中的所有'a'
字符{n,m}
意義:這里的n和m都是正整數(shù)。匹配至少n個(gè)最多m個(gè)前面的字符。
例如:/a{1,3}/不匹配"cndy"中的任何字符,但匹配 "candy,"中的'a',"caandy," 中的前面兩個(gè)
'a'和"caaaaaaandy"中前面的三個(gè)'a',注意:即使"caaaaaaandy" 中有很多個(gè)'a',但只匹配前面的三
個(gè)'a'即"aaa"。
字符[xyz]
意義:一字符列表,匹配列出中的任一字符。你可以通過(guò)連字符-指出一個(gè)字符范圍。
例如:[abcd]跟[a-c]一樣。它們匹配"brisket"中的'b'和"ache"中的'c'。
字符[^xyz]
意義:一字符補(bǔ)集,也就是說(shuō),它匹配除了列出的字符外的所有東西。 你可以使用連字符-指出一
字符范圍。
例如:[^abc]和[^a-c]等價(jià),它們最早匹配"brisket"中的'r'和"chop."中的'h'。
字符
意義:匹配一個(gè)空格(不要與b混淆)
字符b
意義:匹配一個(gè)單詞的分界線,比如一個(gè)空格(不要與混淆)
例如:/bnw/匹配"noonday"中的'no',/wyb/匹配"possibly yesterday."中的'ly'。
字符B
意義:匹配一個(gè)單詞的非分界線
例如:/wBn/匹配"noonday"中的'on',/yBw/匹配"possibly yesterday."中的'ye'。
字符cX
意義:這里的X是一個(gè)控制字符。匹配一個(gè)字符串的控制字符。
例如:/cM/匹配一個(gè)字符串中的control-M。
字符d
意義:匹配一個(gè)數(shù)字,等價(jià)于[0-9]。
例如:/d/或/[0-9]/匹配"B2 is the suite number."中的'2'。
字符D
意義:匹配任何的非數(shù)字,等價(jià)于[^0-9]。
例如:/D/或/[^0-9]/匹配"B2 is the suite number."中的'B'。
字符f
意義:匹配一個(gè)表單符
字符n
意義:匹配一個(gè)換行符
字符r
意義:匹配一個(gè)回車符
字符s
意義:匹配一個(gè)單個(gè)white空格符,包括空格,tab,form feed,換行符,等價(jià)于[ fnrtv]。
例如:/sw*/匹配"foo bar."中的' bar'。
字符S
意義:匹配除white空格符以外的一個(gè)單個(gè)的字符,等價(jià)于[^ fnrtv]。
例如:/S/w*匹配"foo bar."中的'foo'。
字符t
意義:匹配一個(gè)制表符
字符v
意義:匹配一個(gè)頂頭制表符
字符w
意義:匹配所有的數(shù)字和字母以及下劃線,等價(jià)于[A-Za-z0-9_]。
例如:/w/匹配"apple,"中的'a',"$5.28,"中的'5'和"3D."中的'3'。
字符W
意義:匹配除數(shù)字、字母外及下劃線外的其它字符,等價(jià)于[^A-Za-z0-9_]。
例如:/W/或者/[^$A-Za-z0-9_]/匹配"50%."中的'%'。
字符n
意義:這里的n是一個(gè)正整數(shù)。匹配一個(gè)正則表達(dá)式的最后一個(gè)子串的n的值(計(jì)數(shù)左圓括號(hào))。
例如:/apple(,)sorange1/匹配"apple, orange, cherry, peach."中的'apple, orange',下面
有一個(gè)更加完整的例子。
注意:如果左圓括號(hào)中的數(shù)字比n指定的數(shù)字還小,則n取下一行的八進(jìn)制escape作為描述。
字符ooctal和xhex
意義:這里的ooctal是一個(gè)八進(jìn)制的escape值,而xhex是一個(gè)十六進(jìn)制的escape值,允許在一個(gè)正則表達(dá)式中嵌入ASCII碼。
通用模式
定界符,通常使用 "/"做為定界符開(kāi)始和結(jié)束,也可以使用"#"。
什么時(shí)候使用"#"呢?一般是在你的字符串中有很多"/"字符的時(shí)候,因?yàn)檎齽t的時(shí)候這種字符需要轉(zhuǎn)義,比如uri。
使用"/"定界符的代碼如下.
preg_match中的$matches[0]將包含與整個(gè)模式匹配的字符串。
使用"#"定界符的代碼如下.這個(gè)時(shí)候?qū)?/"就不轉(zhuǎn)義!
$regex = '#^http://([w.]+)/([w]+)/([w]+).html$#i'; $str = 'http://www.youku.com/show_page/id_ABCDEFG.html'; $matches = array(); if(preg_match($regex, $str, $matches)){ var_dump($matches); } echo "n";修飾符:用于改變正則表達(dá)式的行為。
我們看到的('/^http://([w.]+)/([w]+)/([w]+).html/i')中的最后一個(gè)"i"就是修飾符,表示忽略大小寫(xiě),還有一個(gè)我們經(jīng)常用到的是"x"表示忽略空格。
貢獻(xiàn)代碼:
$regex = '/HELLO/'; $str = 'hello word'; $matches = array(); if(preg_match($regex, $str, $matches)){ echo 'No i:Valid Successful!',"n"; } if(preg_match($regex.'i', $str, $matches)){ echo 'YES i:Valid Successful!',"n"; }字符域:[w]用方括號(hào)擴(kuò)起來(lái)的部分就是字符域。
限定符:如[w]{3,5}或者[w]*或者[w]+這些[w]后面的符號(hào)都表示限定符?,F(xiàn)介紹具體意義。
{3,5}表示3到5個(gè)字符。{3,}超過(guò)3個(gè)字符,{,5}最多5個(gè),{3}三個(gè)字符。
* 表示0到多個(gè)
+ 表示1到多個(gè)。
脫字符號(hào)
^:
> 放在字符域(如:[^w])中表示否定(不包括的意思)——“反向選擇”
> 放在表達(dá)式之前,表示以當(dāng)前這個(gè)字符開(kāi)始。(/^n/i,表示以n開(kāi)頭)。
注意,我們經(jīng)常管""叫"跳脫字符"。用于轉(zhuǎn)義一些特殊符號(hào),如".","/"
界符:正則表達(dá)式的形式一般如下:
/love/
其中位于“/”定界符之間的部分就是將要在目標(biāo)對(duì)象中進(jìn)行匹配的模式。
元字符:就是指那些在正則表達(dá)式中具有特殊意義的專用字符,可以用來(lái)規(guī)定其前導(dǎo)字符(即位于元字符前面的字符)在目標(biāo)對(duì)象中的出現(xiàn)模式。
較為常用的元字符包括: “+”, “*”,以及 “?”。
“+”元字符規(guī)定其前導(dǎo)字符必須在目標(biāo)對(duì)象中連續(xù)出現(xiàn)一次或多次
“*”元字符規(guī)定其前導(dǎo)字符必須在目標(biāo)對(duì)象中出現(xiàn)零次或連續(xù)多次,
“?”元字符規(guī)定其前導(dǎo)字符必須在目標(biāo)對(duì)象中連續(xù)出現(xiàn)零次或一次。
下面,就讓我們來(lái)看一下正則表達(dá)式元字符的具體應(yīng)用。
/fo+/
因?yàn)樯鲜稣齽t表達(dá)式中包含“+”元字符(它前面的“o”是前導(dǎo)字符),表示可以與目標(biāo)對(duì)象中的“fool”, “fo”等在字母f后面連續(xù)出現(xiàn)一個(gè)或多個(gè)字母o的字符串相匹配。
除了元字符之外,用戶還可以精確指定模式在匹配對(duì)象中出現(xiàn)的頻率。例如,
/jim{2,6}/
上述正則表達(dá)式規(guī)定字符m可以在匹配對(duì)象中連續(xù)出現(xiàn)2-6次,因此,上述正則表達(dá)式可以同jimmy或jimmmmmy等字符串相匹配。
其它幾個(gè)重要的元字符的使用方式。
s:用于匹配單個(gè)空格符,包括tab鍵和換行符;
S:用于匹配除單個(gè)空格符之外的所有字符;
d:用于匹配從0到9的數(shù)字;
w:用于匹配字母,數(shù)字或下劃線字符;
W:用于匹配所有與w不匹配的字符;
. :用于匹配除換行符之外的所有字符。
(說(shuō)明:我們可以把s和S以及w和W看作互為逆運(yùn)算)
下面,我們就通過(guò)實(shí)例看一下如何在正則表達(dá)式中使用上述元字符。
/s+/
上述正則表達(dá)式可以用于匹配目標(biāo)對(duì)象中的一個(gè)或多個(gè)空格字符。
除了我們以上所介紹的元字符之外,正則表達(dá)式中還具有另外一種較為獨(dú)特的專用字符,即定位符。
定位符:用于規(guī)定匹配模式在目標(biāo)對(duì)象中的出現(xiàn)位置。
較為常用的定位符包括: “^”, “$”, “b” 以及 “B”。
“^”定位符規(guī)定匹配模式必須出現(xiàn)在目標(biāo)字符串的開(kāi)頭
“$”定位符規(guī)定匹配模式必須出現(xiàn)在目標(biāo)對(duì)象的結(jié)尾
b定位符規(guī)定匹配模式必須出現(xiàn)在目標(biāo)字符串的開(kāi)頭或結(jié)尾的兩個(gè)邊界之一
“B”定位符則規(guī)定匹配對(duì)象必須位于目標(biāo)字符串的開(kāi)頭和結(jié)尾兩個(gè)邊界之內(nèi),即匹配對(duì)象既不能作為目標(biāo)字符串的開(kāi)頭,也不能作為目標(biāo)字符串的結(jié)尾。同樣,我們
也可以把“^”和“$”以及“b”和“B”看作是互為逆運(yùn)算的兩組定位符。舉例來(lái)說(shuō):
/^hell/
因?yàn)樯鲜稣齽t表達(dá)式中包含“^”定位符,所以可以與目標(biāo)對(duì)象中以 “hell”, “hello”或 “hellhound”開(kāi)頭的字符串相匹配。
/ar$/
因?yàn)樯鲜稣齽t表達(dá)式中包含“$”定位符,所以可以與目標(biāo)對(duì)象中以 “car”, “bar”或 “ar” 結(jié)尾的字符串相匹配。
/bbom/
因?yàn)樯鲜稣齽t表達(dá)式模式以“b”定位符開(kāi)頭,所以可以與目標(biāo)對(duì)象中以 “bomb”, 或 “bom”開(kāi)頭的字符串相匹配。
/manb/
因?yàn)樯鲜稣齽t表達(dá)式模式以“b”定位符結(jié)尾,所以可以與目標(biāo)對(duì)象中以 “human”, “woman”或 “man”結(jié)尾的字符串相匹配。
為了能夠方便用戶更加靈活的設(shè)定匹配模式,正則表達(dá)式允許使用者在匹配模式中指定某一個(gè)范圍而不局限于具體的字符。例如:
/[A-Z]/
上述正則表達(dá)式將會(huì)與從A到Z范圍內(nèi)任何一個(gè)大寫(xiě)字母相匹配。
/[a-z]/
上述正則表達(dá)式將會(huì)與從a到z范圍內(nèi)任何一個(gè)小寫(xiě)字母相匹配。
/[0-9]/
上述正則表達(dá)式將會(huì)與從0到9范圍內(nèi)任何一個(gè)數(shù)字相匹配。
/([a-z][A-Z][0-9])+/
上述正則表達(dá)式將會(huì)與任何由字母和數(shù)字組成的字符串,如 “aB0” 等相匹配。這里需要提醒用戶注意的一點(diǎn)就是可以在正則表達(dá)式中使用 “()” 把字符串組合在一起。
“()”符號(hào):包含的內(nèi)容必須同時(shí)出現(xiàn)在目標(biāo)對(duì)象中。因此,上述正則表達(dá)式將無(wú)法與諸如 “abc”等的字符串匹配,因?yàn)椤癮bc”中的最后一個(gè)字符為字母而非數(shù)字。
如果我們希望在正則表達(dá)式中實(shí)現(xiàn)類似編程邏輯中的“或”運(yùn)算,在多個(gè)不同的模式中任選一個(gè)進(jìn)行匹配的話,可以使用管道符: “|”。例如:
/to|too|2/
上述正則表達(dá)式將會(huì)與目標(biāo)對(duì)象中的 “to”, “too”, 或 “2” 相匹配。
否定符:“[^]”。與我們前文所介紹的定位符 “^” 不同,否定符 “[^]”規(guī)定目標(biāo)對(duì)象中不能存在模式中所規(guī)定的字符串。例如:
/[^A-C]/
上述字符串將會(huì)與目標(biāo)對(duì)象中除A,B,和C之外的任何字符相匹配。一般來(lái)說(shuō),當(dāng)“^”出現(xiàn)在 “[]”內(nèi)時(shí)就被視做否定運(yùn)算符;而當(dāng)“^”位于“[]”之外,或沒(méi)有“[]”時(shí),則應(yīng)當(dāng)被視做定位符。
最后,當(dāng)用戶需要在正則表達(dá)式的模式中加入元字符,并查找其匹配對(duì)象時(shí),可以使用
轉(zhuǎn)義符:“”。例如:
/Th*/
上述正則表達(dá)式將會(huì)與目標(biāo)對(duì)象中的“Th*”而非“The”等相匹配。
實(shí)際經(jīng)驗(yàn)介紹
還是得說(shuō)說(shuō) ^ 和 $ 他們是分別用來(lái)匹配字符串的開(kāi)始和結(jié)束,以下分別舉例說(shuō)明:
“^The”:開(kāi)頭一定要有”The”字符串;
“of despair$”:結(jié)尾一定要有”of despair” 的字符串;
那么,
“^abc$”:就是要求以abc開(kāi)頭和以abc結(jié)尾的字符串,實(shí)際上是只有abc匹配;
“notice”:匹配包含notice的字符串;
你可以看見(jiàn)如果你沒(méi)有用我們提到的兩個(gè)字符(最后一個(gè)例子),就是說(shuō)模式(正則表達(dá)式)可以出現(xiàn)在被檢驗(yàn)字符串的任何地方,你沒(méi)有把他鎖定到兩邊。
接著,說(shuō)說(shuō) ‘*' ‘+' 和 ‘?'
他們用來(lái)表示一個(gè)字符可以出現(xiàn)的次數(shù)或者順序,他們分別表示:
“zero or more”相當(dāng)于{0,}
“one or more”相當(dāng)于{1,}
“zero or one.”相當(dāng)于{0,1}
這里是一些例子:
“ab*”:和ab{0,}同義,匹配以a開(kāi)頭,后面可以接0個(gè)或者N個(gè)b組成的字符串(”a”, “ab”, “abbb”, 等);
“ab+”:和ab{1,}同義,同上條一樣,但最少要有一個(gè)b存在 (”ab” “abbb”等);
“ab?”:和ab{0,1}同義,可以沒(méi)有或者只有一個(gè)b;
“a?b+$”:匹配以一個(gè)或者0個(gè)a再加上一個(gè)以上的b結(jié)尾的字符串。
要點(diǎn):'*' ‘+' 和 ‘?' 只管它前面那個(gè)字符。
你也可以在大括號(hào)里面限制字符出現(xiàn)的個(gè)數(shù),比如:
“ab{2}”: 要求a后面一定要跟兩個(gè)b(一個(gè)也不能少)(”abb”);
“ab{2,}”: 要求a后面一定要有兩個(gè)或者兩個(gè)以上b(如”abb” “abbbb” 等);
“ab{3,5}”: 要求a后面可以有2-5個(gè)b(”abbb”, “abbbb”, or “abbbbb”)。
現(xiàn)在我們把一定幾個(gè)字符放到小括號(hào)里,比如:
“a(bc)*”: 匹配 a 后面跟0個(gè)或者一個(gè)”bc”;
“a(bc){1,5}”: 一個(gè)到5個(gè) “bc”;
還有一個(gè)字符 ‘|',相當(dāng)于OR操作:
“hi|hello”: 匹配含有”hi” 或者 “hello” 的 字符串;
“(b|cd)ef”: 匹配含有 “bef” 或者 “cdef”的字符串;
“(a|b)*c”: 匹配含有這樣多個(gè)(包括0個(gè))a或b,后面跟一個(gè)c的字符串;
一個(gè)點(diǎn)('.')可以代表所有的單一字符,不包括” ”
如果,要匹配包括” ”在內(nèi)的所有單個(gè)字符,怎么辦?
用'[ .]'這種模式。
“a.[0-9]”: 一個(gè)a加一個(gè)字符再加一個(gè)0到9的數(shù)字;
“^.{3}$”: 三個(gè)任意字符結(jié)尾。
中括號(hào)括住的內(nèi)容只匹配一個(gè)單一的字符
“[ab]”: 匹配單個(gè)的 a 或者 b ( 和 “a│b” 一樣);
“[a-d]”: 匹配'a' 到'd'的單個(gè)字符 (和”a│b│c│d” 還有 “[abcd]”效果一樣);
一般我們都用[a-zA-Z]來(lái)指定字符為一個(gè)大小寫(xiě)英文:
“^[a-zA-Z]”: 匹配以大小寫(xiě)字母開(kāi)頭的字符串;
“[0-9]%”: 匹配含有 形如 x% 的字符串;
“,[a-zA-Z0-9]$”: 匹配以逗號(hào)再加一個(gè)數(shù)字或字母結(jié)尾的字符串;
你也可以把你不想要得字符列在中括號(hào)里,你只需要在總括號(hào)里面使用'^' 作為開(kāi)頭 “%[^a-zA-Z]%” 匹配含有兩個(gè)百分號(hào)里面有一個(gè)非字母的字符串。
要點(diǎn):^用在中括號(hào)開(kāi)頭的時(shí)候,就表示排除括號(hào)里的字符。
為了PHP能夠解釋,你必須在這些字符面前后加”,并且將一些字符轉(zhuǎn)義。
不要忘記在中括號(hào)里面的字符是這條規(guī)路的例外—在中括號(hào)里面,所有的特殊字符,包括(”),都將失去他們的特殊性質(zhì) “[*+?{}.]”匹配含有這些字符的字符串:
還有,正如regx的手冊(cè)告訴我們:”如果列表里含有']',最好把它作為列表里的第一個(gè)字符(可能跟在'^'后面)。如果含有'-',最好把它放在最前面或者最后面
, or 或者一個(gè)范圍的第二個(gè)結(jié)束點(diǎn)[a-d-0-9]中間的‘-'將有效。
看了上面的例子,你對(duì){n,m}應(yīng)該理解了吧。要注意的是,n和m都不能為負(fù)整數(shù),而且n總是小于m。這樣,才能 最少匹配n次且最多匹配m次。如”p{1,5}”將匹配
“pvpppppp”中的前五個(gè)p
下面說(shuō)說(shuō)以開(kāi)頭的
b 書(shū)上說(shuō)他是用來(lái)匹配一個(gè)單詞邊界,就是…比如'veb',可以匹配love里的ve而不匹配very里有ve
B 正好和上面的b相反。
正則表達(dá)式的其他用法
提取字符串
ereg() and eregi() 有一個(gè)特性是允許用戶通過(guò)正則表達(dá)式去提取字符串的一部分(具體用法你可以閱讀手冊(cè))。比如說(shuō),我們想從 path/URL 提取文件名,下面的代
碼就是你需要:
ereg(”([^\/]*)$”, $pathOrUrl, $regs);
echo $regs[1];
高級(jí)的代換
ereg_replace() 和 eregi_replace()也是非常有用的,假如我們想把所有的間隔負(fù)號(hào)都替換成逗號(hào):
ereg_replace(”[ t]+”, “,”, trim($str));以下為引用的內(nèi)容:
preg_match()和preg_match_all()
preg_quote()
preg_split()
preg_grep()
preg_replace()函數(shù)的具體使用,我們可以通過(guò)PHP手冊(cè)來(lái)找到,下面分享一些平時(shí)積累的正則表達(dá)式:
匹配action屬性以下為引用的內(nèi)容:
$str = '';
$match = '';
preg_match_all('/s+action="(?!http:)(.*?)"s/', $str, $match);
print_r($match);在正則中使用回調(diào)函數(shù)
以下為引用的內(nèi)容:
/** * replace some string by callback function * */ function callback_replace() { $url = 'http://esfang.house.sina.com.cn'; $str = ''; $str = preg_replace ( '/(?<=saction=")(?!http:)(.*?)(?="s)/e', 'search($url, \1)', $str ); echo $str; } function search($url, $match){ return $url . '/' . $match; }帶斷言的正則匹配
$match = ''; $str = 'xxxxxx.com.cn bold font paragraph text '; preg_match_all ( '/(?<=<(w{1})>).*(?=1>)/', $str, $match );echo "匹配沒(méi)有屬性的HTML標(biāo)簽中的內(nèi)容:";
print_r ( $match );
替換HTML源碼中的地址
以下為引用的內(nèi)容:
$form_html = preg_replace ( '/(?<=saction="|ssrc="|shref=")(?!http:|javascript)(.*?)(?="s)/e', 'add_url($url, '\1')', $form_html );
元字符在上面的例子中,^ 、d 及 $ 等這些符號(hào),代表了特定的匹配意義,我們稱之為元字符,常用的元字符如下:
元字符 說(shuō)明
. 匹配除換行符意外的任意字符
w 匹配字母或數(shù)字或下劃線
s 匹配任意的空白符
d 匹配數(shù)字
b 匹配單詞的開(kāi)始或結(jié)束
^ 匹配字符串的開(kāi)始
$ 匹配字符串的結(jié)束
[x] 匹配x字符,如匹配字符串中的 a、b 和 c 字符
W w的反義,即匹配任意非字母,數(shù)字,下劃線和漢字的字符
S s的反義,即匹配任意非空白符的字符
D d的反義,即匹配任意非數(shù)字的字符
B b的反義,即不是單詞開(kāi)頭或結(jié)束的位置
[^x] 匹配除了 x 意外的任意字符,如 [^abc] 匹配除了 abc 這幾個(gè)字母之外的任意字符感謝各位的閱讀!關(guān)于“常用php正則表達(dá)式有哪些”這篇文章就分享到這里了,希望以上內(nèi)容可以對(duì)大家有一定的幫助,讓大家可以學(xué)到更多知識(shí),如果覺(jué)得文章不錯(cuò),可以把它分享出去讓更多的人看到吧!
分享標(biāo)題:常用php正則表達(dá)式有哪些
新聞來(lái)源:http://weahome.cn/article/gdiooo.html