這篇文章主要介紹“Python3常用正則表達(dá)式有哪些”,在日常操作中,相信很多人在Python3常用正則表達(dá)式有哪些問題上存在疑惑,小編查閱了各式資料,整理出簡(jiǎn)單好用的操作方法,希望對(duì)大家解答”Python3常用正則表達(dá)式有哪些”的疑惑有所幫助!接下來,請(qǐng)跟著小編一起來學(xué)習(xí)吧!
讓客戶滿意是我們工作的目標(biāo),不斷超越客戶的期望值來自于我們對(duì)這個(gè)行業(yè)的熱愛。我們立志把好的技術(shù)通過有效、簡(jiǎn)單的方式提供給客戶,將通過不懈努力成為客戶在信息化領(lǐng)域值得信任、有價(jià)值的長期合作伙伴,公司提供的服務(wù)項(xiàng)目有:域名申請(qǐng)、雅安服務(wù)器托管、營銷軟件、網(wǎng)站建設(shè)、涇川網(wǎng)站維護(hù)、網(wǎng)站推廣。
正則表達(dá)式速查表
字符 | 描述 |
---|---|
\ | 將下一個(gè)字符標(biāo)記為一個(gè)特殊字符、或一個(gè)原義字符、或一個(gè)向后引用、或一個(gè)八進(jìn)制轉(zhuǎn)義符。例如,“n“匹配字符”n“?!盶n“匹配一個(gè)換行符。串行”\\“匹配”\“而”\(“則匹配”(“。 |
^ | 匹配輸入字符串的開始位置。如果設(shè)置了RegExp對(duì)象的Multiline屬性,^也匹配“\n“或”\r“之后的位置。 |
$ | 匹配輸入字符串的結(jié)束位置。如果設(shè)置了RegExp對(duì)象的Multiline屬性,$也匹配“\n“或”\r“之前的位置。 |
* | 匹配前面的子表達(dá)式零次或多次。例如,zo*能匹配“z“以及”zoo“。*等價(jià)于{0,}。 |
+ | 匹配前面的子表達(dá)式一次或多次。例如,“zo+“能匹配”zo“以及”zoo“,但不能匹配”z“。+等價(jià)于{1,}。 |
? | 匹配前面的子表達(dá)式零次或一次。例如,“do(es)?“可以匹配”does“或”does“中的”do“。?等價(jià)于{0,1}。 |
{n} | n是一個(gè)非負(fù)整數(shù)。匹配確定的n次。例如,“o{2}“不能匹配”Bob“中的”o“,但是能匹配”food“中的兩個(gè)o。 |
{n,} | n是一個(gè)非負(fù)整數(shù)。至少匹配n次。例如,“o{2,}“不能匹配”Bob“中的”o“,但能匹配”foooood“中的所有o?!眔{1,}“等價(jià)于”o+“?!眔{0,}“則等價(jià)于”o*“。 |
{n,m} | m和n均為非負(fù)整數(shù),其中n<=m。最少匹配n次且最多匹配m次。例如,“o{1,3}“將匹配”fooooood“中的前三個(gè)o。”o{0,1}“等價(jià)于”o?“。請(qǐng)注意在逗號(hào)和兩個(gè)數(shù)之間不能有空格。 |
? | 當(dāng)該字符緊跟在任何一個(gè)其他限制符(*,+,?,{n},{n,},{n,m})后面時(shí),匹配模式是非貪婪的。非貪婪模式盡可能少的匹配所搜索的字符串,而默認(rèn)的貪婪模式則盡可能多的匹配所搜索的字符串。例如,對(duì)于字符串“oooo“,”o+?“將匹配單個(gè)”o“,而”o+“將匹配所有”o“。 |
. | 匹配除“\n“之外的任何單個(gè)字符。要匹配包括”\n“在內(nèi)的任何字符,請(qǐng)使用像”(.|\n)“的模式。 |
(pattern) | 匹配pattern并獲取這一匹配。所獲取的匹配可以從產(chǎn)生的Matches集合得到,在VBScript中使用SubMatches集合,在JScript中則使用0…0…9屬性。要匹配圓括號(hào)字符,請(qǐng)使用“\(“或”\)“。 |
(?:pattern) | 匹配pattern但不獲取匹配結(jié)果,也就是說這是一個(gè)非獲取匹配,不進(jìn)行存儲(chǔ)供以后使用。這在使用或字符“(|)“來組合一個(gè)模式的各個(gè)部分是很有用。例如”industr(?:y|ies)“就是一個(gè)比”industry|industries“更簡(jiǎn)略的表達(dá)式。 |
(?=pattern) | 正向肯定預(yù)查,在任何匹配pattern的字符串開始處匹配查找字符串。這是一個(gè)非獲取匹配,也就是說,該匹配不需要獲取供以后使用。例如,“Windows(?=95|98|NT|2000)“能匹配”Windows2000“中的”Windows“,但不能匹配”Windows3.1“中的”Windows“。預(yù)查不消耗字符,也就是說,在一個(gè)匹配發(fā)生后,在最后一次匹配之后立即開始下一次匹配的搜索,而不是從包含預(yù)查的字符之后開始。 |
(?!pattern) | 正向否定預(yù)查,在任何不匹配pattern的字符串開始處匹配查找字符串。這是一個(gè)非獲取匹配,也就是說,該匹配不需要獲取供以后使用。例如“Windows(?!95|98|NT|2000)“能匹配”Windows3.1“中的”Windows“,但不能匹配”Windows2000“中的”Windows“。預(yù)查不消耗字符,也就是說,在一個(gè)匹配發(fā)生后,在最后一次匹配之后立即開始下一次匹配的搜索,而不是從包含預(yù)查的字符之后開始 |
(?<=pattern) | 反向肯定預(yù)查,與正向肯定預(yù)查類擬,只是方向相反。例如,“(?<=95|98|NT|2000)Windows“能匹配”2000Windows“中的”Windows“,但不能匹配”3.1Windows“中的”Windows“。 |
(? | 反向否定預(yù)查,與正向否定預(yù)查類擬,只是方向相反。例如“(? |
x|y | 匹配x或y。例如,“z|food“能匹配”z“或”food“?!?z|f)ood“則匹配”zood“或”food“。 |
[xyz] | 字符集合。匹配所包含的任意一個(gè)字符。例如,“[abc]“可以匹配”plain“中的”a“。 |
[^xyz] | 負(fù)值字符集合。匹配未包含的任意字符。例如,“[^abc]“可以匹配”plain“中的”p“。 |
[a-z] | 字符范圍。匹配指定范圍內(nèi)的任意字符。例如,“[a-z]“可以匹配”a“到”z“范圍內(nèi)的任意小寫字母字符。 |
[^a-z] | 負(fù)值字符范圍。匹配任何不在指定范圍內(nèi)的任意字符。例如,“[^a-z]“可以匹配任何不在”a“到”z“范圍內(nèi)的任意字符。 |
\b | 匹配一個(gè)單詞邊界,也就是指單詞和空格間的位置。例如,“er\b“可以匹配”never“中的”er“,但不能匹配”verb“中的”er“。 |
\B | 匹配非單詞邊界。“er\B“能匹配”verb“中的”er“,但不能匹配”never“中的”er“。 |
\cx | 匹配由x指明的控制字符。例如,\cM匹配一個(gè)Control-M或回車符。x的值必須為A-Z或a-z之一。否則,將c視為一個(gè)原義的“c“字符。 |
\d | 匹配一個(gè)數(shù)字字符。等價(jià)于[0-9]。 |
\D | 匹配一個(gè)非數(shù)字字符。等價(jià)于[^0-9]。 |
\f | 匹配一個(gè)換頁符。等價(jià)于\x0c和\cL。 |
\n | 匹配一個(gè)換行符。等價(jià)于\x0a和\cJ。 |
\r | 匹配一個(gè)回車符。等價(jià)于\x0d和\cM。 |
\s | 匹配任何空白字符,包括空格、制表符、換頁符等等。等價(jià)于[ \f\n\r \v]。 |
\S | 匹配任何非空白字符。等價(jià)于[^ \f\n\r\t\v]。 |
\t | 匹配一個(gè)制表符。等價(jià)于\x09和\cI。 |
\v | 匹配一個(gè)垂直制表符。等價(jià)于\x0b和\cK。 |
\w | 匹配包括下劃線的任何單詞字符。等價(jià)于“[A-Za-z0-9_]“。 |
\W | 匹配任何非單詞字符。等價(jià)于“[^A-Za-z0-9_]“。 |
\xn | 匹配n,其中n為十六進(jìn)制轉(zhuǎn)義值。十六進(jìn)制轉(zhuǎn)義值必須為確定的兩個(gè)數(shù)字長。例如,“\x41“匹配”A“?!盶x041“則等價(jià)于”\x04&1“。正則表達(dá)式中可以使用ASCII編碼。. |
\num | 匹配num,其中num是一個(gè)正整數(shù)。對(duì)所獲取的匹配的引用。例如,“(.)\1“匹配兩個(gè)連續(xù)的相同字符。 |
\n | 標(biāo)識(shí)一個(gè)八進(jìn)制轉(zhuǎn)義值或一個(gè)向后引用。如果\n之前至少n個(gè)獲取的子表達(dá)式,則n為向后引用。否則,如果n為八進(jìn)制數(shù)字(0-7),則n為一個(gè)八進(jìn)制轉(zhuǎn)義值。 |
\nm | 標(biāo)識(shí)一個(gè)八進(jìn)制轉(zhuǎn)義值或一個(gè)向后引用。如果\nm之前至少有nm個(gè)獲得子表達(dá)式,則nm為向后引用。如果\nm之前至少有n個(gè)獲取,則n為一個(gè)后跟文字m的向后引用。如果前面的條件都不滿足,若n和m均為八進(jìn)制數(shù)字(0-7),則\nm將匹配八進(jìn)制轉(zhuǎn)義值nm。 |
\nml | 如果n為八進(jìn)制數(shù)字(0-3),且m和l均為八進(jìn)制數(shù)字(0-7),則匹配八進(jìn)制轉(zhuǎn)義值nml。 |
\un | 匹配n,其中n是一個(gè)用四個(gè)十六進(jìn)制數(shù)字表示的Unicode字符。例如,\u00A9匹配版權(quán)符號(hào)(?)。 |
常用函數(shù):
input="入門小站" #P分組命名 reg=re.compile(r'(?P 入門)') res=reg.match(input) if res: print(res.groupdict()) print(res.groups()) print(res.groups())
{'name': '入門'} ('入門',) ('入門',)
# 掃描整個(gè) 字符串 找到匹配樣式的第一個(gè)位置,并返回一個(gè)相應(yīng)的 匹配對(duì)象。如果沒有匹配,就返回一個(gè) None input=''' 入門小站 入門 入門教程 ''' reg=re.compile(r'入門(?:小站|教程)',re.S) res=reg.search(input) if res: print(res.group())
入門小站
input=''' 入門小站 入門 入門教程 ''' # re.M多行模式匹配 reg=re.compile(r'^入門(?:小站|教程)$',re.M) res=reg.findall(input) if res: print(res)
['入門小站', '入門教程']
# split(pattern, string, maxsplit=0, flags=0) # maxsplit 最大的分割次數(shù) input=''' 入門 123 小站 dd 入門 ''' reg=re.compile(r'[a-z0-9]+') res=reg.split(input) print(res) reg=re.compile(r'[a-z0-9]+') res=reg.split(input,1) print(res)
['\n入門\n', '\n小站\n', '\n入門\n'] ['\n入門\n', '\n小站\ndd\n入門\n']
# 語法 sub(pattern, repl, string, count=0, flags=0) # repl 被替換成的字符串 # count指定替換的次數(shù) input=''' 入門 123 小站 456 dd 入門 ''' reg=re.compile(r'([a-z0-9]{1,})',re.M) res=reg.sub('11',input) print(res) # 替換1次 reg=re.compile(r'([a-z0-9]{1,})',re.M) res=reg.sub('11',input,1) print(res)
入門 11 小站 11 11 入門
入門 11 小站 456 dd 入門
# 語法 subn(pattern, repl, string, count=0, flags=0) # repl 被替換成的字符串 # count指定替換的次數(shù) # 返回結(jié)果中包含替換的次數(shù) input=''' 入門 123 小站 456 dd 入門 ''' reg=re.compile(r'([a-z0-9]{1,})',re.M) res=reg.subn('11',input) print(res)
('\n入門\n11\n小站\n11\n11\n入門\n', 3)
到此,關(guān)于“Python3常用正則表達(dá)式有哪些”的學(xué)習(xí)就結(jié)束了,希望能夠解決大家的疑惑。理論與實(shí)踐的搭配能更好的幫助大家學(xué)習(xí),快去試試吧!若想繼續(xù)學(xué)習(xí)更多相關(guān)知識(shí),請(qǐng)繼續(xù)關(guān)注創(chuàng)新互聯(lián)網(wǎng)站,小編會(huì)繼續(xù)努力為大家?guī)砀鄬?shí)用的文章!