Python的正則規(guī)則舉例分析-創(chuàng)新互聯(lián)

這篇文章主要講解了“Python的正則規(guī)則舉例分析”，文中的講解內(nèi)容簡(jiǎn)單清晰，易于學(xué)習(xí)與理解，下面請(qǐng)大家跟著小編的思路慢慢深入，一起來研究和學(xué)習(xí)“Python的正則規(guī)則舉例分析”吧！

創(chuàng)新互聯(lián)公司，是成都地區(qū)的互聯(lián)網(wǎng)解決方案提供商，用心服務(wù)為企業(yè)提供網(wǎng)站建設(shè)、重慶APP軟件開發(fā)、重慶小程序開發(fā)公司、系統(tǒng)按需定制網(wǎng)站和微信代運(yùn)營(yíng)服務(wù)。經(jīng)過數(shù)10余年的沉淀與積累，沉淀的是技術(shù)和服務(wù)，讓客戶少走彎路，踏實(shí)做事，誠(chéng)實(shí)做人，用情服務(wù)，致力做一個(gè)負(fù)責(zé)任、受尊敬的企業(yè)。對(duì)客戶負(fù)責(zé)，就是對(duì)自己負(fù)責(zé)，對(duì)企業(yè)負(fù)責(zé)。

問題復(fù)現(xiàn)

我們都知道，Python有個(gè)正則規(guī)則\w，幾乎所有的網(wǎng)上博客文章都告訴你，這個(gè)規(guī)則匹配字母數(shù)字及下劃線，但實(shí)際并不是這樣：

有Python2代碼如下：

~|? pythonPython 2.7.10 (default, Aug 17 2018, 19:45:58)
[GCC 4.2.1 Compatible Apple LLVM 10.0.0 (clang-1000.0.42)] on darwinType "help", "copyright", "credits" or "license" for more information.>>> import re>>> aa = '捕蛇者說'>>> re.match('\w{1,20}', aa)>>> bb = 'abc123ADB'>>> re.match('\w{1,20}', bb)
<_sre.SRE_Match object at 0x1031b0b28>

我們可以看到，在python2中，\w是無法匹配中文的。那么，同樣的代碼在Python3中運(yùn)行結(jié)果是什么樣子的了？

~|? python3Python 3.7.1 (default, Nov 28 2018, 11:55:14)
[Clang 9.0.0 (clang-900.0.39.2)] on darwinType "help", "copyright", "credits" or "license" for more information.>>> import re>>> aa = '捕蛇者說'>>> re.match('\w{1,20}', aa)
>>> bb = 'abc123ADB'>>> re.match('\w{1,20}', bb)

但在Python3中\(zhòng)w是可以匹配中文的，這是怎么回事了？要回答這個(gè)問題，我們要回到Python官方文檔中來尋找答案。

解決問題

當(dāng)我們仔細(xì)閱讀Python的官方文檔時(shí)，就會(huì)發(fā)現(xiàn)，對(duì)于同樣的正則規(guī)則\w，Python2和Python3區(qū)別好大，我們先來看看Python2：

When the LOCALE and UNICODE flags are not specified, matches any alphanumeric character and the underscore; this is equivalent to the set [a-zA-Z0-9_]. With LOCALE, it will match the set [0-9_] plus whatever characters are defined as alphanumeric for the current locale. If UNICODE is set, this will match the characters [0-9_] plus whatever is classified as alphanumeric in the Unicode character properties database.

翻譯一下：當(dāng)沒有設(shè)置LOCALE(re.L)和UNICODE(re.U)標(biāo)志，匹配數(shù)字字母和下劃線，如果設(shè)置了LOCALE(re.L)則匹配數(shù)字下劃線和LOCALE文字。如果設(shè)置了UNICODE(re.U)標(biāo)志，匹配數(shù)字下劃線和Unicode字符集里的字符。

那么Python3了：

對(duì)于 Unicode (str) 樣式：
匹配Unicode詞語的字符，包含了可以構(gòu)成詞語的絕大部分字符，也包括數(shù)字和下劃線。如果設(shè)置了 ASCII 標(biāo)志，就只匹配 [a-zA-Z0-9_] 。
對(duì)于8位(bytes)樣式：
匹配ASCII字符中的數(shù)字和字母和下劃線，就是 [a-zA-Z0-9_] 。如果設(shè)置了 LOCALE 標(biāo)記，就匹配當(dāng)前語言區(qū)域的數(shù)字和字母和下劃線。

到此，我明白了，默認(rèn)情況下，不設(shè)置任何標(biāo)志，Python2 \w匹配ASCII字符集里的字符，包括數(shù)字字符和下劃線，Python3 \w匹配數(shù)字下劃線和Unicode字符集。所以，為了遷移方便，如果你想匹配ASCII字符集里的字符，指定標(biāo)志為re.A，如果你想匹配Unicode字符集里的字符，指定標(biāo)志為re.U。

感謝各位的閱讀，以上就是“Python的正則規(guī)則舉例分析”的內(nèi)容了，經(jīng)過本文的學(xué)習(xí)后，相信大家對(duì)Python的正則規(guī)則舉例分析這一問題有了更深刻的體會(huì)，具體使用情況還需要大家實(shí)踐驗(yàn)證。這里是創(chuàng)新互聯(lián)，小編將為大家推送更多相關(guān)知識(shí)點(diǎn)的文章，歡迎關(guān)注！

分享名稱：Python的正則規(guī)則舉例分析-創(chuàng)新互聯(lián)
本文路徑：http://weahome.cn/article/dghchj.html

真实的国产乱ⅩXXX66竹夫人,五月香六月婷婷激情综合,亚洲日本VA一区二区三区,亚洲精品一区二区三区麻豆

Python的正則規(guī)則舉例分析-創(chuàng)新互聯(lián)

其他資訊

網(wǎng)站制作

企業(yè)服務(wù)

網(wǎng)站建設(shè)

服務(wù)器托管