真实的国产乱ⅩXXX66竹夫人,五月香六月婷婷激情综合,亚洲日本VA一区二区三区,亚洲精品一区二区三区麻豆

成都創(chuàng)新互聯(lián)網(wǎng)站制作重慶分公司

使用正則表達(dá)式怎么實(shí)現(xiàn)文本模式的匹配和查找

使用正則表達(dá)式怎么實(shí)現(xiàn)文本模式的匹配和查找?針對這個問題,這篇文章詳細(xì)介紹了相對應(yīng)的分析和解答,希望可以幫助更多想解決這個問題的小伙伴找到更簡單易行的方法。

成都創(chuàng)新互聯(lián)主要從事成都做網(wǎng)站、網(wǎng)站制作、網(wǎng)頁設(shè)計(jì)、企業(yè)做網(wǎng)站、公司建網(wǎng)站等業(yè)務(wù)。立足成都服務(wù)章丘,十載網(wǎng)站建設(shè)經(jīng)驗(yàn),價格優(yōu)惠、服務(wù)專業(yè),歡迎來電咨詢建站服務(wù):13518219792

1、需求

我們想要按照特定的文本模式進(jìn)行匹配或查找。

2、解決方案

如果想要匹配的只是簡單的文字,那么通常只需要用基本的字符串方法就可以了,比如str.find()、str.endswith()、str.startswith()或類似函數(shù)。

示例:

text='mark ,帥哥,18,183 帥,mark'
print(text=='mark')
print(text.startswith('mark'))
print(text.startswith('mark'))
print(text.find('帥哥'))

結(jié)果:

False
True
True
6

如果更為復(fù)雜的匹配則需要使用正則表達(dá)式以及re模塊。為了說明使用正則表達(dá)式的基本流程,假設(shè)我們想匹配以數(shù)字形式構(gòu)成的日期,比如"11/27/2018"。示例如下:

import re
text1='11/27/2018'
text2='Nov 27, 2018'
if re.match(r'\d+/\d+/\d+',text1):
  print('符合模型:數(shù)字/數(shù)字/數(shù)字')
else:
  print('不符合模型:數(shù)字/數(shù)字/數(shù)字')

if re.match(r'\d+/\d+/\d+',text2):
  print('符合模型:數(shù)字/數(shù)字/數(shù)字')
else:
  print('不符合模型:數(shù)字/數(shù)字/數(shù)字')

運(yùn)行結(jié)果:

符合模型:數(shù)字/數(shù)字/數(shù)字
不符合模型:數(shù)字/數(shù)字/數(shù)字

如果打算針對同一模型做多次匹配,那么通常會先將正則表達(dá)式模式預(yù)編譯成一個模式對象。

例如:

import re
text1='11/27/2018'
text2='Nov 27, 2018'
datepat=re.compile(r'\d+/\d+/\d+')
if datepat.match(text1):
  print('符合模型:數(shù)字/數(shù)字/數(shù)字')
else:
  print('不符合模型:數(shù)字/數(shù)字/數(shù)字')

if datepat.match(text2):
  print('符合模型:數(shù)字/數(shù)字/數(shù)字')
else:
  print('不符合模型:數(shù)字/數(shù)字/數(shù)字')

結(jié)果:

符合模型:數(shù)字/數(shù)字/數(shù)字
不符合模型:數(shù)字/數(shù)字/數(shù)字

match()方法總是嘗試在字符串的開頭找到匹配項(xiàng)。如果想針對整個文本搜索出所有的匹配項(xiàng),那么就應(yīng)該使用findall()方法,例如:

import re
text='今天是 11/27/2018,昨天是11/26/2018'
datepat=re.compile(r'\d+/\d+/\d+')
print(datepat.findall(text))

運(yùn)行結(jié)果:

['11/27/2018', '11/26/2018']

當(dāng)定義正則表達(dá)式時,我們常會將部分模式用括號包起來的方式引入捕獲組,捕獲組通常簡化后續(xù)對匹配文本的處理,因?yàn)槊總€組的內(nèi)容都可以單獨(dú)提取出來。findall()方法搜索整個文本并找出所有的匹配項(xiàng)然后將它們以列表的形式返回。如果想以迭代的方式找出匹配項(xiàng),可以使用finditer()方法。

例如:

import re
#加入捕獲組
datepat=re.compile(r'(\d+)+/(\d+)+/(\d+)')
m=datepat.match('11/27/2018')
print(m.group(0))
print(m.group(1))
print(m.group(2))
print(m.group(3))
print(m.groups())
month,day,year=m.groups()
print(month)
print(day)
print(year)

print('*'*20)

text='今天是 11/27/2018,昨天是11/26/2018'
for month,day,year in datepat.findall(text):
  print('{}-{}-{}'.format(year,month,day))

print('*'*20)

for m in datepat.finditer(text):
  print(m.groups())

結(jié)果:

11/27/2018
11
27
2018
('11', '27', '2018')
11
27
2018
********************
2018-11-27
2018-11-26
********************
('11', '27', '2018')
('11', '26', '2018')

3、分析

本節(jié)主要介紹了re模塊對文本匹配和搜索的基本功能,首先用re.compile()對模式進(jìn)行編譯,然后使用想match()、findall()、finditer()這樣的方法做匹配和搜索。

當(dāng)指定模式時我們通常會使用原始字符串,例如:

r'(\d+)/(\d+)/(\d+)'

這樣的字符串不會對反斜字符轉(zhuǎn)義,這在正則表達(dá)式中非常有用。否則,我們需要用雙反斜杠線來標(biāo)識一個單獨(dú)的'',例如:

'(\\d+)/(\\d+)/(\\d+)'

請注意match()方法只會檢查字符的開頭,有可能出現(xiàn)的匹配的結(jié)果并不是你想要的,例如:

import re
#加入捕獲組
datepat=re.compile(r'(\d+)+/(\d+)+/(\d+)')
m=datepat.match('11/27/2018xxxx')
print(m)

結(jié)果:

如果想要精確匹配,可以加一個結(jié)束標(biāo)記:$

import re
#加入捕獲組
datepat=re.compile(r'(\d+)+/(\d+)+/(\d+)$')
m1=datepat.match('11/27/2018xxxx')
m2=datepat.match('11/27/2018')
print(m1)
print(m2)

結(jié)果:

None

關(guān)于使用正則表達(dá)式怎么實(shí)現(xiàn)文本模式的匹配和查找問題的解答就分享到這里了,希望以上內(nèi)容可以對大家有一定的幫助,如果你還有很多疑惑沒有解開,可以關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道了解更多相關(guān)知識。


新聞名稱:使用正則表達(dá)式怎么實(shí)現(xiàn)文本模式的匹配和查找
本文來源:http://weahome.cn/article/jscggp.html

其他資訊

在線咨詢

微信咨詢

電話咨詢

028-86922220(工作日)

18980820575(7×24)

提交需求

返回頂部