正則表達(dá)式是一個(gè)特殊的字符序列,用于簡(jiǎn)潔表達(dá)一組字符串特征,檢查一個(gè)字符串是否與某種模式匹配,使用起來(lái)十分方便。
成都創(chuàng)新互聯(lián)主要從事網(wǎng)站設(shè)計(jì)制作、成都網(wǎng)站制作、網(wǎng)頁(yè)設(shè)計(jì)、企業(yè)做網(wǎng)站、公司建網(wǎng)站等業(yè)務(wù)。立足成都服務(wù)南開(kāi),十載網(wǎng)站建設(shè)經(jīng)驗(yàn),價(jià)格優(yōu)惠、服務(wù)專(zhuān)業(yè),歡迎來(lái)電咨詢(xún)建站服務(wù):028-86922220
在Python中,我們通過(guò)調(diào)用re庫(kù)來(lái)使用re模塊:
import re
下面介紹Python常用的正則表達(dá)式處理函數(shù)。
re.match函數(shù)
re.match 函數(shù)從字符串的起始位置匹配正則表達(dá)式,返回match對(duì)象,如果不是起始位置匹配成功的話(huà),match()就返回None。
re.match(pattern, string, flags=0)
pattern:匹配的正則表達(dá)式。
string:待匹配的字符串。
flags:標(biāo)志位,用于控制正則表達(dá)式的匹配方式,如:是否區(qū)分大小寫(xiě),多行匹配等等。具體參數(shù)為:
re.I:忽略大小寫(xiě)。
re.L:表示特殊字符集 \w, \W, \b, \B, \s, \S 依賴(lài)于當(dāng)前環(huán)境。
re.M:多行模式。
re.S:即 . ,并且包括換行符在內(nèi)的任意字符(. 不包括換行符)。
re.U:表示特殊字符集 \w, \W, \b, \B, \d, \D, \s, \S 依賴(lài)于 Unicode 字符屬性數(shù)據(jù)庫(kù)。
re.X:為了增加可讀性,忽略空格和 # 后面的注釋。
import?re #從起始位置匹配 r1=re.match('abc','abcdefghi') print(r1) #不從起始位置匹配 r2=re.match('def','abcdefghi') print(r2)
運(yùn)行結(jié)果:
其中,span表示匹配成功的整個(gè)子串的索引。
使用group(num) 或 groups() 匹配對(duì)象函數(shù)來(lái)獲取匹配表達(dá)式。
group(num):匹配的整個(gè)表達(dá)式的字符串,group() 可以一次輸入多個(gè)組號(hào),這時(shí)它將返回一個(gè)包含那些組所對(duì)應(yīng)值的元組。
groups():返回一個(gè)包含所有小組字符串的元組,從 1 到 所含的小組號(hào)。
import?re s='This?is?a?demo' r1=re.match(r'(.*)?is?(.*)',s) r2=re.match(r'(.*)?is?(.*?)',s) print(r1.group()) print(r1.group(1)) print(r1.group(2)) print(r1.groups()) print() print(r2.group()) print(r2.group(1)) print(r2.group(2)) print(r2.groups())
運(yùn)行結(jié)果:
上述代碼中的(.*)和(.*?)表示正則表達(dá)式的貪婪匹配與非貪婪匹配。
re.search函數(shù)
re.search函數(shù)掃描整個(gè)字符串并返回第一個(gè)成功的匹配,如果匹配成功則返回match對(duì)象,否則返回None。
re.search(pattern, string, flags=0)
pattern:匹配的正則表達(dá)式。
string:待匹配的字符串。
flags:標(biāo)志位,用于控制正則表達(dá)式的匹配方式,如:是否區(qū)分大小寫(xiě),多行匹配等等。
import?re #從起始位置匹配 r1=re.search('abc','abcdefghi') print(r1) #不從起始位置匹配 r2=re.search('def','abcdefghi') print(r2)
運(yùn)行結(jié)果:
使用group(num) 或 groups() 匹配對(duì)象函數(shù)來(lái)獲取匹配表達(dá)式。
group(num=0):匹配的整個(gè)表達(dá)式的字符串,group() 可以一次輸入多個(gè)組號(hào),這時(shí)它將返回一個(gè)包含那些組所對(duì)應(yīng)值的元組。
groups():返回一個(gè)包含所有小組字符串的元組,從 1 到 所含的小組號(hào)。
import?re s='This?is?a?demo' r1=re.search(r'(.*)?is?(.*)',s) r2=re.search(r'(.*)?is?(.*?)',s) print(r1.group()) print(r1.group(1)) print(r1.group(2)) print(r1.groups()) print() print(r2.group()) print(r2.group(1)) print(r2.group(2)) print(r2.groups())
運(yùn)行結(jié)果:
從上面不難發(fā)現(xiàn)re.match與re.search的區(qū)別:re.match只匹配字符串的起始位置,只要起始位置不符合正則表達(dá)式就匹配失敗,而re.search是匹配整個(gè)字符串,直到找到一個(gè)匹配為止。
re.compile 函數(shù)
compile 函數(shù)用于編譯正則表達(dá)式,生成一個(gè)正則表達(dá)式對(duì)象,供 match() 和 search() 這兩個(gè)函數(shù)使用。
re.compile(pattern[, flags])
pattern:一個(gè)字符串形式的正則表達(dá)式。
flags:可選,表示匹配模式,比如忽略大小寫(xiě),多行模式等。
import?re #匹配數(shù)字 r=re.compile(r'\d+')? r1=r.match('This?is?a?demo') r2=r.match('This?is?111?and?That?is?222',0,27) r3=r.match('This?is?111?and?That?is?222',8,27) ? print(r1) print(r2) print(r3)
運(yùn)行結(jié)果:
findall函數(shù)
搜索字符串,以列表形式返回正則表達(dá)式匹配的所有子串,如果沒(méi)有找到匹配的,則返回空列表。
需要注意的是,match 和 search 是匹配一次,而findall 匹配所有。
findall(string[, pos[, endpos]])
string:待匹配的字符串。
pos:可選參數(shù),指定字符串的起始位置,默認(rèn)為0。
endpos:可選參數(shù),指定字符串的結(jié)束位置,默認(rèn)為字符串的長(zhǎng)度。
import?re #匹配數(shù)字 r=re.compile(r'\d+')? r1=r.findall('This?is?a?demo') r2=r.findall('This?is?111?and?That?is?222',0,11) r3=r.findall('This?is?111?and?That?is?222',0,27) ? print(r1) print(r2) print(r3)
運(yùn)行結(jié)果:
re.finditer函數(shù)
和 findall 類(lèi)似,在字符串中找到正則表達(dá)式所匹配的所有子串,并把它們作為一個(gè)迭代器返回。
re.finditer(pattern, string, flags=0)
pattern:匹配的正則表達(dá)式。
string:待匹配的字符串。
flags:標(biāo)志位,用于控制正則表達(dá)式的匹配方式,如是否區(qū)分大小寫(xiě),多行匹配等。
import?re? r=re.finditer(r'\d+','This?is?111?and?That?is?222') for?i?in?r:? ?print?(i.group())
運(yùn)行結(jié)果:
re.split函數(shù)
將一個(gè)字符串按照正則表達(dá)式匹配的子串進(jìn)行分割后,以列表形式返回。
re.split(pattern, string[, maxsplit=0, flags=0])
pattern:匹配的正則表達(dá)式。
string:待匹配的字符串。
maxsplit:分割次數(shù),maxsplit=1分割一次,默認(rèn)為0,不限次數(shù)。
flags:標(biāo)志位,用于控制正則表達(dá)式的匹配方式,如:是否區(qū)分大小寫(xiě),多行匹配等。
import?re? r1=re.split('\W+','This?is?111?and?That?is?222')? r2=re.split('\W+','This?is?111?and?That?is?222',maxsplit=1)? r3=re.split('\d+','This?is?111?and?That?is?222')? r4=re.split('\d+','This?is?111?and?That?is?222',maxsplit=1)? print(r1) print(r2) print(r3) print(r4)
運(yùn)行結(jié)果:
re.sub函數(shù)
re.sub函數(shù)用于替換字符串中的匹配項(xiàng)。
re.sub(pattern, repl, string, count=0, flags=0)
pattern:正則中的模式字符串。
repl:替換的字符串,也可為一個(gè)函數(shù)。
string:要被查找替換的原始字符串。
count:模式匹配后替換的最大次數(shù),默認(rèn)0表示替換所有的匹配。
import?re? r='This?is?111?and?That?is?222' #?刪除字符串中的數(shù)字 r1=re.sub(r'\d+','',r) print(r1) #?刪除非數(shù)字的字符串? r2=re.sub(r'\D','',r) print(r2)
運(yùn)行結(jié)果:
到此這篇關(guān)于Python常用的正則表達(dá)式處理函數(shù)詳解的文章就介紹到這了,希望大家以后多多支持!
內(nèi)置函數(shù)就是Python給你提供的,拿來(lái)直接用的函數(shù),比如print.,input等。
截止到python版本3.6.2 ,python一共提供了68個(gè)內(nèi)置函數(shù),具體如下
本文將這68個(gè)內(nèi)置函數(shù)綜合整理為12大類(lèi),正在學(xué)習(xí)Python基礎(chǔ)的讀者一定不要錯(cuò)過(guò),建議收藏學(xué)習(xí)!
(1)列表和元組
(2)相關(guān)內(nèi)置函數(shù)
(3)字符串
frozenset 創(chuàng)建一個(gè)凍結(jié)的集合,凍結(jié)的集合不能進(jìn)行添加和刪除操作。
語(yǔ)法:sorted(Iterable, key=函數(shù)(排序規(guī)則), reverse=False)
語(yǔ)法:fiter(function. Iterable)
function: 用來(lái)篩選的函數(shù). 在?lter中會(huì)自動(dòng)的把iterable中的元素傳遞給function. 然后根據(jù)function返回的True或者False來(lái)判斷是否保留留此項(xiàng)數(shù)據(jù) , Iterable: 可迭代對(duì)象
搜索公眾號(hào)頂級(jí)架構(gòu)師后臺(tái)回復(fù)“面試”,送你一份驚喜禮包。
語(yǔ)法 : map(function, iterable)
可以對(duì)可迭代對(duì)象中的每一個(gè)元素進(jìn)行映射. 分別去執(zhí)行 function
hash : 獲取到對(duì)象的哈希值(int, str, bool, tuple). hash算法:(1) 目的是唯一性 (2) dict 查找效率非常高, hash表.用空間換的時(shí)間 比較耗費(fèi)內(nèi)存
迭代器是 23 種設(shè)計(jì)模式中最常用的一種(之一),在 Python 中隨處可見(jiàn)它的身影,我們經(jīng)常用到它,但是卻不一定意識(shí)到它的存在。在關(guān)于迭代器的系列文章中(鏈接見(jiàn)文末),我至少提到了 23 種生成迭代器的方法。有些方法是專(zhuān)門(mén)用于生成迭代器的,還有一些方法則是為了解決別的問(wèn)題而“暗中”使用到迭代器。
在系統(tǒng)學(xué)習(xí)迭代器之前,我一直以為 range() 方法也是用于生成迭代器的,現(xiàn)在卻突然發(fā)現(xiàn),它生成的只是可迭代對(duì)象,而并不是迭代器! (PS:Python2 中 range() 生成的是列表,本文基于Python3,生成的是可迭代對(duì)象)
于是,我有了這樣的疑問(wèn):為什么 range() 不生成迭代器呢?在查找答案的過(guò)程中,我發(fā)現(xiàn)自己對(duì) range 類(lèi)型的認(rèn)識(shí)存在一些誤區(qū)。因此,本文將和大家全面地認(rèn)識(shí)一下 range ,期待與你共同學(xué)習(xí)進(jìn)步。
1、range() 是什么?
它的語(yǔ)法:range(start, stop [,step]) ;start 指的是計(jì)數(shù)起始值,默認(rèn)是 0;stop 指的是計(jì)數(shù)結(jié)束值,但不包括 stop ;step 是步長(zhǎng),默認(rèn)為 1,不可以為 0 。range() 方法生成一段左閉右開(kāi)的整數(shù)范圍。
對(duì)于 range() 函數(shù),有幾個(gè)注意點(diǎn):(1)它表示的是左閉右開(kāi)區(qū)間;(2)它接收的參數(shù)必須是整數(shù),可以是負(fù)數(shù),但不能是浮點(diǎn)數(shù)等其它類(lèi)型;(3)它是不可變的序列類(lèi)型,可以進(jìn)行判斷元素、查找元素、切片等操作,但不能修改元素;(4)它是可迭代對(duì)象,卻不是迭代器。
2、 為什么range()不生產(chǎn)迭代器?
可以獲得迭代器的內(nèi)置方法很多,例如 zip() 、enumerate()、map()、filter() 和 reversed() 等等,但是像 range() 這樣僅僅得到的是可迭代對(duì)象的方法就絕無(wú)僅有了(若有反例,歡迎告知)。這就是我存在知識(shí)誤區(qū)的地方。
在 for-循環(huán) 遍歷時(shí),可迭代對(duì)象與迭代器的性能是一樣的,即它們都是惰性求值的,在空間復(fù)雜度與時(shí)間復(fù)雜度上并無(wú)差異。我曾概括過(guò)兩者的差別是“一同兩不同”:相同的是都可惰性迭代,不同的是可迭代對(duì)象不支持自遍歷(即next()方法),而迭代器本身不支持切片(即 getitem () 方法)。
雖然有這些差別,但很難得出結(jié)論說(shuō)它們哪個(gè)更優(yōu)?,F(xiàn)在微妙之處就在于,為什么給 5 種內(nèi)置方法都設(shè)計(jì)了迭代器,偏偏給 range() 方法設(shè)計(jì)的就是可迭代對(duì)象呢?把它們都統(tǒng)一起來(lái),不是更好么?
事實(shí)上,Pyhton 為了規(guī)范性就干過(guò)不少這種事,例如,Python2 中有 range() 和 xrange() 兩種方法,而 Python3 就干掉了其中一種,還用了“李代桃僵”法。為什么不更規(guī)范點(diǎn),令 range() 生成的是迭代器呢?
關(guān)于這個(gè)問(wèn)題,我沒(méi)找到官方解釋?zhuān)韵录儗賯€(gè)人觀(guān)點(diǎn) 。
zip() 等方法都需要接收確定的可迭代對(duì)象的參數(shù),是對(duì)它們的一種再加工的過(guò)程,因此也希望馬上產(chǎn)出確定的結(jié)果來(lái),所以 Python 開(kāi)發(fā)者就設(shè)計(jì)了這個(gè)結(jié)果是迭代器。這樣還有一個(gè)好處,即當(dāng)作為參數(shù)的可迭代對(duì)象發(fā)生變化的時(shí)候,作為結(jié)果的迭代器因?yàn)槭窍男偷?,不?huì)被錯(cuò)誤地使用。
而 range() 方法就不同了,它接收的參數(shù)不是可迭代對(duì)象,本身是一種初次加工的過(guò)程,所以設(shè)計(jì)它為可迭代對(duì)象,既可以直接使用,也可以用于其它再加工用途。例如,zip() 等方法就完全可以接收 range 類(lèi)型的參數(shù)。
也就是說(shuō),range() 方法作為一種初級(jí)生產(chǎn)者,它生產(chǎn)的原料本身就有很大用途,早早把它變?yōu)榈鞯脑?huà),無(wú)疑是一種畫(huà)蛇添足的行為。
對(duì)于這種解讀,你是否覺(jué)得有道理呢?歡迎就這個(gè)話(huà)題與我探討。
3、range 類(lèi)型是什么?
以上是我對(duì)“為什么range()不產(chǎn)生迭代器”的一種解答。順著這個(gè)思路,我研究了一下它產(chǎn)生的 range 對(duì)象,一研究就發(fā)現(xiàn),這個(gè) range 對(duì)象也并不簡(jiǎn)單。
首先奇怪的一點(diǎn)就是,它竟然是不可變序列!我從未注意過(guò)這一點(diǎn)。雖然說(shuō),我從未想過(guò)修改 range() 的值,但這一不可修改的特性還是令我驚訝。
翻看文檔,官方是這樣明確劃分的——有三種基本的序列類(lèi)型:列表、元組和范圍(range)對(duì)象。(There are three basic sequence types: lists, tuples, and range objects.)
這我倒一直沒(méi)注意,原來(lái) range 類(lèi)型居然跟列表和元組是一樣地位的基礎(chǔ)序列!我一直記掛著字符串是不可變的序列類(lèi)型,不曾想,這里還有一位不可變的序列類(lèi)型呢。
那 range 序列跟其它序列類(lèi)型有什么差異呢?
普通序列都支持的操作有 12 種。range 序列只支持其中的 10 種,不支持進(jìn)行加法拼接與乘法重復(fù)。
那么問(wèn)題來(lái)了:同樣是不可變序列,為什么字符串和元組就支持上述兩種操作,而偏偏 range 序列不支持呢?雖然不能直接修改不可變序列,但我們可以將它們拷貝到新的序列上進(jìn)行操作啊,為何 range 對(duì)象連這都不支持呢?
且看官方文檔的解釋?zhuān)?/p>
…due to the fact that range objects can only represent sequences that follow a strict pattern and repetition and concatenation will usually violate that pattern.
原因是 range 對(duì)象僅僅表示一個(gè)遵循著嚴(yán)格模式的序列,而重復(fù)與拼接通常會(huì)破壞這種模式…
問(wèn)題的關(guān)鍵就在于 range 序列的 pattern,仔細(xì)想想,其實(shí)它表示的就是一個(gè)等差數(shù)列?。ㄟ?,高中數(shù)學(xué)知識(shí)沒(méi)忘…),拼接兩個(gè)等差數(shù)列,或者重復(fù)拼接一個(gè)等差數(shù)列,想想確實(shí)不妥,這就是為啥 range 類(lèi)型不支持這兩個(gè)操作的原因了。由此推論,其它修改動(dòng)作也會(huì)破壞等差數(shù)列結(jié)構(gòu),所以統(tǒng)統(tǒng)不給修改就是了。
4、小結(jié)
回顧全文,我得到了兩個(gè)偏冷門(mén)的結(jié)論:range 是可迭代對(duì)象而不是迭代器;range 對(duì)象是不可變的等差序列。
若單純看結(jié)論的話(huà),你也許沒(méi)有感觸,或許還會(huì)說(shuō)這沒(méi)啥了不得啊。但如果我追問(wèn),為什么 range 不是迭代器呢,為什么 range 是不可變序列呢?對(duì)這倆問(wèn)題,你是否還能答出個(gè)自圓其說(shuō)的設(shè)計(jì)思想呢?(PS:我決定了,若有機(jī)會(huì)面試別人,我必要問(wèn)這兩個(gè)問(wèn)題的嘿~)
由于 range 對(duì)象這細(xì)微而有意思的特性,我覺(jué)得這篇文章寫(xiě)得值了。本文是作為迭代器系列文章的一篇來(lái)寫(xiě)的,所以對(duì)于迭代器的基礎(chǔ)知識(shí)介紹不多,另外,還有一種特殊的迭代器也值得單獨(dú)成文,那就是生成器了。
參數(shù)可以是任意類(lèi)型。
比如可以是列表。
-------------------------------
library=['python精通','MySQL','數(shù)據(jù)分析','人工智能']
#形參
def add_book(bookname):
library.append(bookname)
print('圖書(shū)添加成功!')
pass
def show_book(books):
for book in books:
print(book)
pass
pass
#調(diào)用函數(shù)
add_book('新概念英語(yǔ)')
show_book(library)
------------------------------
#輸出列表中所有大于50的數(shù)
list1=[23,45,77,88,58,10]
def get_list(list_1):
new_list=[ ]
for e in list_1:
if e=50:
new_list.append(e)
pass
pass
print(new_list)
pass
#調(diào)用函數(shù)
get_list(list1) #[77,88,58]
------------------------------
#刪除列表中小于50的數(shù)
def remove_from_list(list_1):
n=0
while nlen(list_1): p="" /len(list_1):
if list_1[n]50:
list_1.remove(list_1[n])
pass
else:
n+=1
pass
pass
print(list_1)
pass
#調(diào)用函數(shù)
remove_from_list(list1) #[77,88,58]
可以把list,tuple,dict和string相互轉(zhuǎn)化。
1、字符串轉(zhuǎn)換成列表
a = "[[1,2], [3,4], [5,6], [7,8], [9,0]]"
type(a)
b = eval(a)
print b[[1, 2], [3, 4], [5, 6], [7, 8], [9, 0]]
type(b)
2、字符串轉(zhuǎn)換成字典
a = "{1: 'a', 2: 'b'}"
type(a)
b = eval(a)
print b{1: 'a', 2: 'b'}
type(b)
3、字符串轉(zhuǎn)換成元組
a = "([1,2], [3,4], [5,6], [7,8], (9,0))"
type(a)
b = eval(a)
print b([1, 2], [3, 4], [5, 6], [7, 8], (9, 0))
type(b)
4、eval()函數(shù)傳進(jìn)去的參數(shù)必須是字符串或者是對(duì)象
示例1:
a=10;
print(eval("a+1"))
執(zhí)行結(jié)果: 11
示例2:
a=10;
g={'a':4}
print(eval("a+1",g))
執(zhí)行結(jié)果:5
示例3:
a=10
b=20
c=30
g={'a':6,'b':8}
t={'b':100,'c':10}
print(eval('a+b+c',g,t))
執(zhí)行結(jié)果:116? (a=6, b=100, c=10)
5、eval函數(shù),eval去除引號(hào)后會(huì)檢查到它是不是可計(jì)算的,如果可計(jì)算會(huì)將計(jì)算的結(jié)果打印出來(lái),如果不可計(jì)算直接返回結(jié)果
示例1:不可計(jì)算》》》直接輸出結(jié)果
s='["a","b","c"]'
print(eval(s))
執(zhí)行結(jié)果:?['a', 'b', 'c']
示例2:表達(dá)式可計(jì)算》》》計(jì)算之后輸出結(jié)果
s='abs(-10)'??
print(eval(s))
輸出結(jié)果:10?
5、eval()函數(shù),功能是將string變成算術(shù)表達(dá)式來(lái)執(zhí)行
示例1:
eval("1+2")
執(zhí)行結(jié)果: 3
示例2:
eval("print(\"hello, world\")")
輸出結(jié)果:hello, world
將函數(shù)作為參數(shù)傳入,這樣的函數(shù)稱(chēng)為高階函數(shù)。 函數(shù)式編程就是指這種高度抽象的編程范式。
變量可以指向函數(shù),函數(shù)的參數(shù)能接收變量,那么一個(gè)函數(shù)就可以接收另一個(gè)函數(shù)作為參數(shù),這種函數(shù)就稱(chēng)之為高階函數(shù)。如下所示:
map(fun, lst),將傳入的函數(shù)變量func作用到lst變量的每個(gè)元素中,并將結(jié)果組成新的列表返回。
定義一個(gè)匿名函數(shù)并調(diào)用,定義格式如--lambda arg1,arg2…:表達(dá)式
reduce把一個(gè)函數(shù)作用在一個(gè)序列[x1, x2, x3, …]上,這個(gè)函數(shù)必須接收兩個(gè)參數(shù),reduce把結(jié)果繼續(xù)和序列的下一個(gè)元素做累積計(jì)算。
filter() 函數(shù)用于過(guò)濾序列,過(guò)濾掉不符合條件的元素,返回由符合條件元素組成的新列表。
閉包的定義?閉包本質(zhì)上就是一個(gè)函數(shù)
如何創(chuàng)建閉包?
如何使用閉包?典型的使用場(chǎng)景是裝飾器的使用。
global與nonlocal的區(qū)別:
簡(jiǎn)單的使用如下:
偏函數(shù)主要輔助原函數(shù),作用其實(shí)和原函數(shù)差不多,不同的是,我們要多次調(diào)用原函數(shù)的時(shí)候,有些參數(shù),我們需要多次手動(dòng)的去提供值。
而偏函數(shù)便可簡(jiǎn)化這些操作,減少函數(shù)調(diào)用,主要是將一個(gè)或多個(gè)參數(shù)預(yù)先賦值,以便函數(shù)能用更少的參數(shù)進(jìn)行調(diào)用。
我們?cè)賮?lái)看一下偏函數(shù)的定義:
類(lèi)func = functools.partial(func, *args, **keywords)
我們可以看到,partial 一定接受三個(gè)參數(shù),從之前的例子,我們也能大概知道這三個(gè)參數(shù)的作用。簡(jiǎn)單介紹下:
總結(jié)
本文是對(duì)Python 高階函數(shù)相關(guān)知識(shí)的分享,主題內(nèi)容總結(jié)如下: