本文小編為大家詳細(xì)介紹“Python中的re.findAll()、re.sub()、set()如何使用”,內(nèi)容詳細(xì),步驟清晰,細(xì)節(jié)處理妥當(dāng),希望這篇“Python中的re.findAll()、re.sub()、set()如何使用”文章能幫助大家解決疑惑,下面跟著小編的思路慢慢深入,一起來(lái)學(xué)習(xí)新知識(shí)吧。
為昭通等地區(qū)用戶提供了全套網(wǎng)頁(yè)設(shè)計(jì)制作服務(wù),及昭通網(wǎng)站建設(shè)行業(yè)解決方案。主營(yíng)業(yè)務(wù)為網(wǎng)站建設(shè)、網(wǎng)站制作、昭通網(wǎng)站設(shè)計(jì),以傳統(tǒng)方式定制建設(shè)網(wǎng)站,并提供域名空間備案等一條龍服務(wù),秉承以專(zhuān)業(yè)、用心的態(tài)度為用戶提供真誠(chéng)的服務(wù)。我們深信只要達(dá)到每一位用戶的要求,就會(huì)得到認(rèn)可,從而選擇與我們長(zhǎng)期合作。這樣,我們也可以走得更遠(yuǎn)!
re.findall():函數(shù)返回包含所有匹配項(xiàng)的列表。返回string中所有與pattern相匹配的全部字串,返回形式為list / 數(shù)組。
由函數(shù)原型代碼可知,findall() 函數(shù)存在三個(gè)參數(shù):
1. pattern:正則表達(dá)式中的 ‘模式字符串’ ;
2. string:當(dāng)前需要處理(查找替換)的原始字符串;
3. flags:可選參數(shù),表示編譯時(shí)用的匹配模式(如忽略大小寫(xiě)、多行模式等),數(shù)字形式,默認(rèn)為0
# 示例代碼 import re text1 = '北京市海淀區(qū)不存在的38街區(qū)不想工作大廈99號(hào)' res = re.findall(r'\d+', text1) print(type(res)) print(res) # output ## ['38', '99']
re.sub():函數(shù)將所有匹配項(xiàng),替換為選擇的文本,并返回結(jié)果。
由函數(shù)原型代碼可知,re.sub() 函數(shù)存在五個(gè)參數(shù):
1. pattern:正則表達(dá)式中的 ‘模式字符串’ ;
2. repl:需要被替換成的字符串,即將匹配到的pattern替換為repl;可以是函數(shù);
3. string:當(dāng)前需要處理(查找替換)的原始字符串;
4. count:可選參數(shù),表示需要替換的最大次數(shù),必須是非負(fù)整數(shù);默認(rèn)值為0,即匹配到的所有子串都進(jìn)行替換操作;
5. flags:可選參數(shù),表示編譯時(shí)用的匹配模式(如忽略大小寫(xiě)、多行模式等),數(shù)字形式,默認(rèn)為0
# 將所有匹配到的‘?dāng)?shù)字串' 替換為 '520‘ text1 = '北京市海淀區(qū)不存在的38街區(qū)不想工作大廈99號(hào)' res = re.re(r'\d+', 520) print(type(res)) print(res) # output,返回值res結(jié)果是str ## 北京市海淀區(qū)不存在的520街區(qū)不想工作大廈520號(hào)
3. set()
set():python內(nèi)置函數(shù)的其中一個(gè),創(chuàng)建一個(gè)無(wú)序不重復(fù)元素集。支持計(jì)算交集、差集、并并集。
# 為list數(shù)組l1 去重 l1 = [1, 1, 2, 2, 2, 3, 4] s1 = set(l1) print(type(s1)) print(s1) # output,返回類(lèi)型是 set ## {1, 2, 3, 4}
# 計(jì)算l1 和 l2 的交集 l1 = [1, 1, 2, 2, 2, 3, 4] l2 = [2, 3, 3, 4, 5, 6, 6] s1 = set(l1) s2 = set(l2) u = s1 & s2 print(type(u)) print(u) # output,返回結(jié)果類(lèi)型set ## {2, 3, 4}
# 計(jì)算l1 和 l2 的并集, 并集符號(hào) ‘|',intersection l1 = [1, 1, 2, 2, 2, 3, 4] l2 = [2, 3, 3, 4, 5, 6, 6] s1 = set(l1) # {1, 2, 3, 4} s2 = set(l2) # {2, 3, 4, 5, 6} u = s1 | s2 print(type(u)) print(u) # output,返回結(jié)果類(lèi)型set, 計(jì)算 {1, 2, 3, 4} 和 {2, 3, 4, 5, 6} 的并集 ## {1, 2, 3, 4, 5, 6}
# 計(jì)算差集,diff l1 = [1, 1, 2, 2, 2, 3, 4] l2 = [2, 3, 3, 4, 5, 6, 6] s1 = set(l1) # {1, 2, 3, 4} s2 = set(l2) # {2, 3, 4, 5, 6} print(s2) u = s1 - s2 print(type(u)) print(u) # output,返回結(jié)果是set ## {1}
# set內(nèi)也可以傳入字符串,會(huì)自動(dòng)轉(zhuǎn)換成list類(lèi)型 text1 = '北京市海淀區(qū)海淀區(qū)不想上班不想上班' res = set(text1) print(res) # 內(nèi)部元素是一個(gè)個(gè)的字,去重 且 無(wú)序 # output ## {'上', '北', '班', '海', '淀', '京', '不', '想', '區(qū)', '市'}
讀到這里,這篇“Python中的re.findAll()、re.sub()、set()如何使用”文章已經(jīng)介紹完畢,想要掌握這篇文章的知識(shí)點(diǎn)還需要大家自己動(dòng)手實(shí)踐使用過(guò)才能領(lǐng)會(huì),如果想了解更多相關(guān)內(nèi)容的文章,歡迎關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道。