Python中有許多內(nèi)置函數(shù),不像print、len那么廣為人知,但它們的功能卻異常強大,用好了可以大大提高代碼效率,同時提升代碼的簡潔度,增強可閱讀性
創(chuàng)新互聯(lián)主要從事成都網(wǎng)站建設(shè)、成都網(wǎng)站設(shè)計、網(wǎng)頁設(shè)計、企業(yè)做網(wǎng)站、公司建網(wǎng)站等業(yè)務(wù)。立足成都服務(wù)沈丘,十多年網(wǎng)站建設(shè)經(jīng)驗,價格優(yōu)惠、服務(wù)專業(yè),歡迎來電咨詢建站服務(wù):18982081108
Counter
collections在python官方文檔中的解釋是High-performance container datatypes,直接的中文翻譯解釋高性能容量數(shù)據(jù)類型。這個模塊實現(xiàn)了特定目標的容器,以提供Python標準內(nèi)建容器 dict , list , set , 和 tuple 的替代選擇。在python3.10.1中它總共包含以下幾種數(shù)據(jù)類型:
容器名簡介
namedtuple() 創(chuàng)建命名元組子類的工廠函數(shù)
deque 類似列表(list)的容器,實現(xiàn)了在兩端快速添加(append)和彈出(pop)
ChainMap 類似字典(dict)的容器類,將多個映射集合到一個視圖里面
Counter 字典的子類,提供了可哈希對象的計數(shù)功能
OrderedDict 字典的子類,保存了他們被添加的順序
defaultdict 字典的子類,提供了一個工廠函數(shù),為字典查詢提供一個默認值
UserDict 封裝了字典對象,簡化了字典子類化
UserList 封裝了列表對象,簡化了列表子類化
UserString 封裝了字符串對象,簡化了字符串子類化
其中Counter中文意思是計數(shù)器,也就是我們常用于統(tǒng)計的一種數(shù)據(jù)類型,在使用Counter之后可以讓我們的代碼更加簡單易讀。Counter類繼承dict類,所以它能使用dict類里面的方法
舉例
#統(tǒng)計詞頻
fruits = ['apple', 'peach', 'apple', 'lemon', 'peach', 'peach']
result = {}
for fruit in fruits:
if not result.get(fruit):
result[fruit] = 1
else:
result[fruit] += 1
print(result)
#{'apple': 2, 'peach': 3, 'lemon': 1}下面我們看用Counter怎么實現(xiàn):
from collections import Counter
fruits = ['apple', 'peach', 'apple', 'lemon', 'peach', 'peach']
c = Counter(fruits)
print(dict(c))
#{'apple': 2, 'peach': 3, 'lemon': 1}顯然代碼更加簡單了,也更容易閱讀和維護了。
elements()
返回一個迭代器,其中每個元素將重復(fù)出現(xiàn)計數(shù)值所指定次。元素會按首次出現(xiàn)的順序返回。如果一個元素的計數(shù)值小于1,elements()將會忽略它。
c = Counter(a=4, b=2, c=0, d=-2)
sorted(c.elements())
['a', 'a', 'a', 'a', 'b', 'b']most_common([n])
返回一個列表,其中包含n個最常見的元素及出現(xiàn)次數(shù),按常見程度由高到低排序。如果n被省略或為None,most_common()將返回計數(shù)器中的所有元素。計數(shù)值相等的元素按首次出現(xiàn)的順序排序:
Counter('abracadabra').most_common(3)
[('a', 5), ('b', 2), ('r', 2)]這兩個方法是Counter中最常用的方法,其他方法可以參考 python3.10.1官方文檔
實戰(zhàn)
Leetcode 1002.查找共用字符
給你一個字符串數(shù)組words,請你找出所有在words的每個字符串中都出現(xiàn)的共用字符(包括重復(fù)字符),并以數(shù)組形式返回。你可以按任意順序返回答案。
輸入:words = ["bella", "label", "roller"]
輸出:["e", "l", "l"]
輸入:words = ["cool", "lock", "cook"]
輸出:["c", "o"]看到統(tǒng)計字符,典型的可以用Counter完美解決。這道題是找出字符串列表里面每個元素都包含的字符,首先可以用Counter計算出每個元素每個字符出現(xiàn)的次數(shù),依次取交集最后得出所有元素共同存在的字符,然后利用elements輸出共用字符出現(xiàn)的次數(shù)
class Solution:
def commonChars(self, words: List[str]) - List[str]:
from collections import Counter
ans = Counter(words[0])
for i in words[1:]:
ans = Counter(i)
return list(ans.elements())提交一下,發(fā)現(xiàn)83個測試用例耗時48ms,速度還是不錯的
sorted
在處理數(shù)據(jù)過程中,我們經(jīng)常會用到排序操作,比如將列表、字典、元組里面的元素正/倒排序。這時候就需要用到sorted(),它可以對任何可迭代對象進行排序,并返回列表
對列表升序操作:
a = sorted([2, 4, 3, 7, 1, 9])
print(a)
# 輸出:[1, 2, 3, 4, 7, 9]對元組倒序操作:
sorted((4,1,9,6),reverse=True)
print(a)
# 輸出:[9, 6, 4, 1]使用參數(shù):key,根據(jù)自定義規(guī)則,按字符串長度來排序:
fruits = ['apple', 'watermelon', 'pear', 'banana']
a = sorted(fruits, key = lambda x : len(x))
print(a)
# 輸出:['pear', 'apple', 'banana', 'watermelon']all
all() 函數(shù)用于判斷給定的可迭代參數(shù)iterable中的所有元素是否都為 TRUE,如果是返回 True,否則返回 False。元素除了是 0、空、None、False外都算True。注意:空元組、空列表返回值為True。
all(['a', 'b', 'c', 'd']) # 列表list,元素都不為空或0
True
all(['a', 'b', '', 'd']) # 列表list,存在一個為空的元素
False
all([0, 1,2, 3]) # 列表list,存在一個為0的元素
False
all(('a', 'b', 'c', 'd')) # 元組tuple,元素都不為空或0
True
all(('a', 'b', '', 'd')) # 元組tuple,存在一個為空的元素
False
all((0, 1, 2, 3)) # 元組tuple,存在一個為0的元素
False
all([]) # 空列表
True
all(()) # 空元組
Trueany函數(shù)正好和all函數(shù)相反:判斷一個tuple或者list是否全為空,0,F(xiàn)alse。如果全為空,0,F(xiàn)alse,則返回False;如果不全為空,則返回True。
F-strings
在python3.6.2版本中,PEP 498提出一種新型字符串格式化機制,被稱為 “字符串插值” 或者更常見的一種稱呼是F-strings,F(xiàn)-strings提供了一種明確且方便的方式將python表達式嵌入到字符串中來進行格式化:
s1='Hello'
s2='World'
print(f'{s1} {s2}!')
# Hello World!在F-strings中我們也可以執(zhí)行函數(shù):
def power(x):
return x*x
x=4
print(f'{x} * {x} = {power(x)}')
# 4 * 4 = 16而且F-strings的運行速度很快,比傳統(tǒng)的%-string和str.format()這兩種格式化方法都快得多,書寫起來也更加簡單。
本文主要講解了python幾種冷門但好用的函數(shù),更多內(nèi)容以后會陸陸續(xù)續(xù)更新~
閉包:python函數(shù)的內(nèi)部的變量離開這個函數(shù)就失去了作用域而不復(fù)存在
但是嵌套函數(shù)可以!
解析: x是屬于fn1函數(shù)的,但是在 fn1()調(diào)用結(jié)束后 我們又加了兩個括號調(diào)用到了fn3,你看他還是能輸出x的值
但嵌套函數(shù)只是引用它!不能修改它,要在嵌套函數(shù)里修改x的值需要申明nonlocal x
工廠函數(shù):
函數(shù)return的時候返回一個函數(shù)名
參考: 石溪的答案
1、列表對象是list類的實例化對象,list類的基類是object
isinstance(l,list)
True
issubclass(list,object)
True
2、cmp的跨類型比較,這里我找到的一段文字
1.???對兩個列表的元素進行比較.
2.???如果比較的元素是同類型的,則比較其值,返回結(jié)果.
3.???如果兩個元素不是同一種類型,則檢查它們是否是數(shù)字.
a.?如果是數(shù)字,執(zhí)行必要的數(shù)字強制類型轉(zhuǎn)換,然后比較.
b.?如果有一方的元素是數(shù)字,則另一方的元素"大"(數(shù)字是"最小的")
c.?否則,通過類型名字的字母順序進行比較.
4.???如果有一個列表首先到達末尾,則另一個長一點的列表"大".
5.???如果我們用盡了兩個列表的元素而且所有元素都是相等的,那么結(jié)果就是個平局,就
是說返回一個?0.
3、關(guān)于工廠函數(shù)的定義,可以看看這里:
最好參照實例自己做一做,比較容易弄懂
4、列出所有內(nèi)置函數(shù)的方法我也不知道,感覺也太多了。
1、Python類型操作符和內(nèi)建函數(shù)總結(jié)
表4.5列出了所有操作符和內(nèi)建函數(shù),其中操作符順序是按優(yōu)先級從高到低排列的。同一種灰度的操作符擁有同樣的優(yōu)先級。注意在operator模塊中有這些(和絕大多數(shù)Python)操作符相應(yīng)的同功能的函數(shù)可供使用。
表4.5 標準類型操作符和內(nèi)建函數(shù)
操作符/函數(shù)
描 述
結(jié) 果a
字符串表示
``
對象的字符串表示
str
內(nèi)建函數(shù)
cmp(obj1, obj2)
比較兩個對象
int
repr(obj)
對象的字符串表示
str
str(obj)
對象的字符串表示
str
type(obj)
檢測對象的類型
type
值比較
小于
bool
大于
bool
=
小于或等于
bool
=
大于或等于
bool
==
等于
bool
!=
不等于
bool
不等于
bool
對象比較
is
是
bool
is not
不是
bool
布爾操作符
not
邏輯反
bool
and
邏輯與
bool
or
邏輯或
bool
2、Python數(shù)值類型操作符和內(nèi)建函數(shù)
一、工廠函數(shù)
數(shù)值工廠函數(shù)總結(jié)類(工廠函數(shù)) 操作
bool(obj) b 返回obj對象的布爾值,也就是 obj.__nonzero__()方法的返回值。
int(obj, base=10) 返回一個字符串或數(shù)值對象的整數(shù)表 示, 類似string.atoi();
從Python 1.6起, 引入了可選的進制參數(shù)。
long(obj, base=10) 返回一個字符或數(shù)據(jù)對象的長整數(shù)表 示,類似string.atol(),
從Python1.6起, 引入了可選的進制參數(shù) float(obj) ,
返回一個字符串或數(shù)據(jù)對象的浮點數(shù) 表示,類似string.atof()。
complex(str) or返回一個字符串的復(fù)數(shù)表示,或 者根據(jù)給定的實數(shù),
complex(real, imag=0.0) ?。耙粋€可選 的虛數(shù)部分)生成一個復(fù)數(shù)對象。
二、內(nèi)建函數(shù)
1、分類
Python 有五個運算內(nèi)建函數(shù)用于數(shù)值運算:
abs(num), coerce(num1,num2), divmod(num1,num2), pow(num1,num2,mod=1)和 round(flt,ndig=0)
其中abs()返回給定參數(shù)的絕對值。如果參數(shù)是一個復(fù)數(shù), 那么就返回math.sqrt(num.real2 + num.imag2).
coerce()是一個數(shù)據(jù)類型轉(zhuǎn)換函數(shù),不過它的行為更像一個運算符.數(shù)coerce()為程序員提供了不依賴Python 解釋器,而是自定義兩個數(shù)值類型轉(zhuǎn)換的方法。對一種新創(chuàng)建的數(shù)值類型來說, 這個特性非常有用.函數(shù)coerce()僅返回一個包含類型轉(zhuǎn)換完畢的兩個數(shù)值元素的元組.
divmod()內(nèi)建函數(shù)把除法和取余運算結(jié)合起來, 返回一個包含商和余數(shù)的元組.對整數(shù)來說,它的返回值就是地板除和取余操作的結(jié)果.對浮點數(shù)來說,返回的商部分是math.floor(num1/num2),對復(fù)數(shù)來說,商部分是ath.floor((num1/num2).real).
pow()它和雙星號 (**)運算符都可以進行指數(shù)運算.不過二者的區(qū)別并不僅僅在于一個是運算符,一個是內(nèi)建函數(shù).在Python 1.5 之前,并沒有 ** 運算符,內(nèi)建函數(shù)pow()還接受第三個可選的參數(shù),一個余數(shù)參數(shù).如果有這個參數(shù)的, pow() 先進行指數(shù)運算,然后將運算結(jié)果和第三個參數(shù)進行取余運算.這個特性主要用于密碼運算,并且比 pow(x,y) % z 性能更好, 這是因為這個函數(shù)的實現(xiàn)類似于C 函數(shù)pow(x,y,z).
round()用于對浮點數(shù)進行四舍五入運算。它有一個可選的小數(shù)位數(shù)參數(shù).如果不提供小數(shù)位參數(shù), 它返回與第一個參數(shù)最接近的整數(shù)(但仍然是浮點類型).第二個參數(shù)告訴round 函數(shù)將結(jié)果精確到小數(shù)點后指定位數(shù).
2、函數(shù)int()/round()/math.floor()它們之間的不同之處:
函數(shù) int()直接截去小數(shù)部分.(返回值為整數(shù))
函數(shù) floor() 得到最接近原數(shù)但小于原數(shù)的整數(shù).(返回值為浮點數(shù))
函數(shù) round() 得到最接近原數(shù)的整數(shù).(返回值為浮點數(shù))
3、進制轉(zhuǎn)換函數(shù):
返回字符串表示的8 進制和16 進制整數(shù),它們分別是內(nèi)建函數(shù):
oct()和 hex(). oct(255)='0377'/hex(255)='0xff'
函數(shù)chr()接受一個單字節(jié)整數(shù)值(0到255),返回一個字符串(ASCII),其值為對應(yīng)的字符.chr(97)='a'
函數(shù)ord()則相反,它接受一個字符(ASCII 或 Unicode),返回其對應(yīng)的整數(shù)值.ord('A')=65
3、Python字符串函數(shù)
(一)標準類型操作符和標準內(nèi)建函數(shù)
1)、標準類型操作符
,,=,=,==,!=,對象值得比較
注:做比較時字符串是按ASCII值的大小來比較的
is 對象身份比較
and,or,not 布爾類型
2)標準內(nèi)建函數(shù)
type(obj)
cmp(obj1,obj2)
str(obj)和repr(obj) 或反引號運算符(``) 可以方便的以字符串的方式獲取對象的
內(nèi)容、類型、數(shù)值屬性等信息。str()函數(shù)得到的字符串可讀性好, 而repr()函數(shù)得到的字符
串通??梢杂脕碇匦芦@得該對象, 通常情況下 obj == eval(repr(obj)) 這個等式是成立的
isinstance(obj,type) 判斷對象的類型
(二)序列操作
1、序列操作
字符串屬于序列對象,可以使用所有序列的操作和函數(shù)
切片 [] [:] [::]
簡單總結(jié):
*索引(S[i])獲取特定偏移的元素。
——第一個元素偏移為0
——(S[0])獲取第一個元素。
——負偏移索引意味著從最后或右邊反向進行計數(shù)
——(S[-2])獲取倒數(shù)第二個元素(就像S[len(s)-2]一樣
*分片[S[i:j]提取對應(yīng)的部分作為一個序列
——右邊界不包含在內(nèi)
——分片的邊界默認為0和序列的長度,如果沒有給出的話S[:]
——(S[1:3])獲取了從偏移為1,直到但不包括偏移為3的元素
——(S[1:])獲取從偏移為1到末尾之間的元素
——(S[:3])獲取從偏移為0直到但不包括偏移為3的元素
——(S[:-1])獲取從偏移為0直到但不包括最后一個元素之間的元素
——(S[:])獲取從偏移為0到末尾之間的元素,這有效地實現(xiàn)了頂層S拷貝
拷貝了一個相同值,但是是不同內(nèi)存區(qū)域的對象。對象字符串這樣不可變的對象不是很有用,但是對于可以實地修改的對象來說很有用。
比如列表。
擴展分片:第三個限制值 【步進】
完整形式:X[I:J:K]:這標識索引X對象的元素,從偏移為I直到J-1,每隔K元素索引一次。第三個限制值,K,默認為1
實例
Python Code
1
2
3
4
5
S='abcdefghijk'
S[1:10]
'bcdefghij'
S[1:10:2]
'bdfhj
也可以使用負數(shù)作為步進。
分片表達式
Python Code
1
2
"hello"[::-1]
'olleh'
通過負數(shù)步進,兩個邊界的意義實際上進行了反轉(zhuǎn)。
3、成員操作符 in ,not in
返回布爾值True 或False
可以使用string模塊來判斷輸入字符的合法性,可見成品中的idcheck.py
4、字符串連接
+ 連接字符串 ‘name’+' '+'jin'
字符串格式化 '%s %s' % ('name','jin')
join()方法 ' '.join(('name','jin')) ' '.join(['name','jin'])
5、刪除清空字符串
del aString
aString=''
(三)、序列函數(shù)
序列類型函數(shù)
len(str) 返回字串的長度
enumerate(iter):接受一個可迭代對象作為參數(shù),返回一個enumerate
max(str)/min(str):max()和min()函數(shù)對其他的序列類型可能更有用,但對于string類型它們能很好地運行,返回最大或者最小的字符(按照ASCII 碼值排列),
zip([it0, it1,... itN]) 返回一個列表,其第一個元素是it0,it1,...這些元素的第一個元素組成的一個元組,第二個...,類推.
reversed(seq)c 接受一個序列作為參數(shù),返回一個以逆序訪問的迭代器(PEP 322)
sorted(iter,func=None,key=None,reverse=False) 接受一個可迭代對象作為參數(shù),返回一個有序的列表;可選參數(shù)func,key 和reverse 的含義跟list.sort()內(nèi)建函數(shù)的參數(shù)含義一樣.
注意:
sorted等需要在原處修改的函數(shù)無法用在字符串對象,但可以產(chǎn)生新的對象
sum處理的對象是數(shù)字,不能用在字符串
sorted(s)
['a', 'e', 'e', 'g', 'g', 'g', 'o']
(四)只適合于字符串類型的函數(shù)
1)raw_input()函數(shù)
內(nèi)建的raw_input()函數(shù)使用給定字符串提示用戶輸入并將這個輸入返回,下面是一個使
用raw_input()的例子:
user_input = raw_input("Enter your name: ")
prin user_input
2)str() and unicode()
str()和unicode()函數(shù)都是工廠函數(shù),就是說產(chǎn)生所對應(yīng)的類型的對象.它們接受一個任
意類型的對象,然后創(chuàng)建該對象的可打印的或者Unicode 的字符串表示. 它們和basestring 都
可以作為參數(shù)傳給isinstance()函數(shù)來判斷一個對象的類型
3)chr(), unichr(), and ord()
chr()函數(shù)用一個范圍在range(256)內(nèi)的(就是0 到255)整數(shù)做參數(shù),返回一個對應(yīng)的字符.unichr()跟它一樣,只不過返回的是Unicode 字符
ord()函數(shù)是chr()函數(shù)(對于8 位的ASCII 字符串)或unichr()函數(shù)(對于Unicode 對象)
的配對函數(shù),它以一個字符(長度為1 的字符串)作為參數(shù),返回對應(yīng)的ASCII 數(shù)值,或者Unicode
數(shù)值,如果所給的Unicode 字符超出了你的Python 定義范圍,則會引發(fā)一個TypeError 的異常
(五)、只適用于字符串的操作符
1、格式化操作符 %
字符串格式化符號
格式化字符 轉(zhuǎn)換方式
%c 轉(zhuǎn)換成字符(ASCII 碼值,或者長度為一的字符串)
%ra 優(yōu)先用repr()函數(shù)進行字符串轉(zhuǎn)換
%s 優(yōu)先用str()函數(shù)進行字符串轉(zhuǎn)換
%d / %i 轉(zhuǎn)成有符號十進制數(shù)
%ub 轉(zhuǎn)成無符號十進制數(shù)
%ob 轉(zhuǎn)成無符號八進制數(shù)
%xb/%Xb (Unsigned)轉(zhuǎn)成無符號十六進制數(shù)(x/X 代表轉(zhuǎn)換后的十六進制字符的大
小寫)
%e/%E 轉(zhuǎn)成科學(xué)計數(shù)法(e/E 控制輸出e/E)
%f/%F 轉(zhuǎn)成浮點數(shù)(小數(shù)部分自然截斷)
%g/%G %e 和%f/%E 和%F 的簡寫
%% 輸出%
格式化操作符輔助指令
符號 作用
* 定義寬度或者小數(shù)點精度
- 用做左對齊
+ 在正數(shù)前面顯示加號( + )
sp 在正數(shù)前面顯示空格
# 在八進制數(shù)前面顯示零('0'),在十六進制前面顯示'0x'或者'0X'(取決于
用的是'x'還是'X')
0 顯示的數(shù)字前面填充‘0’而不是默認的空格
% '%%'輸出一個單一的'%'
(var) 映射變量(字典參數(shù))
m.n m 是顯示的最小總寬度,n 是小數(shù)點后的位數(shù)(如果可用的話)
2、字符串模板: 更簡單的替代品
由于新式的字符串Template 對象的引進使得string 模塊又重新活了過來,Template 對象
有兩個方法,substitute()和safe_substitute().前者更為嚴謹,在key 缺少的情況下它會報一
個KeyError 的異常出來,而后者在缺少key 時,直接原封不動的把字符串顯示出
3、原始字符串操作符( r/R )
字符串抑制轉(zhuǎn)義r'帶特殊符號的字串'
myfile=open(r'C:\new\text.data','w')
4、Unicode 字符串操作符( u/U )
u'abc' U+0061 U+0062 U+0063
u'\u1234' U+1234
u'abc\u1234\n' U+0061 U+0062 U+0063 U+1234 U+0012
(六)字符串對象的方法:
1、刪減
T2.lstrip() 移除字符串前面字符(默認空格),返回字符串
T2.rstrip() 移除字符串后面字符(默認空格),返回字符串
T2.strip() 移除字符串前后面空格,返回字符串 默認空格,可以其他字符 S.strip('"')
2、切割
partition(sep),
rpartition(sep),
splitlines([keepends]),#把S按照行分割符分為一個list,keepends是一個bool值,如果為真每行后而會保留行分割符
split([sep [,maxsplit]]),#以sep為分隔符,把S分成一個list。maxsplit表示分割的次數(shù)。默認的分割符為空白字符
rsplit([sep[,maxsplit]]) #從右到左切割
備注:
partition()函數(shù)族是2.5版本新增的方法。它接受一個字符串參數(shù),并返回一個3個元素的 tuple 對象。
如果sep沒出現(xiàn)在母串中,返回值是 (sep, ‘’, ‘’);
否則,返回值的第一個元素是 sep 左端的部分,第二個元素是 sep 自身,第三個元素是 sep 右端的部分。
S.partition(';')
('', ';', ' generated by /sbin/dhclient-script\nnameserver 172.16.10.171\nnameserver 8.8.8.8\nnameserver 172.16.0.2\nnameserver 178.79.131.110\nnameserver 202.96.199.133\n')
參數(shù) maxsplit 是分切的次數(shù),即最大的分切次數(shù),所以返回值最多有 maxsplit+1 個元素。
s.split() 和 s.split(‘ ‘)的返回值不盡相同
' hello world!'.split()
['hello', 'world!']
' hello world!'.split(' ')
['', '', 'hello', '', '', 'world!']
S.split('\n',3)
['; generated by /sbin/dhclient-script', 'nameserver 172.16.10.171', 'nameserver 8.8.8.8', 'nameserver 172.16.0.2\nnameserver 178.79.131.110\nnameserver 202.96.199.133\n']
超過最大切割個數(shù)后面的全部為一個元素
按行切割
S
'; generated by /sbin/dhclient-script\nnameserver 172.16.10.171\nnameserver 8.8.8.8\nnameserver 172.16.0.2\nnameserver 178.79.131.110\nnameserver 202.96.199.133\n'
S.splitlines()
['; generated by /sbin/dhclient-script', 'nameserver 172.16.10.171', 'nameserver 8.8.8.8', 'nameserver 172.16.0.2', 'nameserver 178.79.131.110', 'nameserver 202.96.199.133']
產(chǎn)生差異的原因在于當忽略 sep 參數(shù)或sep參數(shù)為 None 時與明確給 sep 賦予字符串值時 split() 采用兩種不同的算法。
對于前者,split() 先去除字符串兩端的空白符,然后以任意長度的空白符串作為界定符分切字符串
即連續(xù)的空白符串被當作單一的空白符看待;
對于后者則認為兩個連續(xù)的 sep 之間存在一個空字符串。因此對于空字符串(或空白符串),它們的返回值也是不同的:
''.split()
[]
''.split(' ')
['']
3、變形
lower(),#全部小寫
upper(),#全部小寫
capitalize(),#首字母大寫
swapcase(),#大小寫交換
title()#每個單詞第一個大寫,其他小寫
備注
因為title() 函數(shù)并不去除字符串兩端的空白符也不會把連續(xù)的空白符替換為一個空格,
所以建議使用string 模塊中的capwords(s)函數(shù),它能夠去除兩端的空白符,再將連續(xù)的空白符用一個空格代替。
Python Code
1
2
3
4
' hello world!'.title()
' Hello World!'
string.capwords(' hello world!')
'Hello World!'
4、連接
join(seq)
join() 函數(shù)的高效率(相對于循環(huán)相加而言),使它成為最值得關(guān)注的字符串方法之一。
它的功用是將可迭代的字符串序列連接成一條長字符串,如:
conf = {'host':'127.0.0.1',
... 'db':'spam',
... 'user':'sa',
... 'passwd':'eggs'}
';'.join("%s=%s"%(k, v) for k, v in conf.iteritems())
'passswd=eggs;db=spam;user=sa;host=127.0.0.1'
S=''.join(T) #使用空字符串分割把字符列表轉(zhuǎn)換為字符串
5、查找
count( sub[, start[, end]]),#計算substr在S中出現(xiàn)的次數(shù)
find( sub[, start[, end]]),#返回S中出現(xiàn)sub的第一個字母的標號,如果S中沒有sub則返回-1。start和end作用就相當于在S[start:end]中搜索
index( substr[, start[, end]]),#與find()相同,只是在S中沒有substr時,會返回一個運行時錯誤
rfind( sub[, start[,end]]),#返回S中最后出現(xiàn)的substr的第一個字母的標號,如果S中沒有substr則返回-1,也就是說從右邊算起的第一次出現(xiàn)的substr的首字母標號
rindex( sub[, start[, end]])
T2.find('ie') 字符串方法調(diào)用:搜索
find()----找到的第一個符合字符的index
rfind()-----找到最后一個符合的字符的index
備注:
find()函數(shù)族找不到時返回-1,index()函數(shù)族則拋出ValueError異常。
另,也可以用 in 和 not in 操作符來判斷字符串中是否存在某個模板
6、替換
replace(old, new[,count]),#把S中的oldstar替換為newstr,count為替換次數(shù)。這是替換的通用形式,還有一些函數(shù)進行特殊字符的替換
translate(table[,deletechars]) #使用上面的函數(shù)產(chǎn)后的翻譯表,把S進行翻譯,并把deletechars中有的字符刪掉
備注:
replace()函數(shù)的 count 參數(shù)用以指定最大替換次數(shù)
translate() 的參數(shù) table 可以由 string.maketrans(frm, to) 生成
translate() 對 unicode 對象的支持并不完備,建議不要使用
7、判定
isalnum(),#是否全是字母和數(shù)字,并至少有一個字符
isalpha(),是否全是字母,并至少有一個字符
isdigit(),是否全是數(shù)字,并至少有一個字符 ,如果是全數(shù)字返回True,否則返回False
islower(),#S中的字母是否全是小寫
isupper(),#S中的字母是否是大寫
isspace(),#是否全是空白字符,并至少有一個字符
istitle(),S是否是首字母大寫的
startswith(prefix[, start[, end]]), #是否以prefix開頭
endswith(suffix[,start[, end]]),#以suffix結(jié)尾
備注:
這些函數(shù)都比較簡單,顧名知義。需要注意的是*with()函數(shù)族可以接受可選的 start, end 參數(shù),善加利用,可以優(yōu)化性能。
另,自 Py2.5 版本起,*with() 函數(shù)族的 prefix 參數(shù)可以接受 tuple 類型的實參,當實參中的某人元素能夠匹配,即返回 True。
8、填充
字符串在輸出時的對齊:
center(width[, fillchar]), 字符串中間對齊
ljust(width[, fillchar]), 字符串左對齊,不足部分用fillchar填充,默認的為空格
rjust(width[, fillchar]), 字符串右對齊,不足部分用fillchar填充,默認的為空格
zfill(width), 把字符串變成width長,并在右對齊,不足部分用0補足
expandtabs([tabsize])把字符串中的制表符(tab)轉(zhuǎn)換為適當數(shù)量的空格。
fillchar 參數(shù)指定了用以填充的字符,默認為空格
zfill的z為zero的縮寫,顧名思義,是以字符0進行填充,用于數(shù)值輸出
expandtabs()的tabsize 參數(shù)默認為8。它的功能是把字符串中的制表符(tab)轉(zhuǎn)換為適當數(shù)量的空格。
9、編碼
encode([encoding[,errors]]),
decode([encoding[,errors]])
這是一對互逆操作的方法,用以編碼和解碼字符串。因為str是平臺相關(guān)的,它使用的內(nèi)碼依賴于操作系統(tǒng)環(huán)境,
而unicode是平臺無關(guān)的,是Python內(nèi)部的字符串存儲
在Python語言中,可以在函數(shù)中定義函數(shù)。 這種在函數(shù)中嵌套定義的函數(shù)也叫內(nèi)部函數(shù)。我們來看下面的代碼:
上述代碼中,定義了函數(shù)greet,在函數(shù)greet內(nèi)部又定義了一個函數(shù)inner_func, 并調(diào)用該函數(shù)打印了一串字符。
我們可以看到,內(nèi)部函數(shù)inner_func的定義和使用與普通函數(shù)基本相同。需要注意的是變量的作用域,在上述代碼中,函數(shù)參數(shù)name對于全局函數(shù)greet是局部變量,對內(nèi)部函數(shù)inner_func來說則是非局部變量。內(nèi)部函數(shù)對于非局部變量的訪問規(guī)則類似于標準的外部函數(shù)訪問全局變量。
從這個例子我們還可以看到內(nèi)部函數(shù)的一個作用,就是通過定義內(nèi)部函數(shù)的方式將一些功能隱藏起來,防止外部直接調(diào)用。常見的場景是,在一個復(fù)雜邏輯的函數(shù)中,將一些小的任務(wù)定義成內(nèi)部函數(shù),然后由這個外層函數(shù)使用,這樣可以使代碼更為清晰,易于維護。這些內(nèi)部函數(shù)只會在這個外層函數(shù)中使用,不能被其他函數(shù)或模塊使用。
在Python語言中, 函數(shù)也是對象,它可以被創(chuàng)建、賦值給變量,或者作為函數(shù)的返回值。我們來看下面這個例子。
在上述代碼中,在函數(shù)gen_greet內(nèi)部定義了inner_func函數(shù),并返回了一個inner_func函數(shù)對象。外部函數(shù)gen_greet返回了一個函數(shù)對象,所以像gen_greet這樣的函數(shù)也叫工廠函數(shù)。
在內(nèi)部函數(shù)inner_func中,使用了外部函數(shù)的傳參greet_words(非局部變量),以及函數(shù)的參數(shù)name(局部變量),來打印一個字符串。
接下來,調(diào)用gen_greet("Hello")創(chuàng)建一個函數(shù)對象say_hello,緊接著調(diào)用say_hello("Mr. Zhang"),輸出的結(jié)果為:Hello, Mr. Zhang!
同樣的,調(diào)用gen_greet("Hi")創(chuàng)建一個函數(shù)對象say_hi,調(diào)用say_hello("Mr. Zhang"),輸出的結(jié)果為:Hi,Tony!
我們可以發(fā)現(xiàn),gen_greet返回的函數(shù)對象具有記憶功能,它能夠把所需使用的非局部變量保存下來,用于后續(xù)被調(diào)用的時候使用。這種保存了非局部變量的函數(shù)對象被稱作閉包(closure)。
那么閉包是如何實現(xiàn)的呢?其實并不復(fù)雜,函數(shù)對象中有一個屬性__closure__,它就是在創(chuàng)建函數(shù)對象時用來保存這些非局部變量的。
__closure__屬性是一個元組或者None類型。在上述代碼中,我們可以通過下面方式查看:
函數(shù)的嵌套所實現(xiàn)的功能大都可以通過定義類的方式來實現(xiàn),而且類是更加面向?qū)ο蟮拇a編寫方式。
嵌套函數(shù)的一個主要用途是實現(xiàn)函數(shù)的裝飾器。我們看下面的代碼:
在上述代碼中,logger函數(shù)返回函數(shù)with_logging,with_logging則是打印了函數(shù)func的名稱及傳入的參數(shù),然后調(diào)用func, 并將參數(shù)傳遞給func。其中的@wraps(func)語句用于復(fù)制函數(shù)func的名稱、注釋文檔、參數(shù)列表等等,使得with_logging函數(shù)具有被裝飾的函數(shù)func相同的屬性。
代碼中接下來用@logger對函數(shù)power_func進行修飾,它的作用等同于下面的代碼:
可見,裝飾器@符其實就是上述代碼的精簡寫法。
通過了解了嵌套函數(shù)和閉包的工作原理,我們在使用過程中就能夠更加得心應(yīng)手了。