迭代器模式:一種惰性獲取數(shù)據(jù)項的方式,即按需一次獲取一個數(shù)據(jù)項。
創(chuàng)新互聯(lián)網(wǎng)站建設(shè)提供從項目策劃、軟件開發(fā),軟件安全維護、網(wǎng)站優(yōu)化(SEO)、網(wǎng)站分析、效果評估等整套的建站服務(wù),主營業(yè)務(wù)為成都網(wǎng)站設(shè)計、成都網(wǎng)站制作,成都app軟件開發(fā)以傳統(tǒng)方式定制建設(shè)網(wǎng)站,并提供域名空間備案等一條龍服務(wù),秉承以專業(yè)、用心的態(tài)度為用戶提供真誠的服務(wù)。創(chuàng)新互聯(lián)深信只要達(dá)到每一位用戶的要求,就會得到認(rèn)可,從而選擇與我們長期合作。這樣,我們也可以走得更遠(yuǎn)!
所有序列都是可以迭代的。我們接下來要實現(xiàn)一個 Sentence(句子)類,我們向這個類的構(gòu)造方法傳入包含一些文本的字符串,然后可以逐個單詞迭代。
接下來測試 Sentence 實例能否迭代
序列可以迭代的原因:
iter()
解釋器需要迭代對象 x 時,會自動調(diào)用iter(x)。
內(nèi)置的 iter 函數(shù)有以下作用:
由于序列都實現(xiàn)了 __getitem__ 方法,所以都可以迭代。
可迭代對象:使用內(nèi)置函數(shù) iter() 可以獲取迭代器的對象。
與迭代器的關(guān)系:Python 從可迭代對象中獲取迭代器。
下面用for循環(huán)迭代一個字符串,這里字符串 'abc' 是可迭代的對象,用 for 循環(huán)迭代時是有生成器,只是 Python 隱藏了。
如果沒有 for 語句,使用 while 循環(huán)模擬,要寫成下面這樣:
Python 內(nèi)部會處理 for 循環(huán)和其他迭代上下文(如列表推導(dǎo),元組拆包等等)中的 StopIteration 異常。
標(biāo)準(zhǔn)的迭代器接口有兩個方法:
__next__ :返回下一個可用的元素,如果沒有元素了,拋出 StopIteration 異常。
__iter__ :返回 self,以便在需要使用可迭代對象的地方使用迭代器,如 for 循環(huán)中。
迭代器:實現(xiàn)了無參數(shù)的 __next__ 方法,返回序列中的下一個元素;如果沒有元素了,那么拋出 StopIteration 異常。Python 中的迭代器還實現(xiàn)了 __iter__ 方法,因此迭代器也可以迭代。
接下來使用迭代器模式實現(xiàn) Sentence 類:
注意, 不要 在 Sentence 類中實現(xiàn) __next__ 方法,讓 Sentence 實例既是可迭代對象,也是自身的迭代器。
為了“支持多種遍歷”,必須能從同一個可迭代的實例中獲取多個獨立的迭代器,而且各個迭代器要能維護自身的內(nèi)部狀態(tài),因此這一模式正確的實現(xiàn)方式是,每次調(diào)用 iter(my_iterable) 都新建一個獨立的迭代器。
所以總結(jié)下來就是:
實現(xiàn)相同功能,但卻符合 Python 習(xí)慣的方式是,用生成器函數(shù)代替 SentenceIteror 類。
只要 Python 函數(shù)的定義體中有 yield 關(guān)鍵字,該函數(shù)就是生成器函數(shù)。調(diào)用生成器函數(shù),就會返回一個生成器對象。
生成器函數(shù)會創(chuàng)建一個生成器對象,包裝生成器函數(shù)的定義體,把生成器傳給 next(...) 函數(shù)時,生成器函數(shù)會向前,執(zhí)行函數(shù)定義體中的下一個 yield 語句,返回產(chǎn)出的值,并在函數(shù)定義體的當(dāng)前位置暫停,。最終,函數(shù)的定義體返回時,外層的生成器對象會拋出 StopIteration 異常,這一點與迭代器協(xié)議一致。
如今這一版 Sentence 類相較之前簡短多了,但是還不夠慵懶。 惰性 ,是如今人們認(rèn)為最好的特質(zhì)。惰性實現(xiàn)是指盡可能延后生成值,這樣做能節(jié)省內(nèi)存,或許還能避免做無用的處理。
目前實現(xiàn)的幾版 Sentence 類都不具有惰性,因為 __init__ 方法急迫的構(gòu)建好了文本中的單詞列表,然后將其綁定到 self.words 屬性上。這樣就得處理整個文本,列表使用的內(nèi)存量可能與文本本身一樣多(或許更多,取決于文本中有多少非單詞字符)。
re.finditer 函數(shù)是 re.findall 函數(shù)的惰性版本,返回的是一個生成器,按需生成 re.MatchObject 實例。我們可以使用這個函數(shù)來讓 Sentence 類變得懶惰,即只在需要時才生成下一個單詞。
標(biāo)準(zhǔn)庫提供了很多生成器函數(shù),有用于逐行迭代純文本文件的對象,還有出色的 os.walk 函數(shù)等等。本節(jié)專注于通用的函數(shù):參數(shù)為任意的可迭代對象,返回值是生成器,用于生成選中的、計算出的和重新排列的元素。
第一組是用于 過濾 的生成器函數(shù):從輸入的可迭代對象中產(chǎn)出元素的子集,而且不修改元素本身。這種函數(shù)大多數(shù)都接受一個斷言參數(shù)(predicate),這個參數(shù)是個 布爾函數(shù) ,有一個參數(shù),會應(yīng)用到輸入中的每個元素上,用于判斷元素是否包含在輸出中。
以下為這些函數(shù)的演示:
第二組是用于映射的生成器函數(shù):在輸入的單個/多個可迭代對象中的各個元素上做計算,然后返回結(jié)果。
以下為這些函數(shù)的用法:
第三組是用于合并的生成器函數(shù),這些函數(shù)都可以從輸入的多個可迭代對象中產(chǎn)出元素。
以下為演示:
第四組是從一個元素中產(chǎn)出多個值,擴展輸入的可迭代對象。
以下為演示:
第五組生成器函數(shù)用于產(chǎn)出輸入的可迭代對象中的全部元素,不過會以某種方式重新排列。
下面的函數(shù)都接受一個可迭代的對象,然后返回單個結(jié)果,這種函數(shù)叫“歸約函數(shù)”,“合攏函數(shù)”或“累加函數(shù)”,其實,這些內(nèi)置函數(shù)都可以用 functools.reduce 函數(shù)實現(xiàn),但內(nèi)置更加方便,而且還有一些優(yōu)點。
參考教程:
《流暢的python》 P330 - 363
迭代:按照一定的順序訪問集合中的每一個元素,或者叫遍歷(其他語言叫做遍歷);
可迭代對象(Iterable):能被迭代的對象,或者說直接作用于for循環(huán)的對象,可以通過for..in來遍歷的對象,比如數(shù)組(list)、元祖(tuple)字符串等;
迭代器(Iterator):能作用于next() 函數(shù),并不斷返回下一個值的對象稱為迭代器,是惰性計算的序列(很重要)
1、判斷一個對象是可迭代對象呢?方法是通過collections模塊的Iterable類型判斷
2、判斷一個對象是否是迭代器Iterator對象
3、可迭代對象Iterable轉(zhuǎn)化為迭代器對象Iterator
4、使用迭代器迭代
1、迭代器的特性
A.惰性計算數(shù)據(jù),節(jié)省內(nèi)存
B.能記錄狀態(tài),并通過next()函數(shù)執(zhí)行下一個狀態(tài)
C.具有可迭代性
2、集合數(shù)據(jù)類型如list、dict、str、tuple等是可迭代對象Iterable但不是迭代器Iterator,不過可以通過iter()函數(shù)轉(zhuǎn)化為一個Iterator對象
原因:Iterator對象表示的是一個數(shù)據(jù)流,Iterator對象可以被next()函數(shù)調(diào)用并不斷返回下一個數(shù)據(jù),直到?jīng)]有數(shù)據(jù)時拋出StopIteration錯誤。Iterator對象表示一個無限大的數(shù)據(jù),集合是有限集合,假如被next()到最后就是沒有返回直接carsh
3、生成器(generator)一定是迭代器,他是一種特殊的迭代器;
如果想了解更多Python知識,請查看
Python的基礎(chǔ)知識之生成器
Python的基礎(chǔ)知識之裝飾器
學(xué)無止境,學(xué)習(xí)Python的伙伴可以多多交流。
9.9. 迭代器
現(xiàn)在你可能注意到大多數(shù)容器對象都可以用 for 遍歷:
for element in [1, 2, 3]:
print(element)
for element in (1, 2, 3):
print(element)
for key in {'one':1, 'two':2}:
print(key)
for char in "123":
print(char)
for line in open("myfile.txt"):
print(line, end='')
這種形式的訪問清晰、簡潔、方便。迭代器的用法在 Python 中普遍而且統(tǒng)一。在后臺, for 語句在容器對象中調(diào)用 iter() 。該函數(shù)返回一個定義了 __next__() 方法的迭代器對象,它在容器中逐一訪問元素。沒有后續(xù)的元素時, __next__() 拋出一個 StopIteration 異常通知 for 語句循環(huán)結(jié)束。你可以是用內(nèi)建的 next() 函數(shù)調(diào)用 __next__() 方法;以下是其工作原理的示例:
s = 'abc'
it = iter(s)
it
next(it)
'a'
next(it)
'b'
next(it)
'c'
next(it)
Traceback (most recent call last):
File "
", line 1, in ?
next(it)
StopIteration
了解了迭代器協(xié)議的后臺機制,就可以很容易的給自己的類添加迭代器行為。定義一個 __iter__() 方法,使其返回一個帶有 __next__() 方法的對象。如果這個類已經(jīng)定義了 __next__() ,那么 __iter__() 只需要返回 self: