一種自動(dòng)迭代的更優(yōu)雅的實(shí)現(xiàn)是使用 for循環(huán)
創(chuàng)新互聯(lián)公司成立與2013年,先為和平等服務(wù)建站,和平等地企業(yè),進(jìn)行企業(yè)商務(wù)咨詢服務(wù)。為和平企業(yè)網(wǎng)站制作PC+手機(jī)+微官網(wǎng)三網(wǎng)同步一站式服務(wù)解決您的所有建站問題。
在Python中,迭代器(Iterator)和可迭代(iterable)的區(qū)別是,迭代器支持 iter ()和 next ()方法;可迭代支持 iter ()方法??傻荒茉趂or循環(huán)中獲得元素,迭代器還可以用next()方法獲取元素。
list/truple/map/dict都是可迭代,但不是迭代器;這些數(shù)據(jù)的大小是確定的;迭代器不是,迭代器不知道要執(zhí)行多少次,所以可以理解為不知道有多少個(gè)元素,每調(diào)用一次next(),就會(huì)往下走一步。
凡是可以for循環(huán)的,都是Iterable
凡是可以next()的,都是Iterator
9.9. 迭代器
現(xiàn)在你可能注意到大多數(shù)容器對象都可以用 for 遍歷:
for element in [1, 2, 3]:
print(element)
for element in (1, 2, 3):
print(element)
for key in {'one':1, 'two':2}:
print(key)
for char in "123":
print(char)
for line in open("myfile.txt"):
print(line, end='')
這種形式的訪問清晰、簡潔、方便。迭代器的用法在 Python 中普遍而且統(tǒng)一。在后臺, for 語句在容器對象中調(diào)用 iter() 。該函數(shù)返回一個(gè)定義了 __next__() 方法的迭代器對象,它在容器中逐一訪問元素。沒有后續(xù)的元素時(shí), __next__() 拋出一個(gè) StopIteration 異常通知 for 語句循環(huán)結(jié)束。你可以是用內(nèi)建的 next() 函數(shù)調(diào)用 __next__() 方法;以下是其工作原理的示例:
s = 'abc'
it = iter(s)
it
next(it)
'a'
next(it)
'b'
next(it)
'c'
next(it)
Traceback (most recent call last):
File "
", line 1, in ?
next(it)
StopIteration
了解了迭代器協(xié)議的后臺機(jī)制,就可以很容易的給自己的類添加迭代器行為。定義一個(gè) __iter__() 方法,使其返回一個(gè)帶有 __next__() 方法的對象。如果這個(gè)類已經(jīng)定義了 __next__() ,那么 __iter__() 只需要返回 self:
迭代器模式:一種惰性獲取數(shù)據(jù)項(xiàng)的方式,即按需一次獲取一個(gè)數(shù)據(jù)項(xiàng)。
所有序列都是可以迭代的。我們接下來要實(shí)現(xiàn)一個(gè) Sentence(句子)類,我們向這個(gè)類的構(gòu)造方法傳入包含一些文本的字符串,然后可以逐個(gè)單詞迭代。
接下來測試 Sentence 實(shí)例能否迭代
序列可以迭代的原因:
iter()
解釋器需要迭代對象 x 時(shí),會(huì)自動(dòng)調(diào)用iter(x)。
內(nèi)置的 iter 函數(shù)有以下作用:
由于序列都實(shí)現(xiàn)了 __getitem__ 方法,所以都可以迭代。
可迭代對象:使用內(nèi)置函數(shù) iter() 可以獲取迭代器的對象。
與迭代器的關(guān)系:Python 從可迭代對象中獲取迭代器。
下面用for循環(huán)迭代一個(gè)字符串,這里字符串 'abc' 是可迭代的對象,用 for 循環(huán)迭代時(shí)是有生成器,只是 Python 隱藏了。
如果沒有 for 語句,使用 while 循環(huán)模擬,要寫成下面這樣:
Python 內(nèi)部會(huì)處理 for 循環(huán)和其他迭代上下文(如列表推導(dǎo),元組拆包等等)中的 StopIteration 異常。
標(biāo)準(zhǔn)的迭代器接口有兩個(gè)方法:
__next__ :返回下一個(gè)可用的元素,如果沒有元素了,拋出 StopIteration 異常。
__iter__ :返回 self,以便在需要使用可迭代對象的地方使用迭代器,如 for 循環(huán)中。
迭代器:實(shí)現(xiàn)了無參數(shù)的 __next__ 方法,返回序列中的下一個(gè)元素;如果沒有元素了,那么拋出 StopIteration 異常。Python 中的迭代器還實(shí)現(xiàn)了 __iter__ 方法,因此迭代器也可以迭代。
接下來使用迭代器模式實(shí)現(xiàn) Sentence 類:
注意, 不要 在 Sentence 類中實(shí)現(xiàn) __next__ 方法,讓 Sentence 實(shí)例既是可迭代對象,也是自身的迭代器。
為了“支持多種遍歷”,必須能從同一個(gè)可迭代的實(shí)例中獲取多個(gè)獨(dú)立的迭代器,而且各個(gè)迭代器要能維護(hù)自身的內(nèi)部狀態(tài),因此這一模式正確的實(shí)現(xiàn)方式是,每次調(diào)用 iter(my_iterable) 都新建一個(gè)獨(dú)立的迭代器。
所以總結(jié)下來就是:
實(shí)現(xiàn)相同功能,但卻符合 Python 習(xí)慣的方式是,用生成器函數(shù)代替 SentenceIteror 類。
只要 Python 函數(shù)的定義體中有 yield 關(guān)鍵字,該函數(shù)就是生成器函數(shù)。調(diào)用生成器函數(shù),就會(huì)返回一個(gè)生成器對象。
生成器函數(shù)會(huì)創(chuàng)建一個(gè)生成器對象,包裝生成器函數(shù)的定義體,把生成器傳給 next(...) 函數(shù)時(shí),生成器函數(shù)會(huì)向前,執(zhí)行函數(shù)定義體中的下一個(gè) yield 語句,返回產(chǎn)出的值,并在函數(shù)定義體的當(dāng)前位置暫停,。最終,函數(shù)的定義體返回時(shí),外層的生成器對象會(huì)拋出 StopIteration 異常,這一點(diǎn)與迭代器協(xié)議一致。
如今這一版 Sentence 類相較之前簡短多了,但是還不夠慵懶。 惰性 ,是如今人們認(rèn)為最好的特質(zhì)。惰性實(shí)現(xiàn)是指盡可能延后生成值,這樣做能節(jié)省內(nèi)存,或許還能避免做無用的處理。
目前實(shí)現(xiàn)的幾版 Sentence 類都不具有惰性,因?yàn)? __init__ 方法急迫的構(gòu)建好了文本中的單詞列表,然后將其綁定到 self.words 屬性上。這樣就得處理整個(gè)文本,列表使用的內(nèi)存量可能與文本本身一樣多(或許更多,取決于文本中有多少非單詞字符)。
re.finditer 函數(shù)是 re.findall 函數(shù)的惰性版本,返回的是一個(gè)生成器,按需生成 re.MatchObject 實(shí)例。我們可以使用這個(gè)函數(shù)來讓 Sentence 類變得懶惰,即只在需要時(shí)才生成下一個(gè)單詞。
標(biāo)準(zhǔn)庫提供了很多生成器函數(shù),有用于逐行迭代純文本文件的對象,還有出色的 os.walk 函數(shù)等等。本節(jié)專注于通用的函數(shù):參數(shù)為任意的可迭代對象,返回值是生成器,用于生成選中的、計(jì)算出的和重新排列的元素。
第一組是用于 過濾 的生成器函數(shù):從輸入的可迭代對象中產(chǎn)出元素的子集,而且不修改元素本身。這種函數(shù)大多數(shù)都接受一個(gè)斷言參數(shù)(predicate),這個(gè)參數(shù)是個(gè) 布爾函數(shù) ,有一個(gè)參數(shù),會(huì)應(yīng)用到輸入中的每個(gè)元素上,用于判斷元素是否包含在輸出中。
以下為這些函數(shù)的演示:
第二組是用于映射的生成器函數(shù):在輸入的單個(gè)/多個(gè)可迭代對象中的各個(gè)元素上做計(jì)算,然后返回結(jié)果。
以下為這些函數(shù)的用法:
第三組是用于合并的生成器函數(shù),這些函數(shù)都可以從輸入的多個(gè)可迭代對象中產(chǎn)出元素。
以下為演示:
第四組是從一個(gè)元素中產(chǎn)出多個(gè)值,擴(kuò)展輸入的可迭代對象。
以下為演示:
第五組生成器函數(shù)用于產(chǎn)出輸入的可迭代對象中的全部元素,不過會(huì)以某種方式重新排列。
下面的函數(shù)都接受一個(gè)可迭代的對象,然后返回單個(gè)結(jié)果,這種函數(shù)叫“歸約函數(shù)”,“合攏函數(shù)”或“累加函數(shù)”,其實(shí),這些內(nèi)置函數(shù)都可以用 functools.reduce 函數(shù)實(shí)現(xiàn),但內(nèi)置更加方便,而且還有一些優(yōu)點(diǎn)。
參考教程:
《流暢的python》 P330 - 363