迭代器模式:一種惰性獲取數(shù)據(jù)項(xiàng)的方式,即按需一次獲取一個(gè)數(shù)據(jù)項(xiàng)。
目前成都創(chuàng)新互聯(lián)已為千余家的企業(yè)提供了網(wǎng)站建設(shè)、域名、網(wǎng)站空間、網(wǎng)站運(yùn)營、企業(yè)網(wǎng)站設(shè)計(jì)、思南網(wǎng)站維護(hù)等服務(wù),公司將堅(jiān)持客戶導(dǎo)向、應(yīng)用為本的策略,正道將秉承"和諧、參與、激情"的文化,與客戶和合作伙伴齊心協(xié)力一起成長,共同發(fā)展。
所有序列都是可以迭代的。我們接下來要實(shí)現(xiàn)一個(gè) Sentence(句子)類,我們向這個(gè)類的構(gòu)造方法傳入包含一些文本的字符串,然后可以逐個(gè)單詞迭代。
接下來測試 Sentence 實(shí)例能否迭代
序列可以迭代的原因:
iter()
解釋器需要迭代對(duì)象 x 時(shí),會(huì)自動(dòng)調(diào)用iter(x)。
內(nèi)置的 iter 函數(shù)有以下作用:
由于序列都實(shí)現(xiàn)了 __getitem__ 方法,所以都可以迭代。
可迭代對(duì)象:使用內(nèi)置函數(shù) iter() 可以獲取迭代器的對(duì)象。
與迭代器的關(guān)系:Python 從可迭代對(duì)象中獲取迭代器。
下面用for循環(huán)迭代一個(gè)字符串,這里字符串 'abc' 是可迭代的對(duì)象,用 for 循環(huán)迭代時(shí)是有生成器,只是 Python 隱藏了。
如果沒有 for 語句,使用 while 循環(huán)模擬,要寫成下面這樣:
Python 內(nèi)部會(huì)處理 for 循環(huán)和其他迭代上下文(如列表推導(dǎo),元組拆包等等)中的 StopIteration 異常。
標(biāo)準(zhǔn)的迭代器接口有兩個(gè)方法:
__next__ :返回下一個(gè)可用的元素,如果沒有元素了,拋出 StopIteration 異常。
__iter__ :返回 self,以便在需要使用可迭代對(duì)象的地方使用迭代器,如 for 循環(huán)中。
迭代器:實(shí)現(xiàn)了無參數(shù)的 __next__ 方法,返回序列中的下一個(gè)元素;如果沒有元素了,那么拋出 StopIteration 異常。Python 中的迭代器還實(shí)現(xiàn)了 __iter__ 方法,因此迭代器也可以迭代。
接下來使用迭代器模式實(shí)現(xiàn) Sentence 類:
注意, 不要 在 Sentence 類中實(shí)現(xiàn) __next__ 方法,讓 Sentence 實(shí)例既是可迭代對(duì)象,也是自身的迭代器。
為了“支持多種遍歷”,必須能從同一個(gè)可迭代的實(shí)例中獲取多個(gè)獨(dú)立的迭代器,而且各個(gè)迭代器要能維護(hù)自身的內(nèi)部狀態(tài),因此這一模式正確的實(shí)現(xiàn)方式是,每次調(diào)用 iter(my_iterable) 都新建一個(gè)獨(dú)立的迭代器。
所以總結(jié)下來就是:
實(shí)現(xiàn)相同功能,但卻符合 Python 習(xí)慣的方式是,用生成器函數(shù)代替 SentenceIteror 類。
只要 Python 函數(shù)的定義體中有 yield 關(guān)鍵字,該函數(shù)就是生成器函數(shù)。調(diào)用生成器函數(shù),就會(huì)返回一個(gè)生成器對(duì)象。
生成器函數(shù)會(huì)創(chuàng)建一個(gè)生成器對(duì)象,包裝生成器函數(shù)的定義體,把生成器傳給 next(...) 函數(shù)時(shí),生成器函數(shù)會(huì)向前,執(zhí)行函數(shù)定義體中的下一個(gè) yield 語句,返回產(chǎn)出的值,并在函數(shù)定義體的當(dāng)前位置暫停,。最終,函數(shù)的定義體返回時(shí),外層的生成器對(duì)象會(huì)拋出 StopIteration 異常,這一點(diǎn)與迭代器協(xié)議一致。
如今這一版 Sentence 類相較之前簡短多了,但是還不夠慵懶。 惰性 ,是如今人們認(rèn)為最好的特質(zhì)。惰性實(shí)現(xiàn)是指盡可能延后生成值,這樣做能節(jié)省內(nèi)存,或許還能避免做無用的處理。
目前實(shí)現(xiàn)的幾版 Sentence 類都不具有惰性,因?yàn)? __init__ 方法急迫的構(gòu)建好了文本中的單詞列表,然后將其綁定到 self.words 屬性上。這樣就得處理整個(gè)文本,列表使用的內(nèi)存量可能與文本本身一樣多(或許更多,取決于文本中有多少非單詞字符)。
re.finditer 函數(shù)是 re.findall 函數(shù)的惰性版本,返回的是一個(gè)生成器,按需生成 re.MatchObject 實(shí)例。我們可以使用這個(gè)函數(shù)來讓 Sentence 類變得懶惰,即只在需要時(shí)才生成下一個(gè)單詞。
標(biāo)準(zhǔn)庫提供了很多生成器函數(shù),有用于逐行迭代純文本文件的對(duì)象,還有出色的 os.walk 函數(shù)等等。本節(jié)專注于通用的函數(shù):參數(shù)為任意的可迭代對(duì)象,返回值是生成器,用于生成選中的、計(jì)算出的和重新排列的元素。
第一組是用于 過濾 的生成器函數(shù):從輸入的可迭代對(duì)象中產(chǎn)出元素的子集,而且不修改元素本身。這種函數(shù)大多數(shù)都接受一個(gè)斷言參數(shù)(predicate),這個(gè)參數(shù)是個(gè) 布爾函數(shù) ,有一個(gè)參數(shù),會(huì)應(yīng)用到輸入中的每個(gè)元素上,用于判斷元素是否包含在輸出中。
以下為這些函數(shù)的演示:
第二組是用于映射的生成器函數(shù):在輸入的單個(gè)/多個(gè)可迭代對(duì)象中的各個(gè)元素上做計(jì)算,然后返回結(jié)果。
以下為這些函數(shù)的用法:
第三組是用于合并的生成器函數(shù),這些函數(shù)都可以從輸入的多個(gè)可迭代對(duì)象中產(chǎn)出元素。
以下為演示:
第四組是從一個(gè)元素中產(chǎn)出多個(gè)值,擴(kuò)展輸入的可迭代對(duì)象。
以下為演示:
第五組生成器函數(shù)用于產(chǎn)出輸入的可迭代對(duì)象中的全部元素,不過會(huì)以某種方式重新排列。
下面的函數(shù)都接受一個(gè)可迭代的對(duì)象,然后返回單個(gè)結(jié)果,這種函數(shù)叫“歸約函數(shù)”,“合攏函數(shù)”或“累加函數(shù)”,其實(shí),這些內(nèi)置函數(shù)都可以用 functools.reduce 函數(shù)實(shí)現(xiàn),但內(nèi)置更加方便,而且還有一些優(yōu)點(diǎn)。
參考教程:
《流暢的python》 P330 - 363
數(shù)學(xué)上面的定義:迭代公式就是指用現(xiàn)在的值,代到一個(gè)公式里面,算出下一個(gè)值,再用下一個(gè)值代入公式,如此往復(fù)地代。比如:x=(x+2/x)/2 你隨便拿一個(gè)x=10代入,得x=(10+2/10)/2=5.1,再代進(jìn)去x=(5.1+2/5.1)/2=2.746,再代入得1.737,以此類推。
在python中,迭代式也可以是遞歸的調(diào)用,下面給你舉個(gè)例子:
def f(n):
if n == 0 or n == 1 or n == 2: return 1
else: return f(n-1) + f(n-2)
這就是一個(gè)簡單的第n項(xiàng)斐波那契數(shù)的求法,這里就用的是迭代式。另外的例子就是牛頓迭代法,采用逐次漸進(jìn)的效果求出n的開方數(shù),下面是例子:
def f(guess):
return guess ** 2
def fd(guess):
return 2 * guess
def SquareRootNR(x, epsilon):
guess = x / 2.0
diff = f(guess) - x
ctr = 1
while abs(diff) epsilon and ctr = 100:
guess = guess - diff / fd(guess)
diff = f(guess) - x
ctr += 1。
generator都輸出生成一個(gè)iterator對(duì)象,再由iterator遍歷出元素。迭代器就是逐個(gè)以“下一個(gè)”的形式返回元素的函數(shù)。
比如range(10)是生成器,生成一個(gè)顯示為"range(0,10)"的迭代器對(duì)象,可以進(jìn)一步由for等遍歷輸出0,1,2,3..10
又比如對(duì)于遍歷字典的iter(d)都是生成器函數(shù)
都在不同的層面,無所謂好壞...生成器產(chǎn)生不同的迭代器,迭代器直接產(chǎn)生元素,適合各自情況的就用...
有必要區(qū)分generator生成器函數(shù)(對(duì)象)和generator expression生成器表達(dá)式
比如:
range()生成器函數(shù)
for i in range(10)生成器表達(dá)式
[i+1?for i in range(10)]對(duì)生成器表達(dá)式的"列表分解"
另,貼圖中由于斷章取義,這里的“生成器自身”應(yīng)該是有特指某個(gè)生成器,而不是所有生成器的共性
9.9. 迭代器
現(xiàn)在你可能注意到大多數(shù)容器對(duì)象都可以用 for 遍歷:
for element in [1, 2, 3]:
print(element)
for element in (1, 2, 3):
print(element)
for key in {'one':1, 'two':2}:
print(key)
for char in "123":
print(char)
for line in open("myfile.txt"):
print(line, end='')
這種形式的訪問清晰、簡潔、方便。迭代器的用法在 Python 中普遍而且統(tǒng)一。在后臺(tái), for 語句在容器對(duì)象中調(diào)用 iter() 。該函數(shù)返回一個(gè)定義了 __next__() 方法的迭代器對(duì)象,它在容器中逐一訪問元素。沒有后續(xù)的元素時(shí), __next__() 拋出一個(gè) StopIteration 異常通知 for 語句循環(huán)結(jié)束。你可以是用內(nèi)建的 next() 函數(shù)調(diào)用 __next__() 方法;以下是其工作原理的示例:
s = 'abc'
it = iter(s)
it
next(it)
'a'
next(it)
'b'
next(it)
'c'
next(it)
Traceback (most recent call last):
File "
", line 1, in ?
next(it)
StopIteration
了解了迭代器協(xié)議的后臺(tái)機(jī)制,就可以很容易的給自己的類添加迭代器行為。定義一個(gè) __iter__() 方法,使其返回一個(gè)帶有 __next__() 方法的對(duì)象。如果這個(gè)類已經(jīng)定義了 __next__() ,那么 __iter__() 只需要返回 self: