什么是range()?為什么不生產(chǎn)迭代器??相信很多沒(méi)有經(jīng)驗(yàn)的人對(duì)此束手無(wú)策,為此本文總結(jié)了問(wèn)題出現(xiàn)的原因和解決方法,通過(guò)這篇文章希望你能解決這個(gè)問(wèn)題。
創(chuàng)新互聯(lián)自2013年起,先為昆玉等服務(wù)建站,昆玉等地企業(yè),進(jìn)行企業(yè)商務(wù)咨詢服務(wù)。為昆玉企業(yè)網(wǎng)站制作PC+手機(jī)+微官網(wǎng)三網(wǎng)同步一站式服務(wù)解決您的所有建站問(wèn)題。
迭代器是 23 種設(shè)計(jì)模式中最常用的一種(之一),在 Python 中隨處可見(jiàn)它的身影,我們經(jīng)常用到它,但是卻不一定意識(shí)到它的存在。在關(guān)于迭代器的系列文章中(鏈接見(jiàn)文末),我至少提到了 23 種生成迭代器的方法。有些方法是專門用于生成迭代器的,還有一些方法則是為了解決別的問(wèn)題而“暗中”使用到迭代器。
在系統(tǒng)學(xué)習(xí)迭代器之前,我一直以為 range() 方法也是用于生成迭代器的,現(xiàn)在卻突然發(fā)現(xiàn),它生成的只是可迭代對(duì)象,而并不是迭代器! (PS:Python2 中 range() 生成的是列表,本文基于Python3,生成的是可迭代對(duì)象)
于是,我有了這樣的疑問(wèn):為什么 range() 不生成迭代器呢?在查找答案的過(guò)程中,我發(fā)現(xiàn)自己對(duì) range 類型的認(rèn)識(shí)存在一些誤區(qū)。因此,本文將和大家全面地認(rèn)識(shí)一下 range ,期待與你共同學(xué)習(xí)進(jìn)步。
1、是什么range() ?
它的語(yǔ)法:range(start, stop [,step]) ;start 指的是計(jì)數(shù)起始值,默認(rèn)是 0;stop 指的是計(jì)數(shù)結(jié)束值,但不包括 stop ;step 是步長(zhǎng),默認(rèn)為 1,不可以為 0 。range() 方法生成一段左閉右開(kāi)的整數(shù)范圍。
>>> a = range(5) # 即 range(0,5) >>> a range(0, 5) >>> len(a) 5 >>> for x in a: >>> print(x,end=" ") 0 1 2 3 4
對(duì)于 range() 函數(shù),有幾個(gè)注意點(diǎn):(1)它表示的是左閉右開(kāi)區(qū)間;(2)它接收的參數(shù)必須是整數(shù),可以是負(fù)數(shù),但不能是浮點(diǎn)數(shù)等其它類型;(3)它是不可變的序列類型,可以進(jìn)行判斷元素、查找元素、切片等操作,但不能修改元素;(4)它是可迭代對(duì)象,卻不是迭代器。
# (1)左閉右開(kāi) >>> for i in range(3, 6): >>> print(i,end=" ") 3 4 5 # (2)參數(shù)類型 >>> for i in range(-8, -2, 2): >>> print(i,end=" ") -8 -6 -4 >>> range(2.2) ---------------------------- TypeError Traceback (most recent call last) ... TypeError: 'float' object cannot be interpreted as an integer # (3)序列操作 >>> b = range(1,10) >>> b[0] 1 >>> b[:-3] range(1, 7) >>> b[0] = 2 TypeError Traceback (most recent call last) ... TypeError: 'range' object does not support item assignment # (4)不是迭代器 >>> hasattr(range(3),'__iter__') True >>> hasattr(range(3),'__next__') False >>> hasattr(iter(range(3)),'__next__') True
2、 為什么range()不生產(chǎn)迭代器?
可以獲得迭代器的內(nèi)置方法很多,例如 zip() 、enumerate()、map()、filter() 和 reversed() 等等,但是像 range() 這樣僅僅得到的是可迭代對(duì)象的方法就絕無(wú)僅有了(若有反例,歡迎告知)。這就是我存在知識(shí)誤區(qū)的地方。
在 for-循環(huán) 遍歷時(shí),可迭代對(duì)象與迭代器的性能是一樣的,即它們都是惰性求值的,在空間復(fù)雜度與時(shí)間復(fù)雜度上并無(wú)差異。我曾概括過(guò)兩者的差別是“一同兩不同”:相同的是都可惰性迭代,不同的是可迭代對(duì)象不支持自遍歷(即next()方法),而迭代器本身不支持切片(即__getitem__()
方法)。
雖然有這些差別,但很難得出結(jié)論說(shuō)它們哪個(gè)更優(yōu)。現(xiàn)在微妙之處就在于,為什么給 5 種內(nèi)置方法都設(shè)計(jì)了迭代器,偏偏給 range() 方法設(shè)計(jì)的就是可迭代對(duì)象呢?把它們都統(tǒng)一起來(lái),不是更好么?
事實(shí)上,Pyhton 為了規(guī)范性就干過(guò)不少這種事,例如,Python2 中有 range() 和 xrange() 兩種方法,而 Python3 就干掉了其中一種,還用了“李代桃僵”法。為什么不更規(guī)范點(diǎn),令 range() 生成的是迭代器呢?
關(guān)于這個(gè)問(wèn)題,我沒(méi)找到官方解釋,以下純屬個(gè)人觀點(diǎn)。
zip() 等方法都需要接收確定的可迭代對(duì)象的參數(shù),是對(duì)它們的一種再加工的過(guò)程,因此也希望馬上產(chǎn)出確定的結(jié)果來(lái),所以 Python 開(kāi)發(fā)者就設(shè)計(jì)了這個(gè)結(jié)果是迭代器。這樣還有一個(gè)好處,即當(dāng)作為參數(shù)的可迭代對(duì)象發(fā)生變化的時(shí)候,作為結(jié)果的迭代器因?yàn)槭窍男偷模粫?huì)被錯(cuò)誤地使用。
而 range() 方法就不同了,它接收的參數(shù)不是可迭代對(duì)象,本身是一種初次加工的過(guò)程,所以設(shè)計(jì)它為可迭代對(duì)象,既可以直接使用,也可以用于其它再加工用途。例如,zip() 等方法就完全可以接收 range 類型的參數(shù)。
>>> for i in zip(range(1,6,2), range(2,7,2)): >>> print(i, end="") (1, 2)(3, 4)(5, 6)
也就是說(shuō),range() 方法作為一種初級(jí)生產(chǎn)者,它生產(chǎn)的原料本身就有很大用途,早早把它變?yōu)榈鞯脑?,無(wú)疑是一種畫(huà)蛇添足的行為。
對(duì)于這種解讀,你是否覺(jué)得有道理呢?歡迎就這個(gè)話題與我探討。
3、range 類型是什么?
以上是我對(duì)“為什么range()不產(chǎn)生迭代器”的一種解答。順著這個(gè)思路,我研究了一下它產(chǎn)生的 range 對(duì)象,一研究就發(fā)現(xiàn),這個(gè) range 對(duì)象也并不簡(jiǎn)單。
首先奇怪的一點(diǎn)就是,它竟然是不可變序列!我從未注意過(guò)這一點(diǎn)。雖然說(shuō),我從未想過(guò)修改 range() 的值,但這一不可修改的特性還是令我驚訝。
翻看文檔,官方是這樣明確劃分的——有三種基本的序列類型:列表、元組和范圍(range)對(duì)象。(There are three basic sequence types: lists, tuples, and range objects.)
這我倒一直沒(méi)注意,原來(lái) range 類型居然跟列表和元組是一樣地位的基礎(chǔ)序列!我一直記掛著字符串是不可變的序列類型,不曾想,這里還有一位不可變的序列類型呢。
那 range 序列跟其它序列類型有什么差異呢?
普通序列都支持的操作有 12 種,在《你真的知道Python的字符串是什么嗎?》這篇文章里提到過(guò)。range 序列只支持其中的 10 種,不支持進(jìn)行加法拼接與乘法重復(fù)。
>>> range(2) + range(3) ----------------------------------------- TypeError Traceback (most recent call last) ... TypeError: unsupported operand type(s) for +: 'range' and 'range' >>> range(2)*2 ----------------------------------------- TypeError Traceback (most recent call last) ... TypeError: unsupported operand type(s) for *: 'range' and 'int'
那么問(wèn)題來(lái)了:同樣是不可變序列,為什么字符串和元組就支持上述兩種操作,而偏偏 range 序列不支持呢?雖然不能直接修改不可變序列,但我們可以將它們拷貝到新的序列上進(jìn)行操作啊,為何 range 對(duì)象連這都不支持呢?
且看官方文檔的解釋:
...due to the fact that range objects can only represent sequences that follow a strict pattern and repetition and concatenation will usually violate that pattern.原因是 range 對(duì)象僅僅表示一個(gè)遵循著嚴(yán)格模式的序列,而重復(fù)與拼接通常會(huì)破壞這種模式...
問(wèn)題的關(guān)鍵就在于 range 序列的 pattern,仔細(xì)想想,其實(shí)它表示的就是一個(gè)等差數(shù)列?。ㄟ?,高中數(shù)學(xué)知識(shí)沒(méi)忘...),拼接兩個(gè)等差數(shù)列,或者重復(fù)拼接一個(gè)等差數(shù)列,想想確實(shí)不妥,這就是為啥 range 類型不支持這兩個(gè)操作的原因了。由此推論,其它修改動(dòng)作也會(huì)破壞等差數(shù)列結(jié)構(gòu),所以統(tǒng)統(tǒng)不給修改就是了。
4、小結(jié)
回顧全文,我得到了兩個(gè)偏冷門的結(jié)論:range 是可迭代對(duì)象而不是迭代器;range 對(duì)象是不可變的等差序列。
若單純看結(jié)論的話,你也許沒(méi)有感觸,或許還會(huì)說(shuō)這沒(méi)啥了不得啊。但如果我追問(wèn),為什么 range 不是迭代器呢,為什么 range 是不可變序列呢?對(duì)這倆問(wèn)題,你是否還能答出個(gè)自圓其說(shuō)的設(shè)計(jì)思想呢?(PS:我決定了,若有機(jī)會(huì)面試別人,我必要問(wèn)這兩個(gè)問(wèn)題的嘿~)
由于 range 對(duì)象這細(xì)微而有意思的特性,我覺(jué)得這篇文章寫(xiě)得值了。本文是作為迭代器系列文章的一篇來(lái)寫(xiě)的,所以對(duì)于迭代器的基礎(chǔ)知識(shí)介紹不多,歡迎查看之前的文章。另外,還有一種特殊的迭代器也值得單獨(dú)成文,那就是生成器了,敬請(qǐng)期待后續(xù)推文哦~
看完上述內(nèi)容,你們掌握什么是range()?為什么不生產(chǎn)迭代器?的方法了嗎?如果還想學(xué)到更多技能或想了解更多相關(guān)內(nèi)容,歡迎關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道,感謝各位的閱讀!