Python學(xué)習(xí)教程(Python學(xué)習(xí)路線):那些年我們踩過的那些坑。。。
成都創(chuàng)新互聯(lián)公司專注于企業(yè)全網(wǎng)營銷推廣、網(wǎng)站重做改版、嘉黎網(wǎng)站定制設(shè)計、自適應(yīng)品牌網(wǎng)站建設(shè)、H5技術(shù)、電子商務(wù)商城網(wǎng)站建設(shè)、集團公司官網(wǎng)建設(shè)、外貿(mào)網(wǎng)站建設(shè)、高端網(wǎng)站制作、響應(yīng)式網(wǎng)頁設(shè)計等建站業(yè)務(wù),價格優(yōu)惠性價比高,為嘉黎等各大城市提供網(wǎng)站開發(fā)制作服務(wù)。
坑01 - 整數(shù)比較的坑
在 Python 中一切都是對象,整數(shù)也是對象,在比較兩個整數(shù)時有兩個運算符 == 和 is ,它們的區(qū)別是:
知道了is和==的區(qū)別之后,我們可以來看看下面的代碼,了解Python中整數(shù)比較有哪些坑:
def main(): x = y = -1 while True: x += 1 y += 1 if x is y: print('%d is %d' % (x, y)) else: print('Attention! %d is not %d' % (x, y)) break x = y = 0 while True: x -= 1 y -= 1 if x is y: print('%d is %d' % (x, y)) else: print('Attention! %d is not %d' % (x, y)) break if __name__ == '__main__': main()
上面代碼的部分運行結(jié)果如下圖所示,出現(xiàn)這個結(jié)果的原因是Python出于對性能的考慮所做的一項優(yōu)化。對于整數(shù)對象,Python把一些頻繁使用的整數(shù)對象緩存起來,保存到一個叫small_ints的鏈表中,在Python的整個生命周期內(nèi),任何需要引用這些整數(shù)對象的地方,都不再重新創(chuàng)建新的對象,而是直接引用緩存中的對象。Python把頻繁使用的整數(shù)對象的值定在[-5, 256]這個區(qū)間,如果需要這個范圍的整數(shù),就直接從 small_ints 中獲取引用而不是臨時創(chuàng)建新的對象。因為大于256或小于-5的整數(shù)不在該范圍之內(nèi),所以就算兩個整數(shù)的值是一樣,但它們是不同的對象。
當(dāng)然僅僅如此這個坑就不值一提了,如果你理解了上面的規(guī)則,我們就再看看下面的代碼。
import dis a = 257 def main(): b = 257 # 第6行 c = 257 # 第7行 print(b is c) # True print(a is b) # False print(a is c) # False if __name__ == "__main__": main()
程序的執(zhí)行結(jié)果已經(jīng)用注釋寫在代碼上了。夠 坑 吧!看上去a、b和c的值都是一樣的,但是 is運算的結(jié)果卻不一樣。為什么會出現(xiàn)這樣的結(jié)果,首先我們來說說Python程序中的代碼塊。
所謂代碼塊是程序的一個最小的基本執(zhí)行單位,一個模塊文件、一個函數(shù)體、一個類、交互式命令中的單行代碼都叫做一個代碼塊。上面的代碼由兩個代碼塊構(gòu)成,a = 257是一個代碼塊,main函數(shù)是另外一個代碼塊。
Python內(nèi)部為了進一步提高性能,凡是在一個代碼塊中創(chuàng)建的整數(shù)對象,如果值不在small_ints 緩存范圍之內(nèi),但在同一個代碼塊中已經(jīng)存在一個值與其相同的整數(shù)對象了,那么就直接引用該對象,否則創(chuàng)建一個新的對象出來,這條規(guī)則對不在small_ints范圍的負數(shù)并不適用,對負數(shù)值浮點數(shù)也不適用,但對非負浮點數(shù)和字符串都是適用的,這一點讀者可以自行證明。所以 b is c返回了True,而a和b不在同一個代碼塊中,雖然值都是257,但卻是兩個不同的對象,is運算的結(jié)果自然是False了。
為了驗證剛剛的結(jié)論,我們可以借用dis模塊(聽名字就知道是進行反匯編的模塊)從字節(jié)碼的角度來看看這段代碼。如果不理解什么是字節(jié)碼,可以先看看《談?wù)?Python 程序的運行原理》這篇文章??梢韵扔胕mport dis導(dǎo)入dis模塊并按照如下所示的方式修改代碼。
if __name__ == "__main__": main() dis.dis(main)
代碼的執(zhí)行結(jié)果如下圖所示。
可以看出代碼第6行和第7行,也就是main函數(shù)中的257是從同一個位置加載的,因此是同一個對象;而代碼第9行的a明顯是從不同的地方加載的,因此引用的是不同的對象。
如果還想對這個問題進行進一步深挖,推薦大家閱讀《Python整數(shù)對象實現(xiàn)原理》這篇文章。
坑02 - 嵌套列表的坑
Python中有一種內(nèi)置的數(shù)據(jù)類型叫列表,它是一種容器,可以用來承載其他的對象(準(zhǔn)確的說是其他對象的引用),列表中的對象可以稱為列表的元素,很明顯我們可以把列表作為列表中的元素,這就是所謂的嵌套列表。嵌套列表可以模擬出現(xiàn)實中的表格、矩陣、2D游戲的地圖(如植物大戰(zhàn)僵尸的花園)、棋盤(如國際象棋、黑白棋)等。但是在使用嵌套的列表時要小心,否則很可能遭遇非常尷尬的情況,下面是一個小例子。
def main(): names = ['關(guān)羽', '張飛', '趙云', '馬超', '黃忠'] subjs = ['語文', '數(shù)學(xué)', '英語'] scores = [[0] * 3] * 5 for row, name in enumerate(names): print('請輸入%s的成績' % name) for col, subj in enumerate(subjs): scores[row][col] = float(input(subj + ': ')) print(scores) if __name__ == '__main__': main()
我們希望錄入5個學(xué)生3門課程的成績,于是定義了一個有5個元素的列表,而列表中的每個元素又是一個由3個元素構(gòu)成的列表,這樣一個列表的列表剛好跟一個表格是一致的,相當(dāng)于有5行3列,接下來我們通過嵌套的for-in循環(huán)輸入每個學(xué)生3門課程的成績。程序執(zhí)行完成后我們發(fā)現(xiàn),每個學(xué)生3門課程的成績是一模一樣的,而且就是最后錄入的那個學(xué)生的成績。
要想把這個坑填平,我們首先要區(qū)分對象和對象的引用這兩個概念,而要區(qū)分這兩個概念,還得先說說內(nèi)存中的棧和堆。我們經(jīng)常會聽人說起“堆?!边@個詞,但實際上“堆”和“?!笔莾蓚€不同的概念。眾所周知,一個程序運行時需要占用一些內(nèi)存空間來存儲數(shù)據(jù)和代碼,那么這些內(nèi)存從邏輯上又可以做進一步的劃分。對底層語言(如C語言)有所了解的程序員大都知道,程序中可以使用的內(nèi)存從邏輯上可以為五個部分,按照地址從高到低依次是:棧(stack)、堆(heap)、數(shù)據(jù)段(data segment)、只讀數(shù)據(jù)段(static area)和代碼段(code segment)。其中,棧用來存儲局部、臨時變量,以及函數(shù)調(diào)用時保存現(xiàn)場和恢復(fù)現(xiàn)場需要用到的數(shù)據(jù),這部分內(nèi)存在代碼塊開始執(zhí)行時自動分配,代碼塊執(zhí)行結(jié)束時自動釋放,通常由編譯器自動管理;堆的大小不固定,可以動態(tài)的分配和回收,因此如果程序中有大量的數(shù)據(jù)需要處理,這些數(shù)據(jù)通常都放在堆上,如果堆空間沒有正確的被釋放會引發(fā)內(nèi)存泄露的問題,而像Python、Java等編程語言都使用了垃圾回收機制來實現(xiàn)自動化的內(nèi)存管理(自動回收不再使用的堆空間)。所以下面的代碼中,變量a并不是真正的對象,它是對象的引用,相當(dāng)于記錄了對象在堆空間的地址,通過這個地址我們可以訪問到對應(yīng)的對象;同理,變量b是列表容器的引用,它引用了堆空間上的列表容器,而列表容器中并沒有保存真正的對象,它保存的也僅僅是對象的引用。
a = object() b = ['apple', 'pitaya', 'grape']
知道了這一點,我們可以回過頭看看剛才的程序,我們對列表進行[[0] * 3] * 5操作時,僅僅是將[0, 0, 0]這個列表的地址進行了復(fù)制,并沒有創(chuàng)建新的列表對象,所以容器中雖然有5個元素,但是這5個元素引用了同一個列表對象,這一點可以通過id函數(shù)檢查scores[0]和scores[1]的地址得到證實。所以正確的代碼應(yīng)該按照如下的方式進行修改。
def main(): names = ['關(guān)羽', '張飛', '趙云', '馬超', '黃忠'] subjs = ['語文', '數(shù)學(xué)', '英語'] scores = [[]] * 5 for row, name in enumerate(names): print('請輸入%s的成績' % name) scores[row] = [0] * 3 for col, subj in enumerate(subjs): scores[row][col] = float(input(subj + ': ')) print(scores) if __name__ == '__main__': main()
或者
def main(): names = ['關(guān)羽', '張飛', '趙云', '馬超', '黃忠'] subjs = ['語文', '數(shù)學(xué)', '英語'] scores = [[0] * 3 for _ in range(5)] for row, name in enumerate(names): print('請輸入%s的成績' % name) scores[row] = [0] * 3 for col, subj in enumerate(subjs): scores[row][col] = float(input(subj + ': ')) print(scores) if __name__ == '__main__': main()
如果對內(nèi)存的使用不是很理解,可以看看PythonTutor網(wǎng)站上提供的代碼可視化執(zhí)行功能,通過可視化執(zhí)行,我們可以看到內(nèi)存是如何分配的,從而避免在使用嵌套列表或者復(fù)制對象時可能遇到的坑。
坑03 - 訪問修飾符的坑
用Python做過面向?qū)ο缶幊痰娜硕贾溃琍ython的類提供了兩種訪問控制權(quán)限,一種是公開,一種是私有(在屬性或方法前加上雙下劃線)。而用慣了Java或C#這類編程語言的人都知道,類中的屬性(數(shù)據(jù)抽象)通常都是私有的,其目的是為了將數(shù)據(jù)保護起來;而類中的方法(行為抽象)通常都是公開的,因為方法是對象向外界提供的服務(wù)。但是Python并沒有從語法層面確保私有成員的私密性,因為它只是對類中所謂的私有成員進行了命名的變換,如果知道命名的規(guī)則照樣可以直接訪問私有成員,請看下面的代碼。
class Student(object): def __init__(self, name, age): self.__name = name self.__age = age def __str__(self): return self.__name + ': ' + str(self.__age) def main(): stu = Student('駱昊', 38) # 'Student' object has no attribute '__name' # print(stu.__name) # 用下面的方式照樣可以訪問類中的私有成員 print(stu._Student__name) print(stu._Student__age) if __name__ == '__main__': main()
Python為什么要做出這樣的設(shè)定呢?用一句廣為流傳的格言來解釋這個問題:“We are all consenting adults here”(我們都是成年人)。這句話表達了很多Python程序員的一個共同觀點,那就是開放比封閉要好,我們應(yīng)該自己對自己的行為負責(zé)而不是從語言層面來限制對數(shù)據(jù)或方法的訪問。
所以 在Python中我們實在沒有必要將類中的屬性或方法用雙下劃線開頭的命名處理成私有的成員,因為這并沒有任何實際的意義。如果想對屬性或方法進行保護,我們建議用單下劃線開頭的受保護成員,雖然它也不能真正保護這些屬性或方法,但是它相當(dāng)于給調(diào)用者一個暗示,讓調(diào)用者知道這是不應(yīng)該直接訪問的屬性或方法,而且這樣做并不影響子類去繼承這些東西。
需要提醒大家注意的是 ,Python類中的那些魔法方法,如__str__、__repr__等,這些方法并不是私有成員哦,雖然它們以雙下劃線開頭,但是他們也是以雙下劃線結(jié)尾的,這種命名并不是私有成員的命名,這一點對初學(xué)者來說真的很坑。大家在學(xué)Python有遇到過很坑的嗎?可以一起討論一下。