切片(slice)是 Python 中一種很有特色的特性,在正式開始之前,我們先來復(fù)習(xí)一下關(guān)于切片的知識(shí)吧。
成都創(chuàng)新互聯(lián)公司是一家專注于成都網(wǎng)站設(shè)計(jì)、成都網(wǎng)站制作與策劃設(shè)計(jì),婁星網(wǎng)站建設(shè)哪家好?成都創(chuàng)新互聯(lián)公司做網(wǎng)站,專注于網(wǎng)站建設(shè)10年,網(wǎng)設(shè)計(jì)領(lǐng)域的專業(yè)建站公司;建站業(yè)務(wù)涵蓋:婁星等地區(qū)。婁星做網(wǎng)站價(jià)格咨詢:18982081108
切片主要用于序列對(duì)象中,按照索引區(qū)間截取出一段索引的內(nèi)容。
切片的書寫形式:[i : i+n : m] ;其中,i 是切片的起始索引值,為列表首位時(shí)可省略;i+n 是切片的結(jié)束位置,為列表末位時(shí)可省略;m 可以不提供,默認(rèn)值是 1,不允許為 0,當(dāng) m 為負(fù)數(shù)時(shí),列表翻轉(zhuǎn)。
切片的基本含義是:從序列的第 i 位索引起,向右取到后 n 位元素為止,按 m 間隔過濾 。
下面是一些很有代表性的例子,基本涵蓋了切片語(yǔ)法的使用要點(diǎn):
# @Python貓
li = [1, 4, 5, 6, 7, 9, 11, 14, 16]
# 以下寫法都可以表示整個(gè)列表,其中 X >= len(li)
li[0:X] == li[0:] == li[:X] == li[:] == li[::] == li[-X:X] == li[-X:]
li[1:5] == [4,5,6,7] # 從1起,取5-1位元素
li[1:5:2] == [4,6] # 從1起,取5-1位元素,按2間隔過濾
li[-1:] == [16] # 取倒數(shù)第一個(gè)元素
li[-4:-2] == [9, 11] # 從倒數(shù)第四起,取-2-(-4)=2位元素
li[:-2] == li[-len(li):-2] == [1,4,5,6,7,9,11] # 從頭開始,取-2-(-len(li))=7位元素
# 步長(zhǎng)為負(fù)數(shù)時(shí),列表先翻轉(zhuǎn),再截取
li[::-1] == [16,14,11,9,7,6,5,4,1] # 翻轉(zhuǎn)整個(gè)列表
li[::-2] == [16,11,7,5,1] # 翻轉(zhuǎn)整個(gè)列表,再按2間隔過濾
li[:-5:-1] == [16,14,11,9] # 翻轉(zhuǎn)整個(gè)列表,取-5-(-len(li))=4位元素
li[:-5:-3] == [16,9] # 翻轉(zhuǎn)整個(gè)列表,取-5-(-len(li))=4位元素,再按3間隔過濾
# 切片的步長(zhǎng)不可以為0
li[::0] # 報(bào)錯(cuò)(ValueError: slice step cannot be zero)
像 C/C++、Java 和 JavaScript 等語(yǔ)言,雖然也支持某些“切片”功能,例如截取數(shù)組或字符串的片段,但是,它們并沒有一種在語(yǔ)法層面上的通用性支持。
根據(jù)維基百科資料,F(xiàn)ortran 是最早支持切片語(yǔ)法的語(yǔ)言(1966),而 Python 則是最具代表性的語(yǔ)言之一。
另外,像 Perl、Ruby、Go 和 Rust 等語(yǔ)言,雖然也有切片,但都不及 Python 那樣靈活和自由(因?yàn)樗С?step、負(fù)數(shù)索引、缺省索引)。
切片的基本用法就能夠滿足大部分的需求,但是,Python 切片還有一些進(jìn)階的用法,例如:切片占位符用法(可實(shí)現(xiàn)列表的賦值、刪除與拼接操作)、自定義對(duì)象實(shí)現(xiàn)切片功能、迭代器切片(itertools.islice())、文件對(duì)象切片等等。關(guān)聯(lián)閱讀:Python進(jìn)階:全面解讀高級(jí)特性之切片!
關(guān)于切片的介紹與溫習(xí),就到這里了。
下面進(jìn)入文章標(biāo)題的問題:Python 的切片語(yǔ)法為什么不會(huì)出現(xiàn)索引越界呢?
當(dāng)我們根據(jù)單個(gè)索引進(jìn)行取值時(shí),如果索引越界,就會(huì)得到報(bào)錯(cuò):“IndexError: list index out of range”。
>>> li = [1, 2]
>>> li[5]
Traceback (most recent call last):
File "", line 1, in
IndexError: list index out of range
對(duì)于一個(gè)非空的序列對(duì)象,假設(shè)其長(zhǎng)度為 length,則它有效的索引值是從 0 到(length - 1)。如果把負(fù)數(shù)索引也考慮進(jìn)去,則單個(gè)索引值的有效區(qū)間是 [-length, length - 1] 閉區(qū)間。
但是,當(dāng) Python 切片中的索引超出這個(gè)范圍時(shí),程序并不會(huì)報(bào)錯(cuò)。
>>> li = [1, 2]
>>> li[1:5] # 右索引超出
[2]
>>> li[5:6] # 左右索引都超出
[]
其實(shí),對(duì)于這種現(xiàn)象,官方文檔中有所介紹:
The slice of s from i to j is defined as the sequence of items with index k such that
i <= k < j
. If i or j is greater thanlen(s)
, uselen(s)
. If i is omitted orNone
, use0
. If j is omitted orNone
, uselen(s)
. If i is greater than or equal to j, the slice is empty.
也就是說:
對(duì)照上面的例子,可以得到:
>>> li = [1, 2]
>>> li[1:5] # 等價(jià)于 li[1:2]
[2]
>>> li[5:6] # 等價(jià)于 li[2:2]
[]
歸結(jié)起來一句話:Python 解釋器把可能導(dǎo)致索引越界的操作給屏蔽了,你的寫法可以很自由,但是最終的結(jié)果會(huì)被死死限制在合法的索引區(qū)間內(nèi)。
對(duì)于這個(gè)現(xiàn)象,我其實(shí)是有點(diǎn)疑惑的,為什么 Python 不直接報(bào)索引越界呢,為什么要修正切片的邊界值,為什么一定要返回一個(gè)值呢,即便這個(gè)值可能是個(gè)空序列?
當(dāng)我們使用“l(fā)i[5:6]”時(shí),至少在字面意義上想表達(dá)的是“取出索引從 5 到 6 所對(duì)應(yīng)的值”,就像是在說“取出書架上從左往右數(shù)的第 6 和 7 本書”。
如果程序是如實(shí)地遵照我們的指令的話,它就應(yīng)該報(bào)錯(cuò),就應(yīng)該說:對(duì)不起,書架上的書不夠數(shù)。
實(shí)話說,我并沒有查到這方面的解釋,這篇文章也不是要給大家科普 Python 在設(shè)計(jì)上有什么獨(dú)到的見解。恰恰相反,這篇文章的主要目的之一是希望得到大家的回復(fù)解答。
在 Go 語(yǔ)言中,遇到同樣的場(chǎng)景時(shí),它的做法是報(bào)錯(cuò)“runtime error: slice bounds out of range”。
在 Rust 語(yǔ)言中,遇到同樣的場(chǎng)景時(shí),它的做法是報(bào)錯(cuò)“byte index 5 is out of bounds of ......”。
在其它支持切片語(yǔ)法的語(yǔ)言中,也許還有跟 Python 一樣的設(shè)計(jì)。但是,我還不知道有沒有(學(xué)識(shí)淺薄)……
最后,繼續(xù)回到標(biāo)題中的問題“Python 的切片為什么不會(huì)索引越界”。我其實(shí)想問的問題有兩個(gè):
對(duì)于第一個(gè)問題的回答,官方文檔已經(jīng)寫得很明白了。
對(duì)于第二個(gè)問題,本文暫時(shí)沒有答案。
也許我很快就能找到答案,但是,也可能需要很久。不管如何,本文先到此為止了。
如果你喜歡研究 Python 設(shè)計(jì)上的小細(xì)節(jié),感興趣探求“為什么”問題的解答,歡迎關(guān)注“Python為什么”系列文章。
推薦閱讀最受大家喜歡的往期話題:
(1)Python 為什么推薦蛇形命名法?
(2)Python 為什么用 # 號(hào)作注釋符?
(3)Python 之父為什么嫌棄 lambda 匿名函數(shù)?
(4)Python 為什么不支持 switch 語(yǔ)句?
(5)Python 疑難問題:[] 與 list() 哪個(gè)快?為什么快?快多少呢?
(6)Python 為什么不支持 i++ 自增語(yǔ)法,不提供 ++ 操作符?
本文屬于“Python為什么”系列(Python貓出品),該系列主要關(guān)注 Python 的語(yǔ)法、設(shè)計(jì)和發(fā)展等話題,以一個(gè)個(gè)“為什么”式的問題為切入點(diǎn),試著展現(xiàn) Python 的迷人魅力。所有文章將會(huì)歸檔在 Github 上,項(xiàng)目地址:https://github.com/chinesehuazhou/python-whydo