字符串或串(String)是由數(shù)字、字母、下劃線組成的一串字符。一般記為 s=“a1a2···an”(n>=0)。它是編程語言中表示文本的數(shù)據(jù)類型。在程序設(shè)計(jì)中,字符串(string)為符號(hào)或數(shù)值的一個(gè)連續(xù)序列,如符號(hào)串(一串字符)或二進(jìn)制數(shù)字串(一串二進(jìn)制數(shù)字)。
String類型你一定不陌生,畢竟每一位coder都是從var str1 = “Hello World”過來的。
但它真的就只是如此嗎?聽我娓娓道來。
一、思考
在 Swift 開發(fā)使用字符串的過程中,你是否有思考過以下問題?
1 個(gè)字符串變量占用多少內(nèi)存?
字符串 str1、str2 的底層存儲(chǔ)有什么不同?
如果對(duì) str1、str2 進(jìn)行拼接操作,str1、str2 的底層存儲(chǔ)又會(huì)發(fā)生什么變化?
如果你能準(zhǔn)確地回答以上問題,那說明對(duì) Swift 字符串的底層存儲(chǔ)機(jī)制還是比較了解的。
二、1 個(gè)字符串變量占用多少內(nèi)存?
方法 1:MemoryLayout
首先,可以借助 Swift 自帶的 MemoryLayout 來測(cè)試一下
方法 2:匯編
另外,我們也可以借助一個(gè)強(qiáng)有力的底層分析助手—匯編語言,來窺探一下 String 的底層存儲(chǔ)
實(shí)際上分析其他語法、系統(tǒng)庫的底層,都可以借助匯編語言
比如多態(tài)的原理、泛型的原理、Array 的底層、枚舉的底層等等
另外,不僅僅是 Swift,C、C++、OC 的底層分析,依然可以借助匯編語言
畢竟你寫的每一行有效代碼,最終都是要轉(zhuǎn)成機(jī)器指令(0 和 1)
而機(jī)器指令是跟匯編指令一一對(duì)應(yīng)的,每一條機(jī)器指令都能翻譯成與之對(duì)應(yīng)的匯編指令
能讀懂匯編指令,就相當(dāng)于能讀懂機(jī)器指令,知道 CPU 具體在干嘛(操作了什么寄存器,操作了哪塊內(nèi)存)
本教程的代碼是直接跑在 Mac 的命令行(CommandLineTools)項(xiàng)目上
因此展示的匯編代碼是基于 X64 的 AT&T 格式匯編,并非 iOS 真機(jī)設(shè)備的 ARM 匯編
其實(shí)不同種類的匯編之間有極大的相似性,只是有些指令的叫法不一樣
跟微軟的 Visual Studio 一樣,Xcode 也內(nèi)置了非常方便的反匯編功能,可以輕松查看每一句代碼對(duì)應(yīng)的匯編指令,打開反匯編界面的步驟如下
在某一行需要調(diào)試的代碼打上斷點(diǎn)(反匯編界面會(huì)在斷點(diǎn)調(diào)試狀態(tài)下顯示出來)
菜單:Debug > Debug Workflow > Always Show Disassembly
Assembly 譯為匯編, Disassembly 譯為反匯編
運(yùn)行程序,看到反匯編界面
如果你的反匯編經(jīng)驗(yàn)十足,根據(jù)第 16、17 行的匯編就可以推敲出來,String 是占用 16 個(gè)字節(jié)
因?yàn)樗昧?rax、rdx 寄存器存放字符串 str 的內(nèi)容,而 rax、rdx 都是 8 字節(jié)的
匯編的內(nèi)容太多了,因?yàn)闀r(shí)間和篇幅關(guān)系,文章里并不會(huì)對(duì)每一句匯編指令進(jìn)行詳細(xì)地講解,更多的是想說明匯編的重要性。
三、字符串的底層存儲(chǔ)
窺探內(nèi)存
此前我寫了個(gè)可以窺探 Swift 變量?jī)?nèi)存的小工具:https://github.com/CoderMJLee/Mems
現(xiàn)在用它來窺探下字符串的 16 字節(jié)里面,究竟存儲(chǔ)著什么數(shù)據(jù)
Mems.memStr(ofVal:) 默認(rèn)情況下按照 8 個(gè)字節(jié)一組來顯示內(nèi)存數(shù)據(jù)
傳遞參數(shù) alignment: .one 是按照 1 個(gè)字節(jié)一組來顯示內(nèi)存數(shù)據(jù)
字符 '0'~'9' 的 ASCII 值是 0x30~0x39,認(rèn)真觀察最初 str1 的 16 個(gè)字節(jié)數(shù)據(jù),你發(fā)現(xiàn)了什么?
它直接將所有字符的 ASCII 值存儲(chǔ)在 str1 的 16 字節(jié)中
最后 1 個(gè)字節(jié) 0xea 中的 0xa 就是字符的數(shù)量,也是共 10 個(gè)字符
拼接
可以發(fā)現(xiàn),當(dāng)對(duì) str1 進(jìn)行拼接 "ABCDE" 的時(shí)候
它最終是將 "0123456789ABCDE"十五個(gè)字符的 ASCII 值都存儲(chǔ)在了 str1 的 16 字節(jié)中
最后 1 個(gè)字節(jié) 0xef 中的 0xf 就是字符的數(shù)量,也是共 15 個(gè)字符
可以看得出來,目前 16 個(gè)字節(jié)已經(jīng)存滿了,那如果再拼接 1 個(gè)字符呢?
可以看到,str1 里面存儲(chǔ)的數(shù)據(jù)發(fā)生了非常大的變化,每一個(gè)字符的 ASCII 值不見了,
那里面的 16 字節(jié)具體是什么含義呢?
所有字符('0'~'9'、'A' 到 'F')的 ASCII 值又存到哪去了呢?
其他情況
如果一開始初始化的時(shí)候(未拼接之前),字符串的內(nèi)容就是超過 15 個(gè)字符呢?
相信你能猜到是這個(gè)結(jié)果
這 16 個(gè)字節(jié)里面并沒有出現(xiàn)任何一個(gè)字符的 ASCII 值
而且這 16 個(gè)字節(jié)跟 第27行的str1 還是有所區(qū)別
雖然它們的字符串內(nèi)容都是"0123456789ABCDEF"
如果對(duì) str2 進(jìn)行拼接操作
不難發(fā)現(xiàn):這時(shí) str2 的 16 字節(jié)又發(fā)生了變化,跟 第27行的str1 是有點(diǎn)相似的
如何解決上述疑問?
上述的種種疑問,光看打印出來的內(nèi)存數(shù)據(jù)是無法解決的,但是都可以利用【?。?!匯編!??!】來解決,分析匯編指令,立馬就得出結(jié)論,因?yàn)槲恼碌钠邢蓿綍r(shí)工作也比較忙,我把上述問題的詳細(xì)剖析過程錄制成了長(zhǎng)達(dá) 2 個(gè)多小時(shí)的視頻,有興趣的朋友可以用 1.5~2 倍速度觀看
鏈接:https://pan.baidu.com/s/1AkS3K1ZKP8zyxhlhLRaBkA
提取碼:kzrk
視頻對(duì)于沒有匯編基礎(chǔ)的朋友來說,可能會(huì)有點(diǎn)難度,最好挑一個(gè)頭腦清醒的時(shí)間去觀看
看完視頻后,希望大家能夠確切地感受到匯編語言的重要性,不要永遠(yuǎn)只停留在編寫高級(jí)語言代碼、沉迷于語法糖的層面。
四、最后
人們經(jīng)常認(rèn)為匯編語言的應(yīng)用范圍很小,而忽視它的重要性。其實(shí)匯編語言對(duì)每一個(gè)希望學(xué)習(xí)計(jì)算機(jī)科學(xué)與技術(shù)的人來說都是非常重要的,是不能不學(xué)習(xí)的語言。
匯編能給你帶來的價(jià)值遠(yuǎn)遠(yuǎn)不止這篇文章所說的窺探字符串的底層,對(duì)你的程序生涯影響絕對(duì)是終生受益的(數(shù)據(jù)結(jié)構(gòu)與算法也是如此)。學(xué)會(huì)匯編后,你在用高級(jí)語言編程時(shí)會(huì)更了解機(jī)器到底做了什么,可以通過修改高級(jí)語言的代碼來提高算法所不能提高的效率。
IT技術(shù)的發(fā)展日新月異,新技術(shù)層出不窮,具有良好的學(xué)習(xí)能力,能及時(shí)獲取新知識(shí)、隨時(shí)補(bǔ)充和豐富自己,已成為程序員職業(yè)發(fā)展的核心競(jìng)爭(zhēng)力。
作為一名程序員,更需要不斷豐富自己的知識(shí)庫。我們所知道的東西,就像一個(gè)白色的圓圈,圈外則是黑暗的未知的世界。當(dāng)圓圈越大,所接觸到的黑暗部分就越多。我們只有不停地學(xué)習(xí),才能打破更多的黑暗,找到更多光明。
如果您想提升自己,學(xué)習(xí)更多如 iOS、數(shù)據(jù)結(jié)構(gòu)與算法等編程技巧,這里有免費(fèi)的相關(guān)學(xué)習(xí)資料,歡迎加微信:19950277730獲取更多技術(shù)提升秘籍。這里不僅有志同道合的小伙伴,更有無數(shù)免費(fèi)編程技巧、學(xué)習(xí)視頻和資料,加上微信來一起探討學(xué)習(xí)技術(shù)吧?。?/p>
另外有需要云服務(wù)器可以了解下創(chuàng)新互聯(lián)scvps.cn,海內(nèi)外云服務(wù)器15元起步,三天無理由+7*72小時(shí)售后在線,公司持有idc許可證,提供“云服務(wù)器、裸金屬服務(wù)器、高防服務(wù)器、香港服務(wù)器、美國服務(wù)器、虛擬主機(jī)、免備案服務(wù)器”等云主機(jī)租用服務(wù)以及企業(yè)上云的綜合解決方案,具有“安全穩(wěn)定、簡(jiǎn)單易用、服務(wù)可用性高、性價(jià)比高”等特點(diǎn)與優(yōu)勢(shì),專為企業(yè)上云打造定制,能夠滿足用戶豐富、多元化的應(yīng)用場(chǎng)景需求。