這篇“C語言位域和字節(jié)序的關(guān)系實(shí)例分析”文章的知識(shí)點(diǎn)大部分人都不太理解,所以小編給大家總結(jié)了以下內(nèi)容,內(nèi)容詳細(xì),步驟清晰,具有一定的借鑒價(jià)值,希望大家閱讀完這篇文章能有所收獲,下面我們一起來看看這篇“C語言位域和字節(jié)序的關(guān)系實(shí)例分析”文章吧。
創(chuàng)新互聯(lián)建站長(zhǎng)期為成百上千客戶提供的網(wǎng)站建設(shè)服務(wù),團(tuán)隊(duì)從業(yè)經(jīng)驗(yàn)10年,關(guān)注不同地域、不同群體,并針對(duì)不同對(duì)象提供差異化的產(chǎn)品和服務(wù);打造開放共贏平臺(tái),與合作伙伴共同營(yíng)造健康的互聯(lián)網(wǎng)生態(tài)環(huán)境。為田林企業(yè)提供專業(yè)的成都網(wǎng)站設(shè)計(jì)、成都做網(wǎng)站、外貿(mào)網(wǎng)站建設(shè),田林網(wǎng)站改版等技術(shù)服務(wù)。擁有十載豐富建站經(jīng)驗(yàn)和眾多成功案例,為您定制開發(fā)。自己編寫的一個(gè)協(xié)議相關(guān)代碼,位域的值解析和自己想象的有出入。
問題
結(jié)構(gòu)體的頭:
解析代碼和測(cè)試結(jié)果:
就是說通過函數(shù)hexdump()解析出的內(nèi)存是十六進(jìn)制是 81 83 20 3B ......
從數(shù)據(jù)幀解析出的
opcode = 0x8
該粉絲不明白為什么解析出的值是0x8。
這個(gè)問題其實(shí)就是位域的問題和字節(jié)序的問題。
測(cè)試代碼
廢話不多說,直接寫個(gè)測(cè)試代碼
#include//簡(jiǎn)化的結(jié)構(gòu)體 struct iphdr { unsigned char fin:1; unsigned char rsv:3; unsigned char opcode:4; unsigned char mask:1; unsigned char payload:7; unsigned char a; unsigned char b; }; main() { struct iphdr t; unsigned char *s; //清空內(nèi)存,防止有亂碼 memset(&t,0,4); //用指針指向結(jié)構(gòu)體變量t s = (unsigned char*)&t; //通過數(shù)組訪問的方式修改內(nèi)存的值,因?yàn)閔exdump解析的值是0x81 83, //所以0x81必為最低字節(jié)的內(nèi)存的數(shù)據(jù) s[0] = 0x81; s[1] = 0x83; //打印出位域成員的值 printf("fin:%d rsv:%d opcode:%d mask:%d paylod:%d \n", t.fin,t.rsv,t.opcode,t.mask,t.payload); }
執(zhí)行結(jié)果:
fin:1,rsv:0,opcode:8,mask:1 paylod:65
分析:如下圖所示,紫色部分是位域成員對(duì)應(yīng)的內(nèi)存中的實(shí)際空間布局,地址從左到右增加 第一個(gè)字節(jié)的0x81賦值后,各位域?qū)?yīng)的二進(jìn)制:
fin:1 rsv:0 opcode:1000 mask:1 paylod:1000001
如上圖多少,內(nèi)存的第1個(gè)字節(jié)是0x81,第2個(gè)字節(jié)是0x83;
第一個(gè)字節(jié)0x81的最低的bit[0]對(duì)應(yīng)fin,bit[3:1]對(duì)應(yīng)rsv,bit[7:4]對(duì)應(yīng)opcode;第二個(gè)字節(jié)0x83的最低bit[0]對(duì)應(yīng)mask,bit[7:1]對(duì)應(yīng)payload。
所以結(jié)果顯而易見。
有些信息在存儲(chǔ)時(shí),并不需要占用一個(gè)完整的字節(jié), 而只需占幾個(gè)或一個(gè)二進(jìn)制位。
例如在存放一個(gè)開關(guān)量時(shí),只有0和1 兩種狀態(tài), 用一位二進(jìn)位即可。為了節(jié)省存儲(chǔ)空間,并使處理簡(jiǎn)便,C語言又提供了一種數(shù)據(jù)結(jié)構(gòu),稱為“位域”或“位段”。
所謂“位域”是把一個(gè)字節(jié)中的二進(jìn)位劃分為幾個(gè)不同的區(qū)域,并說明每個(gè)區(qū)域的位數(shù)。
每個(gè)域有一個(gè)域名,允許在程序中按域名進(jìn)行操作。這樣就可以把幾個(gè)不同的對(duì)象用一個(gè)字節(jié)的二進(jìn)制位域來表示。一、位域的定義和位域變量的說明位域定義與結(jié)構(gòu)定義相仿,其形式為:
struct 位域結(jié)構(gòu)名 { 位域列表 };
其中位域列表的形式為:
類型說明符 位域名:位域長(zhǎng)度
如粉絲所舉的實(shí)例:
struct iphdr { unsigned char fin:1; unsigned char rsv:3; unsigned char opcode:4; unsigned char mask:1; unsigned char payload:7; unsigned char a; unsigned char b; };
位域變量的說明與結(jié)構(gòu)變量說明的方式相同。可采用先定義后說明,同時(shí)定義說明或者直接說明這三種方式。例如:
struct bs { int a:8; int b:2; int c:6; }data;
說明data為bs變量,共占兩個(gè)字節(jié)。其中位域a占8位,位域b占2位,位域c占6位。對(duì)于位域的定義尚有以下幾點(diǎn)說明:
一個(gè)位域必須存儲(chǔ)在同一個(gè)字節(jié)中,不能跨兩個(gè)字節(jié)。
如一個(gè)字節(jié)所剩空間不夠存放另一位域時(shí),應(yīng)從下一單元起存放該位域。也可以有意使某位域從下一單元開始。例如:
struct bs { unsigned a:4 unsigned :0 /空域/ unsigned b:4 /從下一單元開始存放/ unsigned c:4 };
在這個(gè)位域定義中,a占第一字節(jié)的4位,后4位填0表示不使用,b從第二字節(jié)開始,占用4位,c占用4位。
位域可以無位域名,這時(shí)它只用來作填充或調(diào)整位置。無名的位域是不能使用的。例如:
struct k { int a:1 int :2 /該2位不能使用/ int b:3 int c:2 };
從以上分析可以看出,位域在本質(zhì)上就是一種結(jié)構(gòu)類型, 不過其成員是按二進(jìn)位分配的。
這是位域操作的表示方法,也就是說后面加上“:1”的意思是這個(gè)成員的大小占所定義類型的1 bit,“:2”占2 bit,依次類推。當(dāng)然大小不能超過所定義類型包含的總bit數(shù)。
一個(gè)bytes(字節(jié))是8個(gè) bit(二進(jìn)制位)。例如你的結(jié)構(gòu)體中定義的類型是u_char,一個(gè)字節(jié),共8個(gè)bit,較大就不能超過8。32位機(jī)下,short是2字節(jié),共16bit,較大就不能超過16,int是4字節(jié),共32bit,較大就不能超過32. 依次類推。
位域定義比較省空間。
例如你上面的結(jié)構(gòu),定義的變量類型是u_char,是一字節(jié)類型,即8bit。
fc_subtype占了4bit,fc_type占2bit,fc_protocol_version占2bit,共8bit,正好是一個(gè)字節(jié)。
其他八個(gè)成員,各占1bit,共8bit,正好也是一個(gè)字節(jié)。
因此你的結(jié)構(gòu)的大小如果用sizeof(struct frame_control)計(jì)算,就是2bytes。
計(jì)算機(jī)硬件有兩種儲(chǔ)存數(shù)據(jù)的方式:大端字節(jié)序(big endian)和小端字節(jié)序(little endian)。大端字節(jié)序:高位字節(jié)在前,低位字節(jié)在后,這是人類讀寫數(shù)值的方法。小端字節(jié)序:低位字節(jié)在前,高位字節(jié)在后。
0x1234567的大端字節(jié)序和小端字節(jié)序的寫法如下圖。
為什么會(huì)有小端字節(jié)序?
答案是,計(jì)算機(jī)電路先處理低位字節(jié),效率比較高,因?yàn)橛?jì)算都是從低位開始的。所以,計(jì)算機(jī)的內(nèi)部處理都是小端字節(jié)序。
但是,人類還是習(xí)慣讀寫大端字節(jié)序。所以,除了計(jì)算機(jī)的內(nèi)部處理,其他的場(chǎng)合幾乎都是大端字節(jié)序,比如網(wǎng)絡(luò)傳輸和文件儲(chǔ)存。
計(jì)算機(jī)處理字節(jié)序的時(shí)候,不知道什么是高位字節(jié),什么是低位字節(jié)。它只知道按順序讀取字節(jié),先讀第一個(gè)字節(jié),再讀第二個(gè)字節(jié)。
如果是大端字節(jié)序,先讀到的就是高位字節(jié),后讀到的就是低位字節(jié)。小端字節(jié)序正好相反。
理解這一點(diǎn),才能理解計(jì)算機(jī)如何處理字節(jié)序。
處理器讀取外部數(shù)據(jù)的時(shí)候,必須知道數(shù)據(jù)的字節(jié)序,將其轉(zhuǎn)成正確的值。然后,就正常使用這個(gè)值,完全不用再考慮字節(jié)序。
即使是向外部設(shè)備寫入數(shù)據(jù),也不用考慮字節(jié)序,正常寫入一個(gè)值即可。外部設(shè)備會(huì)自己處理字節(jié)序的問題。
實(shí)例
仍然用上面的例子,但是做如下修改
#includestruct iphdr { unsigned char fin:1; unsigned char rsv:3; unsigned char opcode:4; unsigned char mask:1; unsigned char payload:7; }; main() { struct iphdr t; unsigned short *s; memset(&t,0,2); s = (unsigned char *)&t; //注意,直接賦值0x8183,因?yàn)樵摮A勘厝缓椭鳈C(jī)字節(jié)序一致, //小端:83給低字節(jié), //大端:81給低字節(jié) *s = 0x8183; printf("fin:%d rsv:%d opcode:%d mask:%d paylod:%d \n", t.fin,t.rsv,t.opcode,t.mask,t.payload); }
執(zhí)行結(jié)果:
fin:1 rsv:1 opcode:8 mask:1 paylod:64
由結(jié)果可知,收到的0x8183這個(gè)值與對(duì)應(yīng)的的二進(jìn)制關(guān)系:
fin:1 rsv:001 opcode:1000 mask:1 paylod:1000000
如上圖多少,內(nèi)存的第1個(gè)字節(jié)是0x83,第2個(gè)字節(jié)是0x81【和前面的例子不一樣了,因?yàn)槲覀兪侵苯淤x值0x8183,而該常數(shù)是小字節(jié)序,所以低字節(jié)是0x83】;
可見:
低字節(jié)83給了 fin+rsv+opcode
所以,這說明了一口君的ubuntu是小端字節(jié)序。
繼續(xù)將結(jié)構(gòu)體做如下修改,當(dāng)位域成員大小加一起不夠一個(gè)整字節(jié)的時(shí)候,驗(yàn)證各成員在內(nèi)存中的布局。
#includestruct iphdr { unsigned char fin:1; unsigned char opcode:4; unsigned char a; unsigned char b; }; main() { struct iphdr t; unsigned char *s; memset(&t,0,2); s = (unsigned short *)&t; t.fin = 1; t.opcode = 0xf; printf("%x\n",s[0]); }
fin:1 opcode:1111
內(nèi)存中形式如下:
如果修改fin的值為0:
t.fin = 0;
執(zhí)行結(jié)果如下:
fin:0 opcode:1111
內(nèi)存中形式如下:
以上就是關(guān)于“C語言位域和字節(jié)序的關(guān)系實(shí)例分析”這篇文章的內(nèi)容,相信大家都有了一定的了解,希望小編分享的內(nèi)容對(duì)大家有幫助,若想了解更多相關(guān)的知識(shí)內(nèi)容,請(qǐng)關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道。