本篇內(nèi)容介紹了“怎么從0學ARM匯編偽指令LDS”的有關知識,在實際案例的操作過程中,不少人都會遇到這樣的困境,接下來就讓小編帶領大家學習一下如何處理這些情況吧!希望大家仔細閱讀,能夠?qū)W有所成!
創(chuàng)新互聯(lián)公司主要從事成都網(wǎng)站設計、網(wǎng)站制作、網(wǎng)頁設計、企業(yè)做網(wǎng)站、公司建網(wǎng)站等業(yè)務。立足成都服務瑪納斯,10余年網(wǎng)站建設經(jīng)驗,價格優(yōu)惠、服務專業(yè),歡迎來電咨詢建站服務:13518219792
一、MDK和/GNU偽指令區(qū)別
我們在學習匯編代碼的時候經(jīng)過會看到以下兩種風格的代碼:
gnu代碼開頭是:
.global _start _start: @匯編入口 ldr sp,=0x41000000 .end @匯編程序結束
MDK代碼開頭是:
AREA Example,CODE,READONLY ;聲明代碼段Example ENTRY ;程序入口 Start MOV R0,#0 OVER END
這兩種風格的代碼是要使用不同的編譯器,我們之前的實例代碼都是MDK風格的。
那么多對于我們初學者來說要學習哪種風格呢?答案是肯定的,學習GNU風格的匯編代碼,因為做Linux驅(qū)動開發(fā)必須掌握的linux內(nèi)核、uboot,而這兩個軟件就是GNU風格的。
為了大家不要把過多精力浪費在暫時沒用的知識上,下面我們只講GNU風格匯編。
二、GNU匯編書寫格式:
1. 代碼行中的注釋符號:
‘@’ 整行注釋符號: ‘#’ 語句分離符號:
直接操作數(shù)前綴: ‘#’ 或 ‘$’
2. 全局標號:
標號只能由a~z,A~Z,0~9,“.”,_等(由點、字母、數(shù)字、下劃線等組成,除局部標號外,不能以數(shù)字開頭)字符組成,標號的后面加“:”。
段內(nèi)標號的地址值在匯編時確定;段外標號的地址值在連接時確定。
3. 局部標號:
局部標號主要在局部范圍內(nèi)使用而且局部標號可以重復出現(xiàn)。它由兩部組成開頭是一個0-99直接的數(shù)字局部標號 后面加“:”
F:指示編譯器只向前搜索,代碼行數(shù)增加的方向 / 代碼的下一句 B:指示編譯器只向后搜索,代碼行數(shù)減小的方向
注意局部標號的跳轉(zhuǎn),就近原則「舉例:」
文件位置 arch/arm/kernel/entry-armv.S
三、偽操作:
1. 符號定義偽指令
2. 數(shù)據(jù)定義(Data Definition)偽操作
數(shù)據(jù)定義偽操作一般用于為特定的數(shù)據(jù)分配存儲單元,同時可完成已分配存儲單元的初始化。常見的數(shù)據(jù)定義偽操作有如下幾種:
【舉例】
.word
val: .word 0x11223344 mov r1,#val ;將值0x11223344設置到寄存器r1中
.space
label: .space size,expr ;expr可以是4字節(jié)以內(nèi)的浮點數(shù) a: space 8, 0x1
.rept
.rept cnt ;cnt是重復次數(shù) .endr
注意:
鴻蒙官方戰(zhàn)略合作共建——HarmonyOS技術社區(qū)
變量的定義放在,stop后,.end前
標號是地址的助記符,標號不占存儲空間。位置在end前就可以,相對隨意。
3. if選擇
語法結構
.if logical-expressing …… .else …… .endif
類似c語言里的條件編譯 。
【舉例】
.if val2==1 mov r1,#val2 .endif
4. macro宏定義.
macro,.endm 宏定義類似c語言里的宏函數(shù) 。
macro偽操作可以將一段代碼定義為一個整體,稱為宏指令。然后就可以在程序中通過宏指令多次調(diào)用該段代碼。
語法格式:
.macro {$label} 名字{$parameter{,$parameter}…} ……..code .endm
其中,$標號在宏指令被展開時,標號會被替換為用戶定義的符號。
宏操作可以使用一個或多個參數(shù),當宏操作被展開時,這些參數(shù)被相應的值替換。
「注意」:先定義后使用
舉例:
「【例1】:沒有參數(shù)的宏實現(xiàn)子函數(shù)返回」
.macro MOV_PC_LR
MOV PC,LR
.endm
調(diào)用方式如下: MOV_PC_LR
「【例2】:帶參數(shù)宏實現(xiàn)子函數(shù)返回」
.macro MOV_PC_LR ,param mov r1,\param MOV PC,LR .endm
調(diào)用方法如下:
MOV_PC_LR #12
四、雜項偽操作
舉例:.set
.set start, 0x40 mov r1, #start ;r1里面是0x40
舉例 .equ
.equ start, 0x40 mov r1, #start ;r1里面是0x40
#define PI 3.1415
等價于
.equ PI, 31415
五、GNU偽指令
關鍵點:偽指令在編譯時會轉(zhuǎn)化為對應的ARM指令
1.ADR偽指令 :該指令把標簽所在的地址加載到寄存器中。ADR偽指令為小范圍地址讀取偽指令,使用的相對偏移范圍:當?shù)刂分凳亲止?jié)對齊 (8位) 時,取值范圍為-255~255,當?shù)刂分凳亲謱R (32位) 時,取值范圍為-1020~1020。語法格式:
ADR{cond} register,label R R0, lable
2.ADRL偽指令:將中等范圍地址讀取到寄存器中
ADRL偽指令為中等范圍地址讀取偽指令。使用相對偏移范圍:當?shù)刂分凳亲止?jié)對齊時,取值范圍為-64~64KB;當?shù)刂分凳亲謱R時,取值范圍為-256~256KB
語法格式:
ADRL{cond} register,label ADRL R0,lable
3.LDR偽指令: LDR偽指令裝載一個32位的常數(shù)和一個地址到寄存器。語法格式:
LDR{cond} register,=[expr|label-expr] LDR R0,=0XFFFF0000 ;mov r1,#0x12 對比一下
注意:(1)ldr偽指令和ldr指令區(qū)分 下面是ldr偽指令:
ldr r1,=val @ r1 = val 是偽指令,將val標號地址賦給r1 【與MDK不一樣,MDK只支持ldr r1,=val】
下面是ldr指令:
ldr r2,val @ r1 = *val 是arm指令,將標號val地址里的內(nèi)容給r2 val: .word 0x11223344
(2)如何利用ldr偽指令實現(xiàn)長跳轉(zhuǎn)
ldr pc,=32位地址
(3)編碼中解決非立即數(shù)的問題 用arm偽指令ldr
ldr r0,=0x999 ;0x999 不是立即數(shù),
六、GNU匯編的編譯
1. 不含lds文件的編譯
假設我們有以下代碼,包括1個main.c文件,1個start.s文件:start.s
.global _start _start: @匯編入口 ldr sp,=0x41000000 b main .global mystrcopy .text mystrcopy: //參數(shù)dest->r0,src->r2 LDRB r2, [r1], #1 STRB r2, [r0], #1 CMP r2, #0 //判斷是不是字符串尾 BNE mystrcopy MOV pc, lr stop: b stop @死循環(huán),防止跑飛 等價于while(1) .end @匯編程序結束
main.c
extern void mystrcopy(char *d,const char *s); int main(void) { const char *src ="yikoulinux"; char dest[20]={}; mystrcopy(dest,src);//調(diào)用匯編實現(xiàn)的mystrcopy函數(shù) while(1); return 0; }
Makefile編寫方法如下:
1. TARGET=start 2. TARGETC=main 3. all: 4. arm-none-linux-gnueabi-gcc -O0 -g -c -o $(TARGETC).o $(TARGETC).c 5. arm-none-linux-gnueabi-gcc -O0 -g -c -o $(TARGET).o $(TARGET).s 6. #arm-none-linux-gnueabi-gcc -O0 -g -S -o $(TARGETC).s $(TARGETC).c 7. arm-none-linux-gnueabi-ld $(TARGETC).o $(TARGET).o -Ttext 0x40008000 -o $(TARGET).elf 8. arm-none-linux-gnueabi-objcopy -O binary -S $(TARGET).elf $(TARGET).bin 9. clean: 10. rm -rf *.o *.elf *.dis *.bin
Makefile含義如下:
鴻蒙官方戰(zhàn)略合作共建——HarmonyOS技術社區(qū)
定義環(huán)境變量TARGET=start,start為匯編文件的文件名
定義環(huán)境變量TARGETC=main,main為c語言文件
目標:all,4~8行是該指令的指令語句
將main.c編譯生成main.o,$(TARGETC)會被替換成main
將start.s編譯生成start.o,$(TARGET)會被替換成start
4-5也可以用該行1條指令實現(xiàn)
通過ld命令將main.o、start.o鏈接生成start.elf,-Ttext 0x40008000表示設置代碼段起始地址為0x40008000
通過objcopy將start.elf轉(zhuǎn)換成start.bin文件,-O binary (或--out-target=binary) 輸出為原始的二進制文件,-S (或 --strip-all)輸出文件中不要重定位信息和符號信息,縮小了文件尺寸,
clean目標
clean目標的執(zhí)行語句,刪除編譯產(chǎn)生的臨時文件
【補充】
鴻蒙官方戰(zhàn)略合作共建——HarmonyOS技術社區(qū)
gcc的代碼優(yōu)化級別,在 makefile 文件中的編譯命令 4級 O0 -- O3 數(shù)字越大,優(yōu)化程度越高。O3最大優(yōu)化
volatile作用 volatile修飾的變量,編譯器不再進行優(yōu)化,每次都真正訪問內(nèi)存地址空間。
2. 依賴lds文件編譯
實際的工程文件,段復雜程度遠比我們這個要復雜的多,尤其Linux內(nèi)核有幾萬個文件,段的分布及其復雜,所以這就需要我們借助lds文件來定義內(nèi)存的分布。
文件列表
main.c和start.s和上一節(jié)一致。
map.lds
OUTPUT_FORMAT("elf32-littlearm", "elf32-littlearm", "elf32-littlearm") /*OUTPUT_FORMAT("elf32-arm", "elf32-arm", "elf32-arm")*/ OUTPUT_ARCH(arm) ENTRY(_start) SECTIONS { . = 0x40008000; . = ALIGN(4); .text : { .start.o(.text) *(.text) } . = ALIGN(4); .rodata : { *(.rodata) } . = ALIGN(4); .data : { *(.data) } . = ALIGN(4); .bss : { *(.bss) } }
解釋一下上述的例子:
鴻蒙官方戰(zhàn)略合作共建——HarmonyOS技術社區(qū)
OUTPUT_FORMAT("elf32-littlearm", "elf32-littlearm", "elf32-littlearm") 指定輸出object檔案預設的binary 文件格式??梢允褂胦bjdump -i列出支持的binary 文件格式;
OUTPUT_ARCH(arm) 指定輸出的平臺為arm,可以透過objdump -i查詢支持平臺;
ENTRY(_start) :將符號_start的值設置成入口地址;
. = 0x40008000: 把定位器符號置為0x40008000(若不指定, 則該符號的初始值為0);
.text : { .start.o(.text) *(.text) } :前者表示將start.o放到text段的第一個位置,后者表示將所有(*符號代表任意輸入文件)輸入文件的.text section合并成一個.text section;
.rodata : { *(.data) } : 將所有輸入文件的.rodata section合并成一個.rodata section;
.data : { *(.data) } : 將所有輸入文件的.data section合并成一個.data section;
.bss : { *(.bss) } : 將所有輸入文件的.bss section合并成一個.bss section;該段通常存放全局未初始化變量
. = ALIGN(4);表示下面的段4字節(jié)對齊
連接器每讀完一個section描述后, 將定位器符號的值增加該section的大小。
來看下,Makefile應該如何寫:
# CORTEX-A9 PERI DRIVER CODE # VERSION 1.0 # ATHUOR 一口Linux # MODIFY DATE # 2020.11.17 Makefile #=================================================# CROSS_COMPILE = arm-none-linux-gnueabi- NAME =start CFLAGS=-mfloat-abi=softfp -mfpu=vfpv3 -mabi=apcs-gnu -fno-builtin -fno-builtin-function -g -O0 -c LD = $(CROSS_COMPILE)ld CC = $(CROSS_COMPILE)gcc OBJCOPY = $(CROSS_COMPILE)objcopy OBJDUMP = $(CROSS_COMPILE)objdump OBJS=start.o main.o #================================================# all: $(OBJS) $(LD) $(OBJS) -T map.lds -o $(NAME).elf $(OBJCOPY) -O binary $(NAME).elf $(NAME).bin $(OBJDUMP) -D $(NAME).elf > $(NAME).dis %.o: %.S $(CC) $(CFLAGS) -c -o $@ $< %.o: %.s $(CC) $(CFLAGS) -c -o $@ $< %.o: %.c $(CC) $(CFLAGS) -c -o $@ $< clean: rm -rf $(OBJS) *.elf *.bin *.dis *.o
編譯結果如下:
編譯結果
最終生成start.bin,改文件可以燒錄到開發(fā)板測試,因為本例沒有直觀現(xiàn)象,后續(xù)文章我們加入其它功能再測試。
【注意】
鴻蒙官方戰(zhàn)略合作共建——HarmonyOS技術社區(qū)
其中交叉編譯工具鏈「arm-none-linux-gnueabi-」 要根據(jù)自己實際的平臺來選擇,本例是基于三星的exynos-4412工具鏈實現(xiàn)的。
地址0x40008000也不是隨便選擇的,
exynos4412 地址分布
讀者可以根據(jù)自己手里的開發(fā)板對應的soc手冊查找該地址。
linux內(nèi)核的異常向量表
linux內(nèi)核的內(nèi)存分布也是依賴lds文件定義的,linux內(nèi)核的編譯我們暫不討論,編譯好之后會再以下位置生成對應的lds文件:
arch/arm/kernel/vmlinux.lds
我們看下該文件的部分內(nèi)容:
vmlinux.lds
OUTPUT_ARCH(arm)制定對應的處理器;
ENTRY(stext)表示程序的入口是stext。
同時我們也可以看到linux內(nèi)存的劃分更加的復雜,后續(xù)我們討論linux內(nèi)核,再繼續(xù)分析該文件。
3. elf文件和bin文件區(qū)別:
1) ELF
ELF文件格式是一個開放標準,各種UNIX系統(tǒng)的可執(zhí)行文件都采用ELF格式,它有三種不同的類型:
可重定位的目標文件(Relocatable,或者Object File)
可執(zhí)行文件(Executable)
共享庫(Shared Object,或者Shared Library)
ELF格式提供了兩種不同的視角,鏈接器把ELF文件看成是Section的集合,而加載器把ELF文件看成是Segment的集合。
2) bin
BIN文件是直接的二進制文件,內(nèi)部沒有地址標記。bin文件內(nèi)部數(shù)據(jù)按照代碼段或者數(shù)據(jù)段的物理空間地址來排列。一般用編程器燒寫時從00開始,而如果下載運行,則下載到編譯時的地址即可。
在Linux OS上,為了運行可執(zhí)行文件,他們是遵循ELF格式的,通常gcc -o test test.c,生成的test文件就是ELF格式的,這樣就可以運行了,執(zhí)行elf文件,則內(nèi)核會使用加載器來解析elf文件并執(zhí)行。
在Embedded中,如果上電開始運行,沒有OS系統(tǒng),如果將ELF格式的文件燒寫進去,包含一些ELF文件的符號表字符表之類的section,運行碰到這些,就會導致失敗,如果用objcopy生成純粹的二進制文件,去除掉符號表之類的section,只將代碼段數(shù)據(jù)段保留下來,程序就可以一步一步運行。
elf文件里面包含了符號表等。BIN文件是將elf文件中的代碼段,數(shù)據(jù)段,還有一些自定義的段抽取出來做成的一個內(nèi)存的鏡像。
并且elf文件中代碼段數(shù)據(jù)段的位置并不是它實際的物理位置。他實際物理位置是在表中標記出來的。
“怎么從0學ARM匯編偽指令LDS”的內(nèi)容就介紹到這里了,感謝大家的閱讀。如果想了解更多行業(yè)相關的知識可以關注創(chuàng)新互聯(lián)網(wǎng)站,小編將為大家輸出更多高質(zhì)量的實用文章!