
帶連接和狀態(tài)切換的跳轉(zhuǎn)指令BLX(Branch with Link Exchange)使用標(biāo)號,用于使程序跳轉(zhuǎn)到Thumb狀態(tài)或從Thumb狀態(tài)返回。該指令為無條件執(zhí)行指令,并用分支寄存器的最低位來更新CPSR中的T位,將返回地址寫入到連接寄存器LR中。
帶連接和狀態(tài)切換的跳轉(zhuǎn)指令BLX(Branch with Link Exchange)使用一個(gè)寄存器中的絕對地址,用于使程序跳轉(zhuǎn)到Thumb狀態(tài)或從Thumb狀態(tài)返回。該指令用分支寄存器的最低位來更新CPSR中的T位,將返回地址寫入到連接寄存器LR中。
ARM體系結(jié)構(gòu)允許通過增加協(xié)處理器來擴(kuò)展指令集。最常用的協(xié)處理器是用于控制片上功能的系統(tǒng)協(xié)處理器。例如控制Cache和存儲(chǔ)管理單元的CP15寄存器。此外,還有用于浮點(diǎn)運(yùn)算的浮點(diǎn)ARM協(xié)處理器,各生產(chǎn)商還可以根據(jù)需要開發(fā)自己的專用協(xié)處理器。
ARM指令集提供了兩條指令,可直接控制程序狀態(tài)寄存器psr。MRS指令用于把cpsr或者spsr的值傳送到一個(gè)寄存器;MSR與之相反,它將一個(gè)寄存器的內(nèi)容傳送到cpsr或者spsr。這兩條指令結(jié)合,可用于對cpsr和spsr進(jìn)行讀/寫操作。
ARMv5及其以上版本提供了一條新的指令——零計(jì)數(shù)指令CLZ(Count Leading Zeros)。該指令用于計(jì)算最高符號位與第一個(gè)1之間的0的個(gè)數(shù)。當(dāng)一些操作數(shù)需要規(guī)范化(使其最高位為1)時(shí),該指令用于計(jì)算操作數(shù)需要左移的位數(shù)。
交換指令是load/Store指令的一種特殊形式。該指令將一個(gè)存儲(chǔ)器單元內(nèi)容與指定的寄存器內(nèi)容相交換。交換指令為進(jìn)程間同步提供了一種方便的解決途徑。該指令產(chǎn)生一對原子Load/Store操作,該操作發(fā)生在一個(gè)連續(xù)的總線操作中,在操作期間阻止其他任何指令對該存儲(chǔ)單元的讀/寫。
ARM指令集中提供了兩條產(chǎn)生異常的指令,通過這兩條指令可以用軟件的方法實(shí)現(xiàn)異常。表9.4總結(jié)了ARM異常產(chǎn)生指令。
Thumb指令集支持寄存器的裝載和存儲(chǔ),即LDR和STR指令。8和類型的Load/Store指令在Thumb指令集中可用。這些指令使用兩種尋址模式:寄存器偏移和立即數(shù)偏移。指令所能存取的數(shù)據(jù)包括字、半字和字節(jié),同時(shí)半字和字節(jié)可以為有符號數(shù)或無符號數(shù)。
Thumb中有兩個(gè)分支跳轉(zhuǎn)指令的變體,第一個(gè)變體與ARM版本指令相似,可條件執(zhí)行,跳轉(zhuǎn)被限制在有符號8位立即數(shù)所表示的范圍內(nèi),或者是±256B。第二個(gè)變體不可條件執(zhí)行(沒有條件碼部分),但擴(kuò)展了有效跳轉(zhuǎn)范圍,跳轉(zhuǎn)范圍為有符號11位立即數(shù)表示的范圍,即±2048B。
ARM匯編器支持ARM偽指令,這些偽指令在匯編階段被翻譯成ARM或者Thumb(或Thumb-2)指令(或指令序列)。ARM偽指令包含ADR、ADRL、MOV32和LDR。
程序符號。通常為地址標(biāo)號(label)。在指令和偽指令中通常為標(biāo)號;在一些偽操作中符號可能是變量或常數(shù)。詳見ARM偽操作一節(jié)。
armasm是ARM匯編語言的交叉編譯器,本節(jié)將詳細(xì)介紹它的使用方法。
Thumb指令集把32位ARM指令集的一個(gè)子集編碼為一個(gè)16位的指令集。在16位外部數(shù)據(jù)總線寬度下,ARM處理器上使用Thumb指令的性能要比使用ARM指令的性能更好。
所有的Thumb指令都是16位的。它們都是ARM指令重新編碼得到的,所以繼承了ARM指令集的許多特點(diǎn)。
Thumb異常中斷產(chǎn)生指令與ARM指令集下的異常中斷指令十分相似。同ARM指令集相同,Thumb指令集中同樣包含兩條異常中斷產(chǎn)生指令:軟件中斷指令SWI用于產(chǎn)生SWI異常中斷;斷點(diǎn)中斷指令BKPT主要用于產(chǎn)生軟件斷點(diǎn),供調(diào)試程序使用(只在ARMv5及以上版本中使用)。
對3級流水線的ARM處理器來說,做相對較小的改動(dòng)就可以實(shí)現(xiàn)Thumb指令集(5級流水線的實(shí)現(xiàn)要復(fù)雜些)。為實(shí)現(xiàn)Thumb指令集,在指令流水線中增加了Thumb指令解碼邏輯,該解碼邏輯將預(yù)取的Thumb指令轉(zhuǎn)換成等價(jià)的ARM指令。圖11.66顯示了Thumb指令的擴(kuò)展邏輯組織。
Thumb以其較高的代碼密度和在窄存儲(chǔ)器上的性能,使得它在很多系統(tǒng)中得到廣泛應(yīng)用。但在很多情況下,還是不得不使用ARM指令,這是因?yàn)椋?/p>
內(nèi)聯(lián)匯編和嵌入型匯編是包含在C/C++編譯器中的匯編器。使用它可以在C/C++程序中實(shí)現(xiàn)C/C++語言不能完成的一些工作。例如,在下面幾種情況中必須使用內(nèi)聯(lián)匯編或嵌入型匯編。
多數(shù)嵌入式應(yīng)用程序最初都是在原型環(huán)境下開發(fā)的。無論什么樣的原型仿真環(huán)境與最終產(chǎn)品環(huán)境都是有差異的。因此,考慮如何將嵌入式應(yīng)用程序從其所依賴的開發(fā)工具或調(diào)試環(huán)境中移植到在目標(biāo)硬件上獨(dú)立運(yùn)行是非常重要的。
在匯編代碼中訪問C全局變量,只能通過地址間接訪問全局變量。要訪問全局變量,必須在匯編中使用 IMPORT 偽操作輸入全局變量,然后將地址載入寄存器??梢愿鶕?jù)變量的類型使用載入和存儲(chǔ)指令訪問該變量。