arm匯編部分: a. 條件執(zhí)行 cmp r0,#5 beq bypass add r1,r1,r0 sub r1,r1,r2 bypass ...... 可以替代為: cmp r0,#5 addne r1,r1,r0 subne r1,r1,r2 ...... 如果被跳過的指令序列并不進行復雜的操作,使用條件執(zhí)行都要比使用轉移好,因為arm轉義指令一般要用3個周期來執(zhí)行?! τ谝韵碌臈l件執(zhí)行可以這樣來寫匯編: ; if ( (a = = b) && (c = = d) ) e++ cmp r0,r1 cmpeq r2,r3 addeq r4,r4,#1 c語言部分: a. 很多人認為以下兩種變量定義空間效率一樣的:① char a;short b;char c;int d;② char a;char b;short c;int d; 其實不然,定義次序的不同導致最終映像中不同的數(shù)據(jù)布局,實際中第二種定義方式能夠節(jié)約更多的存儲空間,所以在變量聲名時,最好把所有相同類型的變量放在一起定義,這樣可以優(yōu)化存儲器布局?! . 我們總是設法使用short或者char來定義變量,認為這樣能夠節(jié)省存儲空間,但也有例外,我們先來看下這幾段c代碼及其相應的匯編: ?、?c代碼:int addition(int a) { return a+1; } 匯編: add a1,a1,#1 ?、?c代碼: short addition(short a){ return a+1; } 匯編:add a1,a1,#1mov a1,a1,lsl #16mov a1,a1,asr #16mov pc,lr ?、?c代碼: char addition(char a){ return a+1; } 匯編:add a1,a1,#1and a1,a1,# &ffmov pc,lr 因為char 類型、short類型分別是8位、16位,完成加法操作后,需要在32位的寄存器中進行符號擴展,所以使用32位的int以及unsinged int做加法效率最高。 c.冗余變量要消耗空間,許多人都不贊同使用它,但是下面這種情況就不同了。int m ( void ); int n ( void ); int fg; ?、?void func_1 ( void ){ fg += m ( );fg += n ( );} ?、?void func_2 ( void ) { int tmp = fg; tmp += m ( ); tmp += n ( ); fg = tmp;} 在func_1 ( ) 中每次對全局變量fg的加法操作都需要從存儲器load到寄存器里,加完數(shù)據(jù)后還要store回原來的存儲器,所以這個函數(shù)就進行了兩次load和兩次store操作。在func_2 ( ) 中,tmp作為局部變量,系統(tǒng)為其分配一寄存器,首先執(zhí)行一次load操作后,由tmp進行加法,最后只需一次store操作把結果送給fg,節(jié)省了很多時間,畢竟讀/寫存儲器的時間耗費要比讀/寫寄存器高得多?! .關于計數(shù)循環(huán)的問題,一般我們都會使用累加計數(shù)的方式,遞減計數(shù)用得比較少,雖然從c代碼上看累加和遞減兩種方式時間復雜度相同,但是在對時間要求嚴格的嵌入式領域,這兩者執(zhí)行時間還是有差別的?! 、?累加計數(shù)方式: for ( i = 1; i < times; i ++ ) { tmp = tmp * i ;} 匯編:……0x06: mul r2,r1,r20x10: add r1,r1,#10x14: cmp r2,r00x18: ble 0x06…… ② 遞減計數(shù)方式: for ( i = times; i > 1; i -- ) { tmp = tmp * i ;} 匯編:……0x06: mul r0,r1,r00x10: sub r1,r1,#10x14: bne 0x06 …… 從上面的匯編可以看出,累加計數(shù)需要用到專門的cmp指令來判斷條件,而遞減計數(shù)只需要利用條件執(zhí)行的ne進行判別,當循環(huán)次數(shù)的量很大的話時間效率就有差別了。





