日本黄色一级经典视频|伊人久久精品视频|亚洲黄色色周成人视频九九九|av免费网址黄色小短片|黄色Av无码亚洲成年人|亚洲1区2区3区无码|真人黄片免费观看|无码一级小说欧美日免费三级|日韩中文字幕91在线看|精品久久久无码中文字幕边打电话

當(dāng)前位置:首頁 > 嵌入式 > 嵌入式教程
[導(dǎo)讀]因?yàn)锳RM體系結(jié)構(gòu)本身并不包含除法運(yùn)算硬件,所以在ARM上實(shí)現(xiàn)除法是十分耗時(shí)的。ARM指令集中沒有直接提供除法匯編指令,當(dāng)代碼中出現(xiàn)除法運(yùn)算時(shí),ARM編譯器會調(diào)用C庫函數(shù)(有符合除法調(diào)用_rt_sdiv,無符合除法調(diào)用_rt_udiv),來實(shí)現(xiàn)除法操作。根據(jù)除數(shù)和被除數(shù)的不同,32bit的除法運(yùn)算一般要占有20-140個(gè)指令周期。

14.2除法運(yùn)算

因?yàn)锳RM體系結(jié)構(gòu)本身并不包含除法運(yùn)算硬件,所以在ARM上實(shí)現(xiàn)除法是十分耗時(shí)的。ARM指令集中沒有直接提供除法匯編指令,當(dāng)代碼中出現(xiàn)除法運(yùn)算時(shí),ARM編譯器會調(diào)用C庫函數(shù)(有符合除法調(diào)用_rt_sdiv,無符合除法調(diào)用_rt_udiv),來實(shí)現(xiàn)除法操作。根據(jù)除數(shù)和被除數(shù)的不同,32bit的除法運(yùn)算一般要占有20-140個(gè)指令周期。除法運(yùn)算占用的指令周期,由下面公式計(jì)算。

Time(除數(shù)n/被除數(shù)d)

=C0+C1*log2(除數(shù)n/被除數(shù)d)=

=C0+C1*(log2(除數(shù))-log2(被除數(shù))).

為了避免在程序中出現(xiàn)除法操作,編程時(shí)盡量使用其他運(yùn)算來代替除法操作。如,使用x>(z×y)來代替(x/y)>z。

另外,在無法避免的除法運(yùn)算中,盡量使用無符合除法代替有符號除法。這是因?yàn)樵贏RM庫函數(shù)中,無符合除法的運(yùn)算速度要快于有符合除法。

下面章節(jié)將詳細(xì)討論如何在代碼中提高除法運(yùn)算的執(zhí)行效率。

14.2.1合并除法和求余運(yùn)算

ARM的除法運(yùn)算庫函數(shù)能同時(shí)返回運(yùn)算的商和余數(shù)。

在一些同時(shí)需要商和余數(shù)的情況下,編譯器將調(diào)用一次除法運(yùn)算函數(shù)同時(shí)存儲運(yùn)算的商和余數(shù)。

下面是一個(gè)編譯器調(diào)用除法庫,同時(shí)存儲運(yùn)算的商和余數(shù)的例子。

源程序如下。

intcombined_div_mod(inta,intb)

{

return(a/b)+(a%b);

}

下面是編譯器編譯出的匯編代碼。

combined_div_mod

STMDBsp!,{lr}

MOVa3,a2

MOVa2,a1

MOVa1,a3

BL__rt_sdiv

ADDa1,a1,a2

LDMIAsp!,{pc}

從上面的例子可以看出,調(diào)用一次除法運(yùn)算,同時(shí)返回了商和余數(shù)。

14.2.2使用2的整數(shù)次冪做除數(shù)

當(dāng)2的整數(shù)次冪做除數(shù)時(shí),編譯器會自動將除法運(yùn)算轉(zhuǎn)換成移位運(yùn)算。所以在編寫程序算法時(shí),盡量使用2的整數(shù)次冪做除數(shù)。

下面的例子顯示了編譯器對除法運(yùn)算的自動優(yōu)化。

源程序如下。

typedefunsignedintuint;

uintdiv16u(uinta)

{returna/16;

}

intdiv16s(inta)

{returna/16;

}

編譯器的編譯結(jié)果如下。

div16u

MOVa1,a1,LSR#4

MOVpc,lr

div16s

CMPa1,#0

ADDLTa1,a1,#&f

MOVa1,a1,ASR#4

MOVpc,lr

從上面的例子可以看出,無符號除法的運(yùn)算速度快于有符號除法。

14.2.3求余運(yùn)算

為了避免在程序中使用除法運(yùn)算,可以將一些典型的求余運(yùn)算進(jìn)行轉(zhuǎn)換。下面的例子提供一種轉(zhuǎn)換方法。

uintcounter1(uintcount)

{return(++count%60);

}

轉(zhuǎn)換成,

uintcounter2(uintcount)

{if(++count>=60)

count=0;

return(count);

}

下面是兩個(gè)功能函數(shù)編譯后的匯編代碼。

counter1

STMDBsp!,{lr}

ADDa2,a1,#1

MOVa1,#&3c

BL__rt_udiv

MOVa1,a2

LDMIAsp!,{pc}

counter2

ADDa1,a1,#1

CMPa1,#&3c

MOVCSa1,#0

MOVpc,lr

上面的例子清晰的顯示了使用if語句代替除法運(yùn)算后,代碼的執(zhí)行效率有很大提高。

14.2.4除數(shù)是常數(shù)的除法

因?yàn)槌ê湍_\(yùn)算執(zhí)行起來比較慢,所以應(yīng)該盡可能地避免使用。但是除數(shù)是常數(shù)的除法運(yùn)算和用同一個(gè)除數(shù)的重復(fù)除法,執(zhí)行效率會比較高。在ARM的除法庫中,存在除數(shù)為10的除法運(yùn)算庫,其中包括有符號除法和無符號除法。如果除數(shù)是10以外的其他常數(shù),用戶可以編寫自己的功能函數(shù)。ARM的開發(fā)工具集中,提供了關(guān)于除數(shù)是常數(shù)的示例程序和算法分析,以供用戶編寫自己的代碼時(shí)參考。

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時(shí)聯(lián)系本站刪除( 郵箱:macysun@21ic.com )。
換一批
延伸閱讀
關(guān)閉