日本黄色一级经典视频|伊人久久精品视频|亚洲黄色色周成人视频九九九|av免费网址黄色小短片|黄色Av无码亚洲成年人|亚洲1区2区3区无码|真人黄片免费观看|无码一级小说欧美日免费三级|日韩中文字幕91在线看|精品久久久无码中文字幕边打电话

當(dāng)前位置:首頁 > 嵌入式 > 嵌入式教程
[導(dǎo)讀]基于ARM的除法運(yùn)算優(yōu)化策略

    與傳統(tǒng)的48位單片機(jī)相比,ARM的性能和處理能力是遙遙領(lǐng)先的。但與之相應(yīng),ARM的系統(tǒng)設(shè)計復(fù)雜度和難度,較之傳統(tǒng)的設(shè)計方法也大大提升了,同時也大大拓展了針對ARM芯片特性進(jìn)行優(yōu)化的空間,例如針對指令流水線的優(yōu)化、針對寄存器分配進(jìn)行的優(yōu)化等。

 
   
ARM
在硬件上不支持除法指令,編譯器是通過調(diào)用C庫函數(shù)來實(shí)現(xiàn)除法運(yùn)算的,有許多不同類型的除法程序來適應(yīng)不同的除數(shù)和被除數(shù)。但直接利用C庫函數(shù)中的標(biāo)準(zhǔn)整數(shù)除法程序,根據(jù)執(zhí)行情況和輸入操作數(shù)的范圍,要花費(fèi)20100個周期,消耗較多的軟件運(yùn)行時間。在實(shí)時嵌入式應(yīng)用中,對時間參數(shù)較為敏感,故可以考慮如何優(yōu)化避免除法消耗過多的CPU運(yùn)行時間。


    除法和模運(yùn)算
(/和%)執(zhí)行起來比較慢,所以應(yīng)盡量避免使用。但是,除數(shù)是常數(shù)的除法運(yùn)算和用同一個除數(shù)的重復(fù)除法,執(zhí)行效率會比較高。在ARM中,可以利用單條MUL指令實(shí)現(xiàn)乘法操作。本文將闡述如何用乘法運(yùn)算代替除法運(yùn)算,以及如何使除法的次數(shù)最少化。

 

1  避免除法運(yùn)算

    在非嵌入式領(lǐng)域,因為CPU運(yùn)算速度快、存儲器容量大,除法操作通常都是不加考慮直接使用的。但在嵌入式領(lǐng)域,首先需要考慮的是這些除法操作是否是必須的。以對環(huán)形緩沖區(qū)操作為例,經(jīng)常要用到除法,其實(shí)完全可以避免這些除法運(yùn)算。


    假定有一個buffer_size大小的環(huán)形緩沖區(qū),如圖1所示,0ffset指定目前所在的位置。通過increment字節(jié)來增加offset的值,一般是這樣寫的:

0ffset=(Offset+increment)buffer_size;


效率更高的寫法是:

offset+=increment;

if(offset>=buffer_size){

    offset=buffer_size

}


    第一種寫法要花費(fèi)50個周期,而第二種因為沒有除法運(yùn)算,只須花費(fèi)3個周期。這里假定increment<buff_er_size,在實(shí)際應(yīng)用中這點(diǎn)應(yīng)該是保證的。


    如果不能避免除法運(yùn)算,那么就應(yīng)盡量使除數(shù)和被除數(shù)是無符號的整數(shù)。有符號的除法程序執(zhí)行起來更加慢,因為它們先要取得除數(shù)和被除數(shù)的絕對值,再調(diào)用無符號除法運(yùn)算,最后再確定結(jié)果的符號。

 

2  充分利用商和余數(shù)

    許多C語言庫中的除法函數(shù)返回商和余數(shù)。換句話說,每一個除法運(yùn)算,余數(shù)是可以無償?shù)玫降?,反之亦然。例如,要在屏幕緩沖區(qū)找到偏移量為offset的屏幕位置(xy),可以這樣寫:

typeclef struct{

  int  x;

  int y;

}point;

point getxy_v1(unsigned int offset,unslgned int bytes_per_line){

point p;

py=offsetlt)ytes_per_line;

px=offset -   py*  bytcs_per_line;

return p

}

 

    這里,似乎對px使用減法和乘法,少了一次除法運(yùn)算;但是,實(shí)際上使用模運(yùn)算或者取余操作效率更高,對

getxy_vl改進(jìn)如下:

point getxy_v2(unsigned int offsetunsigned int bytes_per_line){

point P;

Px=offsetbytes_per_1ine;

Py=offsetbytes_per_line

return P;


    從下面編譯器的輸出結(jié)果可以看到,只有一次除法調(diào)用。實(shí)際上,這個程序要比前面的getxy_vl4條指令(注意,并不是對所有的編譯器和C庫都有這樣的結(jié)果)。getxy_v2

  STMFD r13!,{r4r14};保存r4,lr人堆棧

  MOV  r4rO    ;賦值后r4保存的為點(diǎn)P基址

  MOV  rO,r2    rO=bytes_per_line

  BL    rt_udiv    ;調(diào)用無符號除法例程

    (r0.;r1)=(rlrO,rlrO)

STR    r0[r4,#4]  Py=offsetbytes_per_line

STR  rl[r4,#o]  ;Px=offset%bytes_per_line

LDMFD r13!(r4,pc);恢復(fù)上下文,返回

 

把除法轉(zhuǎn)換為乘法

    在程序中,同一個除數(shù)的除法經(jīng)常會出現(xiàn)很多次。在前面的例子中,bytes_per_line的值在整個程序中都是固定不變的。又如32笛卡爾坐標(biāo)變換,其中就使用了同一個除數(shù)兩次:

(x,Y,x)(xzyz)


   
這種情況下,使用cache指令中的值1z,并使用1z的乘法來代替除法運(yùn)算,效率會更高。另外,要盡可能使用int類型的運(yùn)算,避免使用浮點(diǎn)運(yùn)算。


    下面將更加偏重于從數(shù)學(xué)和理論的角度分析,把重復(fù)除法轉(zhuǎn)換成乘法運(yùn)算。


    下面來區(qū)分精確數(shù)學(xué)意義上的除法和整型除法運(yùn)算:

nd,即整數(shù)n被分成整數(shù)d份,結(jié)果趨向于O(C語言相同);

nd,即nd除之后的余數(shù),就是n--d(nd);

◇n/d=n·d-1,即真正數(shù)學(xué)意義上的nd除。


    當(dāng)使用整型除法時,最容易估算
d-1值的方法是計算232d。然后,就可以估算nd為:

    (n(232d))232    (1)


    在執(zhí)行
n的乘法時,需要精確到64位。對于這種方法,會出現(xiàn)如下問題:

◇為了計算232d,由于一個unsigned int類型的數(shù)據(jù)放不下232,編譯器要使用64long long類型的數(shù),而且必須指定除法為(1 ull<<32)d。這種64位的除法比32位的除法執(zhí)行起來要慢得多。

◇如果d碰巧是1,那么232d就不再適合于unsigned int數(shù)據(jù)類型。


    上面的做法似乎很好,而且解決了這兩個問題。那么,再來看一下用
(2321)d代替232d。

 

     s=0xffffffff uld    (2)


    以上
nd-2,q,nd+1為整數(shù)值,所以可得q=ndq=(nd)1,即初步估計的結(jié)果q與正確值nd有可能存在偏差1??梢园l(fā)現(xiàn),通過計算余數(shù)r=nq·d(Or<2d)是比較容易的。下面的代碼糾正了這個結(jié)果:

r=n--q*d;*初步估計結(jié)果余數(shù)r的范圍為Or<2d*

if(r>=d){*若需要校正*

r-=d;/*校正r,使Or<d為正確余數(shù)范圍*

n++;*相應(yīng)商加1進(jìn)行校正*

}    *得正確結(jié)果q=ndr=nd*


    下面給出一個實(shí)例,用上面的算法完成了
N個元素的數(shù)組被d除。首先,計算上面所說的s值,然后用乘以5來代替每個被d除的除法。64位的乘是很容易實(shí)現(xiàn)的,因為ARM中有一條指令UMULL,可以進(jìn)行232位數(shù)相乘,給出一個64位的結(jié)果。

void scale(

unsigned int*dest    *目的數(shù)據(jù)*

unsigned int*src    *源數(shù)據(jù)*

unsignedInt d;    *分母d*

urlslglaedInt N;)    *數(shù)據(jù)長度*

{

unsigned int s=0xFFFFFFFFud;

do{

unsigned int n,qr;

n=*(src++);

q=(urtslgrted int)(((unsined tong long)n*s)>>32);

r=n*d

if(r>=d){    *若需要對商進(jìn)行校正*

    q++;

}

    *(dest++)=q;

}while(一一N);

}


    這里假定除數(shù)和被除數(shù)都是
32位的無符號整數(shù)。當(dāng)然,使用32位乘法進(jìn)行16位的無符號數(shù)計算,或者使用1 28位乘法進(jìn)行64位數(shù)計算,運(yùn)算規(guī)則是一樣的。可以為特定的數(shù)據(jù)選擇最窄的運(yùn)算寬度。如果數(shù)據(jù)是16位的,那么就設(shè)置s=(2161)/d,然后用標(biāo)準(zhǔn)的整型乘法來求值q。

 

結(jié) 

    在嵌入式軟件編程中,為了節(jié)省CPU運(yùn)行時間,應(yīng)盡可能避免使用除法。對環(huán)形緩沖區(qū)的處理可以不用除法。如果不能避免除法運(yùn)算,那么應(yīng)盡可能使用除法程序同時產(chǎn)生商nd和余數(shù)nd的好處。對于重復(fù)對一除數(shù)d的除法.預(yù)先計算好s=(2k1)d,用乘以s2k位乘法來代替除以dk位無符號整數(shù)除法,可大大減少由于直接使用除法操作引入的指令周期數(shù)。

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

舍弗勒以"專注驅(qū)動技術(shù)的科技公司"為主題亮相IAA MOBILITY 2025(B3館B40展臺) 合并緯湃科技后首次亮相IAA MOBILITY,展示拓展后的汽車產(chǎn)品組合 憑借在軟件、...

關(guān)鍵字: 電氣 軟件 驅(qū)動技術(shù) BSP

香港2025年 9月12日 /美通社/ -- 全球領(lǐng)先的互聯(lián)網(wǎng)社區(qū)創(chuàng)建者 - 網(wǎng)龍網(wǎng)絡(luò)控股有限公司 ("網(wǎng)龍"或"本公司",香港交易所股票代碼:777)欣然宣布,其子公司My...

關(guān)鍵字: AI 遠(yuǎn)程控制 控制技術(shù) BSP

深圳2025年9月11日 /美通社/ -- 2025 年 9 月 10 日,第 26 屆中國國際光電博覽會(簡稱 "CIOE 中國光博會")在深圳盛大開幕。本屆展會吸引力再創(chuàng)新高,全球超3800家優(yōu)質(zhì)...

關(guān)鍵字: 自動化 光電 CIO BSP

天津2025年9月11日 /美通社/ -- 國際能源署(IEA)數(shù)據(jù)顯示,2024 年全球數(shù)據(jù)中心電力消耗達(dá) 415 太瓦時,占全球總用電量的 1.5%,預(yù)計到 2030 年,這一數(shù)字將飆升至 945 太瓦時,近乎翻番,...

關(guān)鍵字: 模型 AI 數(shù)據(jù)中心 BSP

北京2025年9月11日 /美通社/ -- 國際9月11日上午,2025年中國國際服務(wù)貿(mào)易交易會(以下簡稱"服貿(mào)會")—體育賽事經(jīng)濟(jì)高質(zhì)量發(fā)展大會現(xiàn)場,北京經(jīng)濟(jì)技術(shù)開發(fā)區(qū)工委委員、管委會副主...

關(guān)鍵字: 5G BSP GROUP MOTOR

柏林2025年9月9日 /美通社/ -- 2025年9月5日,納斯達(dá)克上市公司優(yōu)克聯(lián)集團(tuán)(NASDAQ: UCL)旗下全球互聯(lián)品牌GlocalMe,正式亮相柏林國際消費(fèi)電子展(IFA 2025),重磅推出融合企...

關(guān)鍵字: LOCAL LM BSP 移動網(wǎng)絡(luò)

深圳2025年9月9日 /美通社/ -- PART 01活動背景 當(dāng)技術(shù)的鋒芒刺穿行業(yè)壁壘,萬物互聯(lián)的生態(tài)正重塑產(chǎn)業(yè)疆域。2025年,物聯(lián)網(wǎng)產(chǎn)業(yè)邁入?"破界創(chuàng)造"與"共生進(jìn)化"?的裂變時代——AI大模型消融感知邊界,...

關(guān)鍵字: BSP 模型 微信 AIOT

"出海無界 商機(jī)無限"助力企業(yè)構(gòu)建全球競爭力 深圳2025年9月9日 /美通社/ -- 2025年8月28日, 由領(lǐng)先商業(yè)管理媒體世界經(jīng)理人攜手環(huán)球資源聯(lián)合主辦、深圳?前海出海e站通協(xié)辦的...

關(guān)鍵字: 解碼 供應(yīng)鏈 AI BSP

柏林2025年9月9日 /美通社/ -- 柏林當(dāng)?shù)貢r間9月6日,在2025德國柏林國際電子消費(fèi)品展覽會(International Funkausstellung...

關(guān)鍵字: 掃地機(jī)器人 耳機(jī) PEN BSP

武漢2025年9月9日 /美通社/ -- 7月24日,2025慧聰跨業(yè)品牌巡展——湖北?武漢站在武漢中南花園酒店隆重舉辦!本次巡展由慧聰安防網(wǎng)、慧聰物聯(lián)網(wǎng)、慧聰音響燈光網(wǎng)、慧聰LED屏網(wǎng)、慧聰教育網(wǎng)聯(lián)合主辦,吸引了安防、...

關(guān)鍵字: AI 希捷 BSP 平板
關(guān)閉