日本黄色一级经典视频|伊人久久精品视频|亚洲黄色色周成人视频九九九|av免费网址黄色小短片|黄色Av无码亚洲成年人|亚洲1区2区3区无码|真人黄片免费观看|无码一级小说欧美日免费三级|日韩中文字幕91在线看|精品久久久无码中文字幕边打电话

當(dāng)前位置:首頁 > 單片機 > 單片機
[導(dǎo)讀]一.RISC設(shè)計思想ARM內(nèi)核采用RISC體系結(jié)構(gòu)。RISC是一種設(shè)計思想,其目標(biāo)是設(shè)計出一套能在高時鐘頻率下單周期執(zhí)行,簡單而有效的指令集。RISC的設(shè)計重點在于由硬件執(zhí)行的指令的復(fù)雜度,這是因為軟件比硬件容易提供更大

一.RISC設(shè)計思想

ARM內(nèi)核采用RISC體系結(jié)構(gòu)。RISC是一種設(shè)計思想,其目標(biāo)是設(shè)計出一套能在高時鐘頻率下單周期執(zhí)行,簡單而有效的指令集。RISC的設(shè)計重點在于由硬件執(zhí)行的指令的復(fù)雜度,這是因為軟件比硬件容易提供更大的靈活性和更高的智能。因此,RISC設(shè)計對編譯器有更高的要求;相反,傳統(tǒng)的復(fù)雜指令集的計算機(CISC)則更側(cè)重于硬件執(zhí)行指令的功能性,使CISC變得更復(fù)雜。

RISC設(shè)計思想主要由下面4個設(shè)計準(zhǔn)則來實現(xiàn):

▇ 指令集

RISC處理器減少了指令種類,每條指令的長度都是固定的,允許流水線在當(dāng)前指令譯碼階段去取其下一條指令;而CISC處理器中,指令的長度通常不固定,執(zhí)行也需要多個周期。

▇ 流水線

在理想情況下,流水線每周期前進(jìn)一步,可獲得最高的吞吐率;而CISC指令的執(zhí)行需要調(diào)用微代碼的一個微程序。

▇ 寄存器

RISC處理器擁有更多的通用寄存器,每個寄存器都可存放數(shù)據(jù)或地址。寄存器可為所有的數(shù)據(jù)操作提供快速的局部存儲訪問;而CISC處理器都是用于特定目的的專用 處理器。

▇ load-store結(jié)構(gòu)

處理器只能處理寄存器中的數(shù)據(jù)。獨立的load和store指令用來完成數(shù)據(jù)在寄存器和外部存儲器之間的傳送。因為訪問存儲器很耗時,所以把存儲器訪問和數(shù)據(jù)處理分開。這樣有一個好處,那就是可反復(fù)地使用保存在寄存器中的數(shù)據(jù),而避免多次訪問存儲器。相反,在CISC結(jié)構(gòu)中,處理器能夠直接處理存儲器中的數(shù)據(jù)。

二.ARM設(shè)計思想

為降低功耗,ARM處理器已被特殊設(shè)計成較小的核,較高的代碼密度。ARM內(nèi)核不是一個純粹的RISC體系結(jié)構(gòu),這是為了使它能夠更好的適應(yīng)其主要應(yīng)用領(lǐng)域-嵌入式系統(tǒng)。在某種意義上,甚至可以認(rèn)為ARM內(nèi)核的成功,正是因為它沒有在RISC概念上沉入太深?,F(xiàn)在系統(tǒng)的關(guān)鍵并不在于單純的處理器速度,而在于有效的系統(tǒng)性能和功耗。

面向嵌入式系統(tǒng)的指令集

▇ 一些特定指令的周期數(shù)可變

例如:多寄存器裝載/存儲的load/store指令的執(zhí)行周期就是不確定的

▇ 內(nèi)嵌桶形移位器產(chǎn)生了更為復(fù)雜的指令

▇ Thumb 16位指令集

▇ 條件執(zhí)行

▇ 增強指令

三.高效的C編程

1)C數(shù)據(jù)類型的有效用法

▇ 對于存放在寄存器中的局部變量,除了8位或16位的算術(shù)模運算符外,盡量不要使用char和short類型。而要使用有符號或者無符號的int類型。除法運算時使用無符號數(shù)執(zhí)行速度更快。

▇ 對于存放在主存儲器中的數(shù)組和全局變量,在滿足數(shù)據(jù)大小的前提下,應(yīng)盡可能使用小尺寸的數(shù)據(jù)類型,這樣做可以節(jié)省存儲空間。ARMv4體系結(jié)構(gòu)可以有效的裝載和存儲所有寬度的數(shù)據(jù),并可以使用遞增數(shù)組的指針來有效的訪問數(shù)組。對于short類型數(shù)組,要避免使用數(shù)組基地址的偏移,因為LDRH指令不支持偏移尋址。

▇ 由于隱式或者顯式的數(shù)據(jù)類型轉(zhuǎn)換通常會有額外的指令周期開銷,所以在表達(dá)式中應(yīng)盡量避免使用。load和store指令一般不會產(chǎn)生額外的轉(zhuǎn)換開銷,因為load和store指令是自動完成數(shù)據(jù)類型轉(zhuǎn)換的。

▇ 對于函數(shù)參數(shù)和返回值應(yīng)盡量避免使用char和short類型。即使參數(shù)范圍比較小,也應(yīng)該使用int類型,以防止編譯器做不必要的類型轉(zhuǎn)換。

2)高效的編寫循環(huán)體

▇ 使用減計數(shù)到零的循環(huán)結(jié)構(gòu),這樣編譯器就不需要分配一個寄存器來保存循環(huán)中止值,而且與0比較的指令也可以省略。

▇ 使用無符號的循環(huán)計數(shù)值,循環(huán)繼續(xù)的條件為i!=0而不是i>0,這樣可以保證循環(huán)開銷只有兩條指令。

▇ 如果事先知道循環(huán)體至少會執(zhí)行一次,那么使用do-while循環(huán)要比for循環(huán)好,這樣可以使編譯器省去檢查循環(huán)計數(shù)值是否為0的步驟。

▇ 展開重要的循環(huán)體可降低循環(huán)開銷,但不要過度展開,如果循壞的開銷對整個程序來說占的比例很小,那么循環(huán)展開反而會增加代碼量并降低cache性能。

▇ 盡量使數(shù)組的大小是4或8的倍數(shù),這樣就可以容易地以2,4,8次等多種選擇展開循環(huán),而不需要擔(dān)心剩余數(shù)組元素的問題。

3)高效的寄存器分配

▇ 應(yīng)該盡量限制函數(shù)內(nèi)部循環(huán)所用局部變量的數(shù)目,最多不超過12個,這樣,編譯器就可以把這些變量都分配給ARM寄存器。

▇ 可以引導(dǎo)編譯器,通過查看是否屬于最內(nèi)層循環(huán)變量來確定某個變量的重要性

4)高效的調(diào)用函數(shù)

▇ 盡量限制函數(shù)參數(shù)不要超過4個,這樣函數(shù)調(diào)用的效率會更高。也可以將幾個相關(guān)的參數(shù)組織在一個結(jié)構(gòu)體中,用傳遞結(jié)構(gòu)體指針來代替多個參數(shù)。

▇ 把比較小的被調(diào)用函數(shù)和調(diào)用函數(shù)放在同一個原文件中,并且要先定義,后調(diào)用,編譯器就可以優(yōu)化函數(shù)調(diào)用或者內(nèi)聯(lián)較小的函數(shù)。

▇ 對性能影響較大的重要函數(shù)可使用關(guān)鍵字_inline進(jìn)行內(nèi)聯(lián)。

5)避免指針別名

▇ 不要依賴編譯器來消除包含存儲訪問的公共子表達(dá)式,而應(yīng)建立一個新的局部變量來保存這個表達(dá)式的值,這樣可以保證只對這個表達(dá)式求職一次。

▇ 避免使用局部變量的地址,否則對這個變量的訪問效率會比較低。

6)高效的結(jié)構(gòu)體安排

▇ 結(jié)構(gòu)體元素要按照元素的大小來排列,以最小的元素放在開始,最大的元素安排在最后。

▇ 避免使用很大的結(jié)構(gòu)體,可以使用層次化的小結(jié)構(gòu)體來代替。

▇ 為了提高可移植性,人工對API的結(jié)構(gòu)體添加填充位,這樣,結(jié)構(gòu)體的安排將不會依賴于編譯器。


本站聲明: 本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

ARM系統(tǒng)幾乎都采用Linux的操作系統(tǒng),而且?guī)缀跛械挠布到y(tǒng)都要單獨構(gòu)建自己的系統(tǒng),與其他系統(tǒng)不能兼容,這也導(dǎo)致其應(yīng)用軟件不能方便移植,這一點一直嚴(yán)重制約了ARM系統(tǒng)的發(fā)展和應(yīng)用。GOOGLE開發(fā)了開放式的Andro...

關(guān)鍵字: Linux x86 ARM

隨著計算需求的多樣化,尤其是隨著移動設(shè)備、嵌入式系統(tǒng)和云計算的興起,ARM 和 x86 架構(gòu)之間的爭論變得更加突出。ARM(高級 RISC 機器)和 x86 代表兩種不同類型的處理器架構(gòu),每種架構(gòu)都針對不同的工作負(fù)載和用...

關(guān)鍵字: Linux x86 ARM

從畫質(zhì)優(yōu)化 (NSS) 到幀率提升 (NFRU) 和光線追蹤(NSSD),Arm 計劃覆蓋移動端圖形處理的多個維度,推動邊緣 AI 圖形革命。而未來通過持續(xù)的技術(shù)迭代,Arm也將保持在移動計算領(lǐng)域的技術(shù)領(lǐng)先,滿足手游、A...

關(guān)鍵字: ARM 神經(jīng)圖形技術(shù) GPU AI ML

7月31日消息,據(jù)媒體報道,芯片架構(gòu)提供商Arm Holdings首席執(zhí)行官Rene Haas宣布,公司正加大投入開發(fā)自有芯片產(chǎn)品,此舉標(biāo)志著其從傳統(tǒng)IP授權(quán)模式向提供實體芯片的戰(zhàn)略重大轉(zhuǎn)變。

關(guān)鍵字: ARM META

7月28日消息,2025年,中國AI硬件市場規(guī)模將首次突破萬億元大關(guān)。

關(guān)鍵字: AI ARM

受生成式 AI 驅(qū)動, RISC-V 芯片市場快速發(fā)展。預(yù)計到2030年,RISC-V SoC出貨量將達(dá)到1618.1億顆,營收將達(dá)到927億美元。其中,用于AI加速器的RISC-V SoC出貨量將達(dá)到41億顆,營收將達(dá)...

關(guān)鍵字: RISC-V CPU AI CUDA ARM 推理
關(guān)閉