日本黄色一级经典视频|伊人久久精品视频|亚洲黄色色周成人视频九九九|av免费网址黄色小短片|黄色Av无码亚洲成年人|亚洲1区2区3区无码|真人黄片免费观看|无码一级小说欧美日免费三级|日韩中文字幕91在线看|精品久久久无码中文字幕边打电话

當(dāng)前位置:首頁 > 單片機(jī) > 單片機(jī)
[導(dǎo)讀]1 引言 在RISC CPU的設(shè)計(jì)當(dāng)中,轉(zhuǎn)移指令的處理對處理器的性能的影響非常關(guān)鍵。轉(zhuǎn)移指令決定著程序的執(zhí)行順序,在程序中的使用頻率很高。RISC CPU中程序是以流水線的方式執(zhí)行的,當(dāng)程序順序執(zhí)行時(shí),下一條指令的地

1 引言

RISC CPU的設(shè)計(jì)當(dāng)中,轉(zhuǎn)移指令的處理對處理器的性能的影響非常關(guān)鍵。轉(zhuǎn)移指令決定著程序的執(zhí)行順序,在程序中的使用頻率很高。RISC CPU中程序是以流水線的方式執(zhí)行的,當(dāng)程序順序執(zhí)行時(shí),下一條指令的地址與前一條指令的內(nèi)容無關(guān) ;而在執(zhí)行轉(zhuǎn)移指令時(shí)要根據(jù)轉(zhuǎn)移指令的執(zhí)行結(jié)果來確定下一條指令的地址,也就是說下一條指令的地址在轉(zhuǎn)移指令執(zhí)行之前是未知的,造成流水線的不連貫,影響了CPU的效率。

轉(zhuǎn)移指令處理的方法很多,可分為預(yù)測法和非預(yù)測法,預(yù)測法又包含靜態(tài)預(yù)測和動態(tài)預(yù)測,靜態(tài)預(yù)測如總預(yù)測跳轉(zhuǎn)、正向不跳轉(zhuǎn)反向跳轉(zhuǎn),動態(tài)預(yù)測如2比特計(jì)數(shù)器(2BC) 、BTC;非預(yù)測法如延時(shí)跳轉(zhuǎn)等[1]。這些基本方法合理組合之后可以得到很好的效果。

本文介紹的RISC CPU對轉(zhuǎn)移指令的處理方法,為5級流水線作業(yè),分別是取指、譯碼、執(zhí)行、訪存、回寫,對轉(zhuǎn)移指令的處理在取指級和譯碼級完成;譯碼級給出轉(zhuǎn)移指令所包含的詳細(xì)信息,取指級包含有地址計(jì)算單元,轉(zhuǎn)移目標(biāo)Cache (BTC),跳轉(zhuǎn)判斷單元等。對轉(zhuǎn)移指令的處理使用了延時(shí)跳轉(zhuǎn)、2BC以及BTC方法。

2 轉(zhuǎn)移指令的原理

該RISC CPU的指令集中包含有條件轉(zhuǎn)移指令和非條件轉(zhuǎn)移指令。所有的轉(zhuǎn)移指令均使用延時(shí)轉(zhuǎn)移,每條轉(zhuǎn)移指令后面跟隨一條延時(shí)槽指令;采用2BC預(yù)測條件轉(zhuǎn)移是否跳轉(zhuǎn),而BTC則保存轉(zhuǎn)移目標(biāo)為固定地址的轉(zhuǎn)移指令執(zhí)行后的信息。以下分別介紹在該RISC CPU設(shè)計(jì)中轉(zhuǎn)移指令的設(shè)計(jì)以及延時(shí)轉(zhuǎn)移、BTC、2BC的具體實(shí)現(xiàn)方法。

2.1 轉(zhuǎn)移指令類型及格式

該RISC CPU的指令集中包含條件轉(zhuǎn)移指令(BCC)和非條件轉(zhuǎn)移指令(CALL和RET),其編碼格式為圖1所示。CALL指令包含2位的操作碼和30位的絕對地址。BCC指令包含8位操作碼, 4位條件碼(Condition Code),19位偏移量以及1位用來區(qū)分指令是否帶A參數(shù)(即ANNUL操作)。所有的BCC指令使用相同的操作碼,不同的BCC指令用條件碼來區(qū)分,共有16類BCC指令;偏移量為帶符號數(shù),在低位用00擴(kuò)展后可以對±220的相對地址尋址。RET指令包含8位的操作碼和兩個(gè)5位的寄存器地址。


2.2 延時(shí)轉(zhuǎn)移

在該RISC CPU中,由于轉(zhuǎn)移指令只有在譯碼級才被識別,跳轉(zhuǎn)與否在譯碼級才能決定,因此在取下一條指令之前必須等待一個(gè)時(shí)鐘周期。為了減少流水線中的氣泡,緊跟轉(zhuǎn)移指令后面插一條與跳轉(zhuǎn)不相關(guān)的指令,即延時(shí)槽指令,不管跳轉(zhuǎn)是否發(fā)生,該指令都執(zhí)行。延時(shí)槽指令的插入由編譯器完成,當(dāng)編譯器找不出這樣的指令時(shí),就插一條NOP指令??紤]到減輕編譯器的難度,我們也采用了帶 A參數(shù)的轉(zhuǎn)移:當(dāng)指令帶有A參數(shù)時(shí),延時(shí)槽指令從轉(zhuǎn)移目標(biāo)程序中取出,因此轉(zhuǎn)移發(fā)生時(shí),延時(shí)槽指令執(zhí)行,而轉(zhuǎn)移不發(fā)生時(shí),則禁止延時(shí)槽指令進(jìn)入譯碼級。因一般而言非條件轉(zhuǎn)移指令出現(xiàn)的頻率遠(yuǎn)低于條件轉(zhuǎn)移指令出現(xiàn)的頻率,非條件轉(zhuǎn)移指令的延時(shí)槽指令相對來說容易找到,所以非條件轉(zhuǎn)移指令不采用A參數(shù)選項(xiàng),而條件轉(zhuǎn)移指令采用A參數(shù)選項(xiàng)。

2.3 2BC與BTC的設(shè)計(jì)

2BC與BTC對提高轉(zhuǎn)移指令的執(zhí)行效率起重要的作用。在RISC CPU中,轉(zhuǎn)移指令執(zhí)行一次后,有很大的概率會執(zhí)行更多次。對于轉(zhuǎn)移目標(biāo)為固定地址的轉(zhuǎn)移指令(BCC和CALL),在其第一次執(zhí)行時(shí)使用BTC存儲相關(guān)的信息,當(dāng)再次執(zhí)行時(shí),直接讀出這些信息,控制程序的執(zhí)行順序,而不需要轉(zhuǎn)移指令本身進(jìn)流水線。這可大大提高效率,但對于轉(zhuǎn)移目標(biāo)不確定的間接轉(zhuǎn)移指令(如RET),BTC是無效的。另外,條件轉(zhuǎn)移指令(BCC)是否跳轉(zhuǎn)也是不確定的,本設(shè)計(jì)中采用2BC進(jìn)行預(yù)測。

BTC為全相聯(lián)Cache,總共有16個(gè)單元,每個(gè)單元包含的信息有:TAG存儲執(zhí)行過的轉(zhuǎn)移指令的地址、DI存儲延時(shí)槽指令、CC存儲條件碼、TP 存儲轉(zhuǎn)移指令類型、AN存儲A參數(shù)攜帶標(biāo)志,HI存儲轉(zhuǎn)移執(zhí)行情況的歷史記錄,即2BC,VI指示行數(shù)據(jù)是否有效。BTC包含BTC存儲、BTC命中以及BTC檢查三種工作任務(wù)。以下分別介紹2BC以及每種任務(wù)下BTC的工作情況?!?

2.3.1 2BC的作用及工作原理

因?yàn)檗D(zhuǎn)移指令執(zhí)行一次之后,轉(zhuǎn)移目標(biāo)地址、延時(shí)槽指令都保存在BTC中了,當(dāng)該指令再次執(zhí)行時(shí),這些信息就直接從Cache讀出,因此在取指級就可以得到跳轉(zhuǎn)目標(biāo)地址和延時(shí)槽指令。對于非條件轉(zhuǎn)移指令,跳轉(zhuǎn)總是執(zhí)行,因此BTC命中時(shí)就可以直接決定下一條指令的地址為轉(zhuǎn)移目標(biāo)地址,而當(dāng)前周期DI被送到指令總線上;但對于條件轉(zhuǎn)移指令,跳轉(zhuǎn)與否是根據(jù)條件碼和ALU的標(biāo)志位來決定的。如果轉(zhuǎn)移指令前面一條指令的執(zhí)行結(jié)果改變標(biāo)志位,而當(dāng)BTC命中時(shí)該指令還在譯碼級,則跳轉(zhuǎn)與否需要等待一個(gè)時(shí)鐘周期才能決定。為了避免因?yàn)榈却斐闪魉€的停頓,采用2BC當(dāng)前的狀態(tài)預(yù)測跳轉(zhuǎn)是否執(zhí)行,在接下來的時(shí)鐘周期,標(biāo)志位有效之后,再檢查預(yù)測是否正確,如果不正確,就進(jìn)行更正。當(dāng)預(yù)測準(zhǔn)確時(shí),采用2BC 與BTC可以使轉(zhuǎn)移指令的執(zhí)行時(shí)間縮短一個(gè)周期。即使預(yù)測不準(zhǔn)確,與不采用預(yù)測相比也不會有損失。2BC的工作原理如圖2所示,初始值為Nx(第一次不跳轉(zhuǎn)執(zhí)行)或Tx(第一次跳轉(zhuǎn)執(zhí)行),t表示跳轉(zhuǎn)執(zhí)行,n表示跳轉(zhuǎn)不執(zhí)行。當(dāng)HI為N或Nx時(shí),預(yù)測跳轉(zhuǎn)不發(fā)生;當(dāng)HI為T或Tx時(shí),預(yù)測跳轉(zhuǎn)發(fā)生。


 

2.3.2 BTC存儲

當(dāng)轉(zhuǎn)移指令第一次執(zhí)行時(shí),BTC在當(dāng)前時(shí)鐘啟動存儲任務(wù),把該指令執(zhí)行的信息寫入對應(yīng)的單元中,對于BCC指令,確定2BC的初始狀態(tài)。同時(shí)也把該行的VI置為有效。BTC采用隨機(jī)替換策略確定數(shù)據(jù)入口:在復(fù)位或Cache清零之后,按順序填充Cache,如果BTC寫滿,則隨機(jī)選通一行進(jìn)行替換。

2.3.3 BTC命中

在取指周期開始時(shí)如果發(fā)現(xiàn)當(dāng)前取指地址包含在BTC的TAG中,并且對應(yīng)行的VI也有效,則認(rèn)為BTC命中,從而啟動命中任務(wù):讀出命中行的數(shù)據(jù),把DI送到指令總線,如果是CALL指令,轉(zhuǎn)移目標(biāo)地址作為下一條指令的地址;如果是BCC 指令則需要判斷跳轉(zhuǎn)是否發(fā)生:當(dāng)標(biāo)志位有效時(shí),根據(jù)條件碼與標(biāo)志位判斷,否則根據(jù)HI進(jìn)行預(yù)測,然后確定下一條指令的地址:跳轉(zhuǎn)時(shí)為轉(zhuǎn)移目標(biāo)地址,不跳轉(zhuǎn)為PC+2。對于帶A參數(shù)的BCC指令,在跳轉(zhuǎn)不執(zhí)行時(shí),要禁止DI在下一時(shí)鐘進(jìn)入譯碼級。BTC命中的流程如圖3。


2.3.4 BTC檢查

如果前一周期BTC命中,則在當(dāng)前周期開始時(shí)啟動BTC檢查任務(wù);如果前一周期BTC是根據(jù)HI預(yù)測BCC的跳轉(zhuǎn),那么在當(dāng)前時(shí)鐘標(biāo)志位有效后,要重新判斷跳轉(zhuǎn)決定是否正確,如果不正確就要進(jìn)行更正,給出正確的取指地址,請求在下一時(shí)鐘禁止譯碼級或執(zhí)行級。同時(shí)還要根據(jù)最終的跳轉(zhuǎn)情況和HI的更新算法更新HI。BTC檢查的流程圖如圖4。


3 結(jié)論

整個(gè)RISC CPU用Verilog HDL語言進(jìn)行了描述,并針對標(biāo)準(zhǔn)程序進(jìn)行了仿真,仿真結(jié)果表明,采用上述方法處理轉(zhuǎn)移指令可以明顯提高流水線的吞吐率。由于在轉(zhuǎn)移指令后面插入了延時(shí)槽指令,轉(zhuǎn)移指令的執(zhí)行與程序順序執(zhí)行時(shí)完全相同; BTC的使用雖然在硬件上增加了一些開銷,但使轉(zhuǎn)移指令再次執(zhí)行時(shí)基本不占用流水線資源,大大提高了CPU的效率

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

Arm 控股有限公司(納斯達(dá)克股票代碼:ARM,以下簡稱 Arm)今日宣布推出全新 Arm? Lumex? 計(jì)算子系統(tǒng) (Compute Subsystem, CSS) 平臺,這是一套專為旗艦級智能手機(jī)及下一代個(gè)人電腦加...

關(guān)鍵字: CPU AI 消費(fèi)電子

Arm 控股有限公司(納斯達(dá)克股票代碼:ARM,以下簡稱 Arm)今日宣布推出全新 Arm? Lumex?計(jì)算子系統(tǒng) (Compute Subsystem, CSS) 平臺,這是一套專為旗艦級智能手機(jī)及下一代個(gè)人電腦加速...

關(guān)鍵字: 消費(fèi)電子 CPU AI

8位單片機(jī)在嵌入式設(shè)計(jì)領(lǐng)域已經(jīng)成為半個(gè)多世紀(jì)以來的主流選擇。盡管嵌入式系統(tǒng)市場日益復(fù)雜,8位單片機(jī)依然不斷發(fā)展,積極應(yīng)對新的挑戰(zhàn)和系統(tǒng)需求。如今,Microchip推出的8位PIC?和AVR?單片機(jī)系列,配備了先進(jìn)的獨(dú)立...

關(guān)鍵字: 單片機(jī) 嵌入式 CPU

上海2025年8月15日 /美通社/ -- 在數(shù)字化轉(zhuǎn)型浪潮與數(shù)據(jù)安全需求的雙重驅(qū)動下,瀾起科技今日重磅推出第六代津逮? 性能核 CPU (以下簡稱 C6P )。這款融合突破性架構(gòu)、全棧兼容性與芯片級安全防護(hù)的高性能服...

關(guān)鍵字: CPU BSP 數(shù)字化 AI

采用分離式架構(gòu),充分利用主機(jī) CPU 和 PCIe? 基礎(chǔ)設(shè)施,克服傳統(tǒng)存儲瓶頸

關(guān)鍵字: CPU 數(shù)據(jù)中心 服務(wù)器

受生成式 AI 驅(qū)動, RISC-V 芯片市場快速發(fā)展。預(yù)計(jì)到2030年,RISC-V SoC出貨量將達(dá)到1618.1億顆,營收將達(dá)到927億美元。其中,用于AI加速器的RISC-V SoC出貨量將達(dá)到41億顆,營收將達(dá)...

關(guān)鍵字: RISC-V CPU AI CUDA ARM 推理

 米蘭諾維奇博士提出"語言能力雙軌進(jìn)化論",動態(tài)命題技術(shù)破解安全性困局 貴陽2025年7月23日 /美通社/ -- 7月22日,在第八屆英語教學(xué)與測評學(xué)術(shù)研討會上,國際語言測評權(quán)威專家、朗...

關(guān)鍵字: AI 人工智能 指令 研討會

7月21日消息,“全球最佳游戲CPU”銳龍7 9800X3D自去年11月上市以來,價(jià)格一直比較堅(jiān)挺,前期還經(jīng)常處于缺貨狀態(tài)。

關(guān)鍵字: CPU GPU

人工智能 (AI) 正在以驚人的速度發(fā)展。企業(yè)不再僅僅是探索 AI,而是積極推動 AI 的規(guī)?;涞?,從實(shí)驗(yàn)性應(yīng)用轉(zhuǎn)向?qū)嶋H部署。隨著生成式模型日益精簡和高效,AI 的重心正從云端轉(zhuǎn)向邊緣側(cè)。如今,人們不再質(zhì)疑邊緣 AI...

關(guān)鍵字: 人工智能 CPU GPU
關(guān)閉