日本黄色一级经典视频|伊人久久精品视频|亚洲黄色色周成人视频九九九|av免费网址黄色小短片|黄色Av无码亚洲成年人|亚洲1区2区3区无码|真人黄片免费观看|无码一级小说欧美日免费三级|日韩中文字幕91在线看|精品久久久无码中文字幕边打电话

當前位置:首頁 > 單片機 > 單片機
[導讀]高速緩存作為中央處理器 (CPU) 與主存之間的小規(guī)??焖俅鎯ζ?,解決了兩者數(shù)據(jù)處理速度的平衡和匹配問題,有助于提高系統(tǒng)整體性能。多處理器 (SMP) 支持共享和私有數(shù)據(jù)的緩存,Cache 一致性協(xié)議用于維護由于多個處理器共享數(shù)據(jù)引發(fā)的多處理器數(shù)據(jù)一致性問題。論述了一個適用于64位多核處理器的共享緩存設(shè)計,包括如何實現(xiàn)多處理器緩存一致性及其全定制后端實現(xiàn)。

 0. 引言

本文介紹了一種共享高速存儲器模塊的設(shè)計。該高速存儲器能夠?qū)崿F(xiàn)多核處理器間的數(shù)據(jù)交換,同時占用較小的電路面積。相比傳統(tǒng)的多核處理器數(shù)據(jù)交換方式,本設(shè)計可以更好地提升系統(tǒng)性能。是一種有市場競爭力的電路設(shè)計結(jié)構(gòu);

1. 共享緩存結(jié)構(gòu)設(shè)計

1.1 總體考慮

在多核 CPU中共享高速緩存主要負責緩存多個處理器核的數(shù)據(jù),處理訪問這些數(shù)據(jù)的缺失請求并向 DRAM 控制器發(fā)送請求以獲得 DRAM 返回的數(shù)據(jù)。共享高速緩存通過交叉開關(guān)總線與各個處理器核互連,通過交叉開關(guān)總線轉(zhuǎn)發(fā)通信數(shù)據(jù)包進行數(shù)據(jù)通信。共享高速緩存分為四個緩存組,每個緩存組采用組相聯(lián)地址映射。每個處理核心都可以發(fā)送數(shù)據(jù)包到任意一個緩存組,同數(shù)據(jù)包也可以反方向發(fā)送從任意一個緩存組到任意一個處理核心。

共享緩存采用四路組相聯(lián)映射,將緩存分1024 組。緩存塊的物理地址分為3部分,包括標簽塊、索引塊以及塊內(nèi)偏移。索引部分用于確定緩存塊所在的組。通過比較物理地址的標簽塊和所選中組內(nèi)的四路標簽,可以確定訪問的命中或者缺失。在命中時,比較的結(jié)果作為路選擇向量發(fā)往數(shù)據(jù)陣列。緩存通過路選擇向量和組選擇向量確定

1.2 緩存一致性

對稱式共享存儲器多處理器系統(tǒng)中多處理器2高速緩存子系統(tǒng)共享同一個物理存儲器,通過總線連接,對于所有的處理器訪問存儲器的時間一致,即均勻存儲訪問 (UMA)。對稱式共享存儲器系統(tǒng)支持共享和私有數(shù)據(jù)的緩存。私有數(shù)據(jù)被單個處理器使用,而共享數(shù)據(jù)則被多個處理器使用,通過讀寫共享數(shù)據(jù)完成處理器之間的通信。共享數(shù)據(jù)在多個緩存中形成副本,減少了訪問時延、降低了對存儲器帶寬的要求并減少多個處理器讀取共享數(shù)據(jù)時的競爭現(xiàn)象。然而,共享數(shù)據(jù)帶來了緩存一致性問題,實現(xiàn)緩存一致性關(guān)鍵在于跟蹤所有共享數(shù)據(jù)塊的狀態(tài)。目前為了實現(xiàn)緩存一致性而廣泛采用的有目錄式以及監(jiān)聽式這兩種協(xié)議。該設(shè)計采用目錄式緩存一致性協(xié)議 ,把物理存儲器的共享狀態(tài)放在目錄表中,根據(jù)目錄跟蹤哪一個以及緩存擁有二級緩存塊的副本。一級緩存是寫直達的,只有無效信息被要求,共享緩存是寫回的,數(shù)據(jù)總可以從共享緩存中重新得到。為減少目錄的開銷,將目錄放在緩存中而不是存儲器中。

當一個塊還未被緩存有 2 種可能的目錄請求:

1) 讀缺失:共享緩存向發(fā)出請求的處理器送回所要求的數(shù)據(jù),發(fā)送請求的節(jié)點成為唯一的共享節(jié)點。塊的狀態(tài)設(shè)為共享。

2) 寫缺失:向發(fā)出請求的處理器送回數(shù)據(jù)并使它成為共享節(jié)點。數(shù)據(jù)塊設(shè)為獨占狀態(tài),指明這是唯一有效的緩存副本。共享者集合中指明所有者。當數(shù)據(jù)塊處于共享狀態(tài)時,共享緩存中的值是最新的,有 2 種可能的目錄請求:

1) 讀缺失:共享緩存向發(fā)送請求的處理器送回所要求的數(shù)據(jù),并將發(fā)送請求的處理器放到共享集中。

2) 寫缺失:向發(fā)送請求的處理器送回數(shù)據(jù),無效共享集合中的處理器緩存塊,保存發(fā)送請求的處理器標識,將數(shù)據(jù)塊設(shè)置成獨占狀態(tài)。

當數(shù)據(jù)塊處于獨占狀態(tài)時,塊的當前值保存在共享者集所指明的處理器的緩存中,有 3 種可能的目錄請求:

1) 讀缺失:向所有者處理器發(fā)送數(shù)據(jù)消息,將緩存塊狀態(tài)設(shè)為共享。由所有者向目錄發(fā)送數(shù)據(jù),將數(shù)據(jù)寫入共享緩存并發(fā)送回發(fā)出請求的處理器。再將發(fā)出請求的處理器添加到共享者集合中,這時集合中仍然會有其他所有者處理器。

2) 數(shù)據(jù)寫回:執(zhí)行寫回操作,更新存儲器副本 ,共享者集合為空。

3) 寫缺失:數(shù)據(jù)塊有了新的所有者。向舊的所有者發(fā)送消息,使緩存將該數(shù)據(jù)塊設(shè)置為無效,并把值發(fā)送到目錄中,再通過目錄把數(shù)值發(fā)送到發(fā)出請求的處理器上。發(fā)出請求的處理器成為新的所有者。共享者集合只保留新所有者的標識,而塊仍然處于獨占狀態(tài)。

2. 高速共享緩存模塊

用戶RAM大小為2MB,掛接在雙核之間的AHB總線上,兩個內(nèi)核訪問區(qū)域可以任意配置。其內(nèi)部是一塊 SRAM 和AHB總線從接口電路,如圖2-1所示。讀訪問有一個周期的延遲,寫訪問無延遲。讀寫訪問時序見圖2-2、圖2-3。讀寫都支持字節(jié)(byte)訪問、半字(half-word)訪問或字(word)訪問。

用戶RAM所在的地址空間范圍為0xA0000000 ~ 0xA01FFFFF。

圖 2‑1 用戶RAM結(jié)構(gòu)示意圖

假設(shè)CPU0寫數(shù)據(jù)到用戶RAM,接著CPU1從用戶RAM讀數(shù)據(jù)。這種情況下,CPU0首先寫數(shù)據(jù),然后將標志變量置1,表示用戶RAM內(nèi)的數(shù)據(jù)已更新。標志變量地址位于用戶RAM地址范圍內(nèi)。接著CPU1讀標志變量,若變量為1,則從用戶RAM內(nèi)對應地址讀取CPU0寫入的數(shù)據(jù),并將標志變量置0;若標志變量為0,則表示用戶RAM內(nèi)數(shù)據(jù)已被CPU1讀取過。

使用以上方法可實現(xiàn)核間數(shù)據(jù)交互。由于同一時刻AHB總線上只能有一個設(shè)備利用總線進行讀寫,所以可以保證讀寫操作的原子性,即標志變量不可能被CPU0和CPU1同時訪問。從而保證了標志變量的有效性。

圖 2‑2 用戶RAM讀時序

圖 2‑3 用戶RAM寫時序

參 考 文 獻

[1 ]John L . Hennessy , David A. Patterson , Computer Architecture : A Quantitative Approach , Fourth Edition [ M ]. Ap professional ,1990

[2 ] Sun Microsystems Inc. OpenSPARC T1 Microarchitecture Specification[ R]. 2006

[3 ]David A. Patterson , John L . Hennessy , Computer organization and design[ M ]. Morgan Kaufmann ,2004

[4 ] Michael D. Ciletti , Advanced digital design with the Verilog HDL [ M ]. Pearson ,2005

[5 ]周立. 計算機系統(tǒng)結(jié)構(gòu) [ M ]. 北京 :清華大學出版 社 ,2006

本站聲明: 本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

在嵌入式系統(tǒng)和大型軟件項目的開發(fā)中,跨平臺編譯工具鏈的效率直接影響開發(fā)迭代速度。本文深入探討CMake與Makefile在多核處理器環(huán)境下的優(yōu)化策略,結(jié)合實際項目數(shù)據(jù)(某工業(yè)控制系統(tǒng)編譯時間從12分鐘優(yōu)化至3.2分鐘),...

關(guān)鍵字: CMake Makefile 多核處理器 跨平臺編譯

隨著嵌入式技術(shù)的飛速發(fā)展,多核處理器已成為提升系統(tǒng)性能的關(guān)鍵技術(shù)。在多核處理器的任務調(diào)度中,非對稱多處理(AMP)和對稱多處理(SMP)是兩種主流模式。本文將深入探討這兩種模式的原理、特點、適用場景,并通過示例代碼展示其...

關(guān)鍵字: 多核處理器 AMP SMP

隨著多核處理器技術(shù)的不斷發(fā)展,其在嵌入式系統(tǒng)、航空航天、工業(yè)自動化等領(lǐng)域的應用日益廣泛。然而,多核并行系統(tǒng)在帶來性能提升的同時,也引入了一系列新的挑戰(zhàn),特別是在實時性和確定性方面。為了滿足這些領(lǐng)域?qū)θ蝿照{(diào)度的高要求,多核...

關(guān)鍵字: 操作系統(tǒng) 多核處理器

隨著嵌入式技術(shù)的飛速發(fā)展,高性能計算需求日益增長,多核處理器在嵌入式系統(tǒng)中的應用越來越廣泛。在這些系統(tǒng)中,如何高效地實現(xiàn)多核之間的通信成為了一個關(guān)鍵問題。RPMsg(Remote Processor Messaging)...

關(guān)鍵字: RPMsg 嵌入式 多核處理器

隨著汽車電子技術(shù)的飛速發(fā)展,多核處理器在車輛控制系統(tǒng)中的應用日益廣泛。特別是在區(qū)域控制器和中央計算單元等關(guān)鍵部位,高性能、多功能的微控制器成為了不可或缺的核心部件。其中,AURIX? TC3xx系列微控制器以其高算力、多...

關(guān)鍵字: 多核處理器 TSIM 算力

為增進大家對處理器的認識,本文將對多核處理器、多核處理器的技術(shù)優(yōu)勢予以介紹。

關(guān)鍵字: 處理器 指數(shù) 多核處理器

為增進大家對處理器的認識,本文將對處理器中的多核處理器的發(fā)展歷史予以介紹。

關(guān)鍵字: 處理器 指數(shù) 多核處理器

為增進大家對處理器的認識,本文將對多核處理器、多核處理器的優(yōu)點和缺點予以介紹。

關(guān)鍵字: 處理器 指數(shù) 多核處理器

為增進大家對處理器的認識,本文將對多核處理器予以介紹。

關(guān)鍵字: 處理器 指數(shù) 多核處理器

為增進大家對處理器的認識,本文將對單雙核處理器以及關(guān)于處理器的一些錯誤認識予以介紹。

關(guān)鍵字: 處理器 指數(shù) 多核處理器
關(guān)閉