日本黄色一级经典视频|伊人久久精品视频|亚洲黄色色周成人视频九九九|av免费网址黄色小短片|黄色Av无码亚洲成年人|亚洲1区2区3区无码|真人黄片免费观看|无码一级小说欧美日免费三级|日韩中文字幕91在线看|精品久久久无码中文字幕边打电话

當(dāng)前位置:首頁 > 嵌入式 > 嵌入式硬件

提出一個靈活多核處理器結(jié)構(gòu): FTPA.首先,通過將單個超塊獨立映射到單個物理核,F(xiàn)TPA 有效減少了超塊執(zhí)行時指令間通信開銷。其次,通過將物理核資源劃分為需要頻繁調(diào)整的計算資源和不經(jīng)常重構(gòu)的共享資源分別管理,F(xiàn)TPA 有效降低了邏輯核的重構(gòu)開銷。最后,通過將計算資源在邏輯上組織成環(huán)形拓?fù)?,F(xiàn)TPA 實現(xiàn)了邏輯核的任意粒度調(diào)整,提供高度的靈活性。運行SPEC2K 測試程序的結(jié)果顯示,F(xiàn)TPA 比已有的靈活多核結(jié)構(gòu)TFlex 性能平均提升19. 2% .

隨著半導(dǎo)體技術(shù)的發(fā)展,處理器設(shè)計進入多核時代。在多核平臺上,單線程程序加速仍是一個關(guān)鍵問題,同時也面臨著巨大挑戰(zhàn): 一方面,程序的映射需要在并行性和通信開銷之間做出權(quán)衡,因為并行執(zhí)行在帶來并行潛力的同時,也伴隨著通信開銷的增加; 另一方面,由于應(yīng)用的多樣性,程序之間以及程序內(nèi)部的不同執(zhí)行階段,并行性也存在巨大差異。因此,如何根據(jù)程序運行時的并行特征適當(dāng)?shù)胤峙湫酒Y源、提高資源利用率,對于提高多核系統(tǒng)整體性能和降低功耗都有重要意義。

當(dāng)前商業(yè)通用多核處理器主要基于傳統(tǒng)的單處理器核來構(gòu)建,這種粗粒度的設(shè)計方案適合開發(fā)單個核上的指令級并行性和多個核上的線程級并行性,但并不能很好地解決多核平臺上單線程程序并行執(zhí)行問題。近年來學(xué)術(shù)界提出的處理器核可配置的靈活多核處理器方案為多核結(jié)構(gòu)發(fā)展提供了一種嶄新的思路: 靈活多核處理器通常由很多同構(gòu)的、性能較弱的小處理器核( 稱為物理核) 構(gòu)成; 在執(zhí)行程序時,多個物理核可以根據(jù)程序當(dāng)前的并行性特征,動態(tài)地組合成單個更大粒度的邏輯核。由于邏輯核可以集成多個物理核的指令窗口、發(fā)射寬度以及物理核內(nèi)的高速緩存等資源,因此具有巨大的并行性開發(fā)潛力。此外,在執(zhí)行過程中,這種2 級的組織方式,允許運行時系統(tǒng)根據(jù)不同應(yīng)用,或者同一應(yīng)用內(nèi)部不同執(zhí)行階段的并行性差異,動態(tài)增減邏輯核內(nèi)物理核的數(shù)量,從而在滿足應(yīng)用并行性需求的同時,最大限度的提高資源利用率。

然而,現(xiàn)有的靈活多核處理器結(jié)構(gòu)方案仍存在很多問題: Core Fusion, Federation,Voltron和WiDGET目前只支持靜態(tài)的、編譯器指導(dǎo)的邏輯核配置。TFlex雖然支持動態(tài)的邏輯核粒度調(diào)整,但是由于邏輯核內(nèi)分布式共享物理核的所有資源,導(dǎo)致邏輯核重配置的開銷巨大,不適合實時的細(xì)粒度的動態(tài)資源調(diào)整; 同時,TFlex 上單線程程序在多個物理核上激進的分布式執(zhí)行,也造成顯著的指令間通信和寄存器文件訪問開銷,限制了其邏輯核性能的可擴展性。

針對目前靈活多核結(jié)構(gòu)存在的上述高通信開銷、高邏輯核重構(gòu)開銷和低靈活性問題,本文提出一種新的靈活多核處理器結(jié)構(gòu)FTPA ( flexibletiled processor architecture) . FTPA 采用顯式數(shù)據(jù)流圖執(zhí)行( EDGE) 指令集,將程序編譯成超塊( Hyperblock),并以超塊為基本單元進行推測執(zhí)行。 從程序執(zhí)行角度看,F(xiàn)TPA 可以根據(jù)程序的階段并行性特征,改變超塊級推測執(zhí)行的深度,從而保證程序的高效執(zhí)行。 從結(jié)構(gòu)設(shè)計角度看,在邏輯核層次,F(xiàn)TPA 將易擴展的計算資源( 如ALU)和相對固定的共享資源( 如一級Cache) 進行邏輯上的分離,并將計算資源組織成環(huán)形的拓?fù)浣Y(jié)構(gòu),從而實現(xiàn)了邏輯核任意粒度的增減,提供高度的靈活性。 在物理核層次,首先,F(xiàn)TPA 通過將超塊和物理核一一對應(yīng)映射,有效降低了超塊執(zhí)行時指令間通信和寄存器文件訪問開銷; 其次,根據(jù)對超塊并行性特征的分析,F(xiàn)TPA 選擇4 發(fā)射的物理核設(shè)計,保證對超塊內(nèi)指令級并行性的高效開發(fā);最后,F(xiàn)TPA 將物理核內(nèi)指令窗口進行分體,與4套執(zhí)行部件相對應(yīng),從而降低了指令選擇發(fā)射邏輯復(fù)雜度。實驗評估表明,F(xiàn)TPA 在具備高靈活性的同時,比已有的靈活多核結(jié)構(gòu)TFlex 性能平均提升19.2% .

本站聲明: 本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

德國康佳特亮相上海工博會,展示多款應(yīng)用就緒的嵌入式解決方案平臺

關(guān)鍵字: 嵌入式 傳感器 處理器

9月10日消息,在最近的高盛Communacopia +科技大會上,Intel副總裁John Pitzer透露了Intel在x86和IFS計劃方面的一些新細(xì)節(jié)。

關(guān)鍵字: Intel 處理器

在當(dāng)今的高性能計算領(lǐng)域,確保處理器、存儲和加速器之間快速可靠的通信對系統(tǒng)性能和可擴展性至關(guān)重要。因此,就誕生了Compute Express Link?(CXL?)標(biāo)準(zhǔn):其目標(biāo)是實現(xiàn)一致的內(nèi)存訪問、低延遲的數(shù)據(jù)傳輸,以及...

關(guān)鍵字: 芯片設(shè)計 處理器 加速器

9月9日消息,Intel宣布了一系列重大人事調(diào)整,涉及數(shù)據(jù)中心事業(yè)部(DCG)、客戶端計算事業(yè)部(CCG)以及新成立的中央工程事業(yè)部(CEG)。

關(guān)鍵字: Intel 處理器

在半導(dǎo)體行業(yè)的風(fēng)云變幻中,英特爾公司近來可謂麻煩不斷。

關(guān)鍵字: 英特爾 半導(dǎo)體 處理器

9月2日消息,Intel近日坦承,自家高端桌面CPU競爭力不如AMD的銳龍9000系列,但強調(diào)Panther Lake系列將按計劃在今年內(nèi)上市,同時下一代Nova Lake將全力反擊。

關(guān)鍵字: Intel 處理器

8月26日消息,據(jù)報道,美國政府不僅通過股權(quán)投資Intel,還積極協(xié)助其在美國本土生產(chǎn)先進芯片,包括主動聯(lián)系潛在主要客戶,以提振其晶圓代工業(yè)務(wù)。

關(guān)鍵字: Intel 處理器

8月21日消息,據(jù)報道,Intel正在開發(fā)的新一代AI芯片Jaguar Shores近日首次得到曝光。

關(guān)鍵字: Intel 處理器

8月21日消息,據(jù)報道,Intel近期因資金困境等問題,導(dǎo)致多個關(guān)鍵項目被取消,大量核心人才流失。

關(guān)鍵字: Intel 處理器
關(guān)閉