日本黄色一级经典视频|伊人久久精品视频|亚洲黄色色周成人视频九九九|av免费网址黄色小短片|黄色Av无码亚洲成年人|亚洲1区2区3区无码|真人黄片免费观看|无码一级小说欧美日免费三级|日韩中文字幕91在线看|精品久久久无码中文字幕边打电话

當前位置:首頁 > 工業(yè)控制 > 電子設計自動化

  本文提出了一種面向?qū)ΨQ體系結(jié)構(gòu)的FPGA仿真模型,該模型的核心設計思想是:分時復用仿真系統(tǒng)中的一個單元來仿真目標系統(tǒng)中多個對稱單元的行為,從而利用較少的硬件資源完成系統(tǒng)仿真,提高FPGA的利用率。

  1 對稱多核體系結(jié)構(gòu)FPGA仿真模型

  對稱多核如SMP(Symmetry Multi-Processor)體系結(jié)構(gòu)中,通常包含多個對稱的處理器核或計算核心,這里統(tǒng)稱為計算核。計算核占據(jù)了多核體系結(jié)構(gòu)的主要硬件開銷,且對稱多核體系結(jié)構(gòu)的硬件仿真平臺FPGA資源消耗隨計算核數(shù)目成線性增加。這里提出的對稱多核體系結(jié)構(gòu)FPGA仿真模型,解耦合計算核數(shù)目與系統(tǒng)硬件開銷的線性關系,其核心設計思想是:在構(gòu)建仿真系統(tǒng)時,使用一個與目標系統(tǒng)中單個計算核等同的處理單元,稱為虛擬計算單元VAU(Virtual Arithmetic Unit)代替所有的對稱計算核,通過分時復用VAU實現(xiàn)一個計算單元虛擬多個計算核的行為。

  圖l中的左圖是當前具有對稱結(jié)構(gòu)的多核體系結(jié)構(gòu)模型抽象,n個對稱的計算核通過特定的互連結(jié)構(gòu)連接,其連接關系由目標處理器的工作模式?jīng)Q定;右圖是本文提出的仿真模型??梢钥闯?,仿真系統(tǒng)中采用一個VAU代替了目標系統(tǒng)中所有對稱的處理單元PU。在對目標系統(tǒng)進行仿真時,計算頁控制器VAUC(VAU Controller)控制1個VAU分時復用的方式工作,虛擬多個PU并行執(zhí)行。分時的粒度與處理單元之間的耦合度相關。虛擬計算單元將目標系統(tǒng)中并行執(zhí)行模式轉(zhuǎn)變?yōu)榇袌?zhí)行的方式進行仿真,以時間換取空間,減少系統(tǒng)中計算資源的消耗。BS(Backup Storage)用于存儲VAU虛擬各PU執(zhí)行時的中間結(jié)果。

  

  2 仿真系統(tǒng)執(zhí)行模式

  2.1 多核/眾核體系結(jié)構(gòu)仿真系統(tǒng)執(zhí)行模式

  對稱多核處理器中處理單元之間的耦合度不同,使得對應的仿真系統(tǒng)的執(zhí)行模式也不一樣。多核/眾核體系結(jié)構(gòu)通常采用粗粒度耦合執(zhí)行的方式。如圖2(a)所示.多個處理單元之間相互比較獨立,其同步和通信通常處于任務級,即多個處理單元間的通信和同步的次數(shù)遠小于它們執(zhí)行的指令數(shù)。圖中PUi和PUj之間有一次通信,PUi、PUj和PUk之間有一次同步。對應的仿真系統(tǒng)的執(zhí)行模式如圖2(b)所示,VAU先對PUi進行仿真,執(zhí)行到與通信點時,將PUi的執(zhí)行信息導入BS,然后VAU對PUi進行仿真,執(zhí)行到與通信點時,將PUj的執(zhí)行信息導入BS,將PUi的執(zhí)行信息由BS導入VMU,對PUi的后續(xù)行為進行仿真,以此類推,如圖2所示,箭頭每穿過中線一次,表示計算頁切換一次仿真對象,指向下的箭頭表示VMU的信息導入BS,指向上的箭頭表示BS中的信息導出至VMU。為了減少現(xiàn)場切換的次數(shù),對兩個PU通信時的執(zhí)行過程進行優(yōu)化,如圖2(c)所示,VAU仿真PUi執(zhí)行至通信點時,切換至PUj進行仿真,只有在PUj遇到其他同步或通信時,才進行現(xiàn)場切換,否則VAU一直對PUj進行仿真,直至PUj執(zhí)行結(jié)束。PUj執(zhí)行到與通信點時,PUj將通信數(shù)據(jù)發(fā)送至網(wǎng)絡緩沖,并寫入PUi對應的存儲空間,如圖2(c)中虛線所示。

  

  2.2 SIMD體系結(jié)構(gòu)仿真系統(tǒng)執(zhí)行模式

  SIMD體系結(jié)構(gòu)的處理單元之間是緊密耦合的,所有處理單元的執(zhí)行過程都是嚴格同步的,即同一時鐘周期內(nèi)每個處理單元都對不同的數(shù)據(jù)進行完全同樣的操作,如圖3(a)所示。

  

  在SIMD體系結(jié)構(gòu)仿真系統(tǒng)中,必須在邏輯上保持這種完全同步的執(zhí)行模式。本文采用的方式是,一條指令流出之后,讓它在指令流水線中保持n個時鐘周期(可以在連續(xù)的n個時鐘內(nèi)都發(fā)射同一條指令),VAU在這n個周期內(nèi)分別對各處理單元對應的數(shù)據(jù)進行處理。若將n個時鐘周期看作系統(tǒng)的工作周期,則n個數(shù)據(jù)是在同一工作周期內(nèi)被處理,如圖3(b)所示。這樣則在邏輯上保持SIMD的執(zhí)行模式。

  3 仿真系統(tǒng)評估

  本文的目標系統(tǒng)如圖4(a)所示。它由多個計算節(jié)點以Torus片上網(wǎng)絡連接構(gòu)成,其計算節(jié)點數(shù)目可以根據(jù)應用需求進行擴展。對應的仿真系統(tǒng)如圖4(b)所示。在仿真系統(tǒng)中,采用一個虛擬計算節(jié)點(VAU)代替目標系統(tǒng)中的p個計算節(jié)點,圖4(b)以p=4為例,展示了仿真系統(tǒng)的結(jié)構(gòu)。目標系統(tǒng)中p個計算節(jié)點的計算操作都由VAU以圖2的工作模式完成。VAU中包含一個現(xiàn)場保存存儲器(context backup),用于保存目標系統(tǒng)中p個計算節(jié)點的中間結(jié)果。contextbackup的容量為每個計算節(jié)點中本地存儲器容量的p倍,這樣,context backup就有足夠的能力存儲p個計算節(jié)點的中間結(jié)果,從而減少與外部存儲器的數(shù)據(jù)交換,減少VAU的停頓時間。

  

  采用FPGA EP2S180(擁有143 520 ALUT,相當于18萬邏輯門)實現(xiàn)了多種結(jié)構(gòu)(計算節(jié)點的數(shù)目不同)的目標系統(tǒng)和基于仿真模型的仿真系統(tǒng),并利用相應的硬件綜合工具Quartus分析仿真系統(tǒng)的FPGA資源開銷。系統(tǒng)采用包含1個cluster的MASA流處理器作為計算節(jié)點。為更好地驗證仿真模型,流處理器中采用功能裁剪的cluster,如圖4所示,cluster中僅包含3個計算單元和1個I/O單元,并相應降低指令和數(shù)據(jù)存儲器的容量。在仿真系統(tǒng)中,VAU中的processor為流處理器中的核心計算部件,context backup代替了片上存儲部件,其容量為SRF的p倍。該實驗的目的是分析所提出的仿真模型對仿真系統(tǒng)的硬件資源消耗和仿真速度的影響。

  3.1 資源消耗分析

  圖5是目標系統(tǒng)和仿真系統(tǒng)的FPGA資源消耗統(tǒng)計。由于布局布線的需求,F(xiàn)PGA芯片的資源使用率最高通常只能達到70%~80%。圖5中“×”標識表示當前配置超出EP2S180的仿真能力??梢钥闯?,在不采用仿真優(yōu)化技術時,EP2S180可仿真的最大規(guī)模目標系統(tǒng)為24個計算節(jié)點?;诒疚牡姆抡婺P停攑值等于4時,EP2S180的仿真能力提高至64個節(jié)點;當p值等于8時,其仿真能力提高至96個節(jié)點。當p值增大時,其仿真能力可進一步提升。實驗結(jié)果表明,本文提出的仿真模型能夠增大FPGA芯片可仿真系統(tǒng)的規(guī)模。

  

  3.2 仿真速度分析

  本文采用矩陣乘運算,分別在8、16、32個節(jié)點的目標系統(tǒng)和仿真系統(tǒng)上執(zhí)行,測試二者的仿真速度。目標系統(tǒng)和仿真系統(tǒng)的工作頻率為75 MHz。圖6展示了二者的執(zhí)行時間。

  

  可以看出,仿真系統(tǒng)的執(zhí)行時間大于目標系統(tǒng)。其時間增量主要是由于仿真系統(tǒng)將目標系統(tǒng)中多個processor并行處理的任務移植到一個VAU上串行執(zhí)行造成。仿真系統(tǒng)沒有改變目標系統(tǒng)的數(shù)據(jù)傳輸路徑和模式,因此,數(shù)據(jù)傳輸?shù)臅r間并沒有增加。另外,由于VAU虛擬的p個pro-cessor共享了存儲空間,仿真系統(tǒng)中消除了p個processor之間的數(shù)據(jù)傳輸時間。雖然仿真系統(tǒng)相對于目標系統(tǒng)執(zhí)行時間有所增加,但其時間增量處于秒級。相對于緩慢的軟件模擬器,并綜合考慮仿真模型對FPGA仿真規(guī)模帶來的好處,因此認為該仿真模型帶來的仿真時間增量是可以接受的。

  4 結(jié)束語

  本文提出了面向?qū)ΨQ多核體系結(jié)構(gòu)的FPGA仿真模型,以及基于該模型的多核/眾核、SIMD體系結(jié)構(gòu)的執(zhí)行模式。相對于軟硬件聯(lián)合仿真方法,該仿真模型減少了軟硬件協(xié)同邏輯并避免了設計復雜的軟件劃分算法。實驗結(jié)果表明,面向?qū)ΨQ多核體系結(jié)構(gòu)的FPGA仿真模型能有效地減少仿真系統(tǒng)FPGA資源的需求,增大FPGA的仿真規(guī)模,并且其帶來的仿真時間增量是可接受的。但該仿真模型主要是面向?qū)ΨQ體系結(jié)構(gòu),而不適用于異構(gòu)多核系統(tǒng)等非對稱結(jié)構(gòu)。

本站聲明: 本文章由作者或相關機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

浙江寧波2025年9月8日 /美通社/ -- 人工智能的熱流在寧波翻涌。9月4日,由浙江數(shù)字經(jīng)濟百人會主辦的"智能時代 浙里領航——智能體創(chuàng)新與應用圓桌會",成為一場重量級思想碰撞的樞紐。匯聚政產(chǎn)學研...

關鍵字: 智能體 離散 AI 模型

北京2025年9月5日 /美通社/ -- 9月4日,在北京市人民政府新聞辦公室舉行的"一把手發(fā)布?京華巡禮"系列主題新聞發(fā)布會上,北京經(jīng)開區(qū)對外發(fā)布,北京經(jīng)濟技術開發(fā)區(qū)(簡稱"北京經(jīng)開區(qū)&q...

關鍵字: 人工智能 模型 開源 AI

杭州2025年9月2日 /美通社/ -- 9月2日,央視《朝聞天下》欄目發(fā)布報道,重點關注中控技術在"人工智能+工業(yè)"領域的最新成果——時間序列大模型TPT 2(Time-series Pre-tra...

關鍵字: 人工智能 模型 PLAYER ASIA

北京2025年9月2日 /美通社/ -- 近日,深圳云天暢想信息科技有限公司(下稱"云天暢想")與浪潮信息正式簽署元腦生態(tài)戰(zhàn)略合作協(xié)議。雙方將聚焦教育行業(yè)AIGC應用落地,在AIGC實訓平臺、智能體平...

關鍵字: AI 模型 開發(fā)平臺 智能體

北京2025年8月28日 /美通社/ -- 8月28日,北京亦莊創(chuàng)新發(fā)布消息,北京經(jīng)濟技術開發(fā)區(qū)(簡稱"北京經(jīng)開區(qū)",又稱"北京亦莊")創(chuàng)新推出"一張清單、一鏈延伸、一套...

關鍵字: 接線 數(shù)字化 智能化 模型

深圳2025年8月28日 /美通社/ -- 8月27日,全球領先的無線通信與AI解決方案提供商廣和通發(fā)布新一代具身智能開發(fā)平臺 Fibot。Fibot已成功應用于Physic...

關鍵字: PHYSICAL 開發(fā)平臺 模型 INTELLIGENCE

首個采用高分辨率太陽觀測數(shù)據(jù)訓練的太陽物理學人工智能 (AI) 基礎模型,旨在深入探索太陽動態(tài)表面,對可能干擾地球和太空技術的太陽天氣做出有效規(guī)劃。 該模型已發(fā)布在 Hugging Face 開源平臺,旨在加快...

關鍵字: IBM NASA 開源 模型

上海2025年8月26日 /美通社/ -- 在全球數(shù)字經(jīng)濟加速演進的時代浪潮中,海量數(shù)據(jù)資源正成為企業(yè)發(fā)展的雙刃劍。超66%的企業(yè)面臨"數(shù)據(jù)沉睡"危機——分散于供應鏈、財務、客戶運營等數(shù)十個系統(tǒng)的業(yè)務...

關鍵字: AI 模型 軟件 數(shù)據(jù)分析

北京2025年8月25日 /美通社/ --?據(jù)潮起網(wǎng)報道。 圖1 近日,中國領先的AI科技公司楓清科技(Fabarta)推出的"Fabarta個人專屬智能體"已結(jié)束內(nèi)測并向公眾用戶開放免費下載試用。 Fabarta...

關鍵字: 智能體 AI FAB 模型

北京2025年8月22日 /美通社/ -- 近日,杭州數(shù)宇智匯科技發(fā)展有限責任公司(以下簡稱 "數(shù)宇智匯")與浪潮信息簽署元腦生態(tài)戰(zhàn)略合作協(xié)議。雙方將圍繞大模型知識平臺、智能問答機器人等核心領域展開深...

關鍵字: 機器人 模型 智能化 多模
關閉