日本黄色一级经典视频|伊人久久精品视频|亚洲黄色色周成人视频九九九|av免费网址黄色小短片|黄色Av无码亚洲成年人|亚洲1区2区3区无码|真人黄片免费观看|无码一级小说欧美日免费三级|日韩中文字幕91在线看|精品久久久无码中文字幕边打电话

當(dāng)前位置:首頁(yè) > 嵌入式 > 嵌入式軟件
[導(dǎo)讀]用PowerPC實(shí)現(xiàn)高帶寬 TCP/IP 性能

今天,實(shí)現(xiàn)線速 TCP/IP 性能仍舊是一項(xiàng)重大設(shè)計(jì)挑戰(zhàn)。在本文中,我們將討論限制 TCP/IP 性能的單位字節(jié)和單位包的處理成本,并給出在基于嵌入式處理器的應(yīng)用中實(shí)現(xiàn)千兆位以太網(wǎng) TCP/IP 性能最大化的技術(shù)。

  千兆位以太網(wǎng)性能的獲得是通過利用多端口 DDR 存儲(chǔ)器控制器,在嵌入式 PowerPC處理器局部總線 (PLB) 接口與兩個(gè)數(shù)據(jù)端口之間分配存儲(chǔ)器帶寬而實(shí)現(xiàn)的。每個(gè)數(shù)據(jù)端口連接到一個(gè)直接存儲(chǔ)器訪問 (DMA) 控制器,從而允許硬件外設(shè)對(duì)存儲(chǔ)器進(jìn)行高帶寬訪問。

  系統(tǒng)架構(gòu)
  存儲(chǔ)器帶寬對(duì)高性能網(wǎng)絡(luò)連接應(yīng)用來(lái)說(shuō)是一個(gè)重要考慮事項(xiàng)。通常,外部 DDR 存儲(chǔ)器為處理器和一個(gè)或多個(gè)高帶寬外設(shè)(如以太網(wǎng))所共享。一個(gè)多端口存儲(chǔ)器控制器負(fù)責(zé)將可用存儲(chǔ)器帶寬高效地分配給處理器接口和流式外設(shè),包括以太網(wǎng)。流式外設(shè)通過點(diǎn)對(duì)點(diǎn)流式接口由直接存儲(chǔ)器訪問 (DMA) 控制器鏈接到存儲(chǔ)器。DMA 控制器實(shí)行分散-收集 (scatter-gather) 機(jī)制,由此將多個(gè)緩沖區(qū)轉(zhuǎn)換到以太網(wǎng)或其他流式外設(shè)上的一個(gè)數(shù)據(jù)流,或相反。以太網(wǎng)外設(shè)對(duì)發(fā)送和接收路徑同時(shí)實(shí)行校驗(yàn)和卸載,以優(yōu)化 TCP 性能。下圖顯示了上述系統(tǒng)的一種框圖。


  TCP/IP 單位字節(jié)處理成本
  當(dāng)處理器處理有效載荷數(shù)據(jù)時(shí)就會(huì)產(chǎn)生單位字節(jié)處理成本。這種類型的兩個(gè)最常見的操作是緩沖區(qū)復(fù)制和 TCP 校驗(yàn)和計(jì)算。緩沖區(qū)復(fù)制意味著重大處理開銷,這有兩個(gè)原因:
  1. 大部分復(fù)制都不是必要的。
  2. 處理器不是高效的數(shù)據(jù)搬運(yùn)工。

  TCP 校驗(yàn)和計(jì)算代價(jià)高昂,因?yàn)樾枰獙?duì)每個(gè)有效載荷數(shù)據(jù)字節(jié)進(jìn)行計(jì)算。支持嵌入式 TCP/IP 的應(yīng)用(如醫(yī)療成像)要求使用接近線速的 TCP 帶寬,以便通過千兆位以太網(wǎng)可靠地傳輸圖像數(shù)據(jù)。數(shù)據(jù)是從高分辨率圖像源生成的,而不是處理器。這種情況下,引入零復(fù)制軟件 API 并將校驗(yàn)和計(jì)算利用FPGA 邏輯結(jié)構(gòu)實(shí)現(xiàn),將徹底地消除單位字節(jié)處理成本。"零復(fù)制"是用來(lái)描述一個(gè) TCP 軟件接口不會(huì)發(fā)生任何緩沖區(qū)復(fù)制的術(shù)語(yǔ)。Linux 和其他操作系統(tǒng)已經(jīng)引入了用于此目的的軟件接口,商用獨(dú)立 TCP/IP 棧廠商如 Treck 也提供了類似的零復(fù)制特性。這些軟件特性允許消除用戶應(yīng)用程序與 TCP/IP ?;虿僮飨到y(tǒng)之間的緩沖區(qū)復(fù)制。

  系統(tǒng)的分散-收集與校驗(yàn)和卸載特性為零復(fù)制功能提供了所需的硬件支持。分散-收集特性是 DMA 控制器的一種靈活性,它允許軟件緩沖區(qū)位于任意字節(jié)偏移處。這避免了處理器復(fù)制未對(duì)齊或碎片化的緩沖區(qū)。

  校驗(yàn)和卸載是以太網(wǎng)外設(shè)的一種特性。它允許當(dāng)以太網(wǎng)幀在主存儲(chǔ)器與外設(shè)的硬件 FIFO 之間傳輸時(shí),在 FPGA 結(jié)構(gòu)中進(jìn)行 TCP 有效載荷的校驗(yàn)。這些系統(tǒng)特性消除了代價(jià)較高的緩沖區(qū)復(fù)制與處理器校驗(yàn)和操作,讓處理器專心執(zhí)行協(xié)議操作和用戶功能。

  TCP/IP 單位包處理成本
  單位包處理成本與涉及包的發(fā)送或接收的操作有關(guān)。包中斷、硬件接口和頭處理等,都是單位包處理成本的例子。中斷處理成本對(duì)處理器和存儲(chǔ)器子系統(tǒng)構(gòu)成相當(dāng)大的負(fù)擔(dān),特別是在傳輸小包時(shí)。中斷結(jié)合 (Interrupt coalescing) 是此類系統(tǒng)中用來(lái)緩解這種壓力的一種技術(shù),它將中斷處理成本通過多個(gè)包分期攤還。DMA 引擎將一直等待,直到出現(xiàn) n 個(gè)要處理的幀,然后才中斷處理器,其中 n 是一個(gè)軟件可調(diào)的值。

  通過減少傳輸幀的數(shù)量,大尺寸包(9,000 字節(jié)的巨幀)的傳輸具有相似的效果,由此可得到中斷數(shù)。它把單位包處理成本分?jǐn)傇谝粋€(gè)較大的數(shù)據(jù)有效載荷上。

  設(shè)計(jì)實(shí)現(xiàn)
  實(shí)現(xiàn)這種體系結(jié)構(gòu)的一個(gè)例子是賽靈思公司的千兆位系統(tǒng)參考設(shè)計(jì) (GSRD)。它面向基于 TCP/IP 的協(xié)議與用戶數(shù)據(jù)接口(如高分辨率圖像捕捉或光纖信道)之間的高性能橋接。GSRD 的組件包含解決 TCP/IP 系統(tǒng)的單位字節(jié)處理成本和單位包處理成本的特性。對(duì)于需要使用嵌入式操作系統(tǒng)的應(yīng)用,可提供 MontaVista Linux端口和來(lái)自 Treck 的商業(yè)獨(dú)立 TCP/IP 棧,以滿足具有最高帶寬要求的應(yīng)用。GSRD 使用巨幀可提供高達(dá) 890 Mbps 的發(fā)送 TCP 性能,可采用賽靈思公司目前最新的 FPGA 技術(shù)來(lái)實(shí)現(xiàn)。 GSRD 可以從 http://www.xilinx.com/gsrd/ 下載得到。

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

在AI訓(xùn)練集群和超算中心場(chǎng)景中,傳統(tǒng)CPU處理網(wǎng)絡(luò)協(xié)議棧導(dǎo)致的20μs級(jí)延遲和30%的CPU資源占用已成為性能瓶頸。NVIDIA BlueField-3 DPU通過硬件卸載TCP/IP處理,結(jié)合內(nèi)核旁路(Kernel B...

關(guān)鍵字: DPU BlueField-3 TCP/IP

June 24, 2025 ---- 近期市場(chǎng)對(duì)于NVIDIA RTX PRO 6000系列產(chǎn)品的討論聲量高,預(yù)期在需求支撐下,整體出貨將有不俗表現(xiàn)。然而,TrendForce集邦咨詢資深研究副總吳雅婷認(rèn)為,該系列產(chǎn)品受...

關(guān)鍵字: 存儲(chǔ)器 供應(yīng)鏈 邊緣AI

在當(dāng)今數(shù)據(jù)爆炸的時(shí)代,數(shù)據(jù)中心面臨著前所未有的網(wǎng)絡(luò)性能挑戰(zhàn)。傳統(tǒng)的網(wǎng)絡(luò)處理方式主要依賴CPU,但隨著網(wǎng)絡(luò)流量的急劇增長(zhǎng),CPU在網(wǎng)絡(luò)協(xié)議棧處理上的開銷日益增大,導(dǎo)致系統(tǒng)整體性能下降、延遲增加。數(shù)據(jù)處理單元(DPU)的出現(xiàn)...

關(guān)鍵字: DPU TCP/IP lueField-3

在人工智能訓(xùn)練、實(shí)時(shí)圖形渲染與科學(xué)計(jì)算領(lǐng)域,存儲(chǔ)器帶寬已成為制約系統(tǒng)性能的核心瓶頸。HBM3與GDDR7作為當(dāng)前顯存技術(shù)的兩大巔峰之作,分別通過三維堆疊與信號(hào)調(diào)制技術(shù)的突破,為不同應(yīng)用場(chǎng)景提供了差異化解決方案。本文從架構(gòu)...

關(guān)鍵字: 存儲(chǔ)器 HBM3

傳統(tǒng)存儲(chǔ)器技術(shù)逼近物理極限,鐵電場(chǎng)效應(yīng)晶體管(FeFET)憑借其獨(dú)特的極化翻轉(zhuǎn)機(jī)制與非易失性邏輯特性,成為突破馮·諾依曼架構(gòu)瓶頸的關(guān)鍵技術(shù)。FeFET通過將鐵電材料集成至晶體管柵極,實(shí)現(xiàn)了存儲(chǔ)與邏輯功能的深度融合,其物理...

關(guān)鍵字: FeFET 存儲(chǔ)器

數(shù)字化轉(zhuǎn)型與人工智能技術(shù)驅(qū)動(dòng),數(shù)據(jù)中心存儲(chǔ)架構(gòu)正經(jīng)歷從傳統(tǒng)磁盤陣列向全閃存與新型內(nèi)存技術(shù)的深度變革。全閃存陣列(AFA)憑借亞毫秒級(jí)延遲與高IOPS性能重塑存儲(chǔ)性能基準(zhǔn),而持久化內(nèi)存(PMEM)則通過填補(bǔ)DRAM與SSD...

關(guān)鍵字: 數(shù)據(jù)中心 存儲(chǔ)器

AI算力與數(shù)據(jù)中心規(guī)模持續(xù)擴(kuò)張,存儲(chǔ)器糾錯(cuò)碼(ECC)技術(shù)已成為保障數(shù)據(jù)完整性的核心防線。從硬件加速架構(gòu)到算法優(yōu)化,ECC技術(shù)正通過多維度創(chuàng)新,將內(nèi)存錯(cuò)誤率降低至每萬(wàn)億小時(shí)1次以下,為關(guān)鍵任務(wù)系統(tǒng)提供接近零故障的可靠性保...

關(guān)鍵字: 存儲(chǔ)器 ECC

存儲(chǔ)器供應(yīng)鏈安全已成為國(guó)家戰(zhàn)略的核心命題,從晶圓代工到封裝測(cè)試,中國(guó)存儲(chǔ)器產(chǎn)業(yè)正通過關(guān)鍵環(huán)節(jié)的技術(shù)突破與生態(tài)重構(gòu),走出一條從“受制于人”到“自主可控”的替代之路。這條路徑不僅關(guān)乎產(chǎn)業(yè)安全,更承載著數(shù)字經(jīng)濟(jì)時(shí)代的技術(shù)主權(quán)。

關(guān)鍵字: 存儲(chǔ)器 國(guó)產(chǎn)化替

AI算力需求爆炸式增長(zhǎng),存儲(chǔ)器封裝技術(shù)正經(jīng)歷從2.5D到3D異構(gòu)集成的范式變革。這種變革不僅重構(gòu)了芯片間的物理連接方式,更對(duì)散熱設(shè)計(jì)與信號(hào)完整性提出了全新挑戰(zhàn)。本文從封裝架構(gòu)演進(jìn)、散熱機(jī)制創(chuàng)新與信號(hào)完整性保障三個(gè)維度,解...

關(guān)鍵字: 存儲(chǔ)器 散熱

數(shù)據(jù)成為核心生產(chǎn)要素的時(shí)代,存儲(chǔ)器安全技術(shù)已成為保障數(shù)字資產(chǎn)隱私與完整性的關(guān)鍵防線。從早期基于硬件的加密引擎到現(xiàn)代可信執(zhí)行環(huán)境(TEE)的生態(tài)構(gòu)建,存儲(chǔ)器安全技術(shù)經(jīng)歷了從單一防護(hù)到體系化協(xié)同的演進(jìn)。本文從硬件加密引擎、存...

關(guān)鍵字: 存儲(chǔ)器 TEE
關(guān)閉