日本黄色一级经典视频|伊人久久精品视频|亚洲黄色色周成人视频九九九|av免费网址黄色小短片|黄色Av无码亚洲成年人|亚洲1区2区3区无码|真人黄片免费观看|无码一级小说欧美日免费三级|日韩中文字幕91在线看|精品久久久无码中文字幕边打电话

當前位置:首頁 > > 后端技術(shù)指南針
[導(dǎo)讀]像大白這種調(diào)包俠,深知不懂底層技術(shù)點就如同空中樓閣,再這樣下去面阿里p10是沒希望了。想到這里,我開始慌了,所以今天和大家一起學習個底層技術(shù)點-零拷貝Zero-Copy。

1.前言

像大白這種調(diào)包俠,深知不懂底層技術(shù)點就如同空中樓閣,再這樣下去面阿里p10是沒希望了。

想到這里,我開始慌了,所以今天和大家一起學習個底層技術(shù)點-零拷貝Zero-Copy。

Linux系統(tǒng)中一切皆文件,仔細想一下Linux系統(tǒng)的很多活動無外乎讀操作寫操作,零拷貝就是為了提高讀寫性能而出現(xiàn)的。

廢話不多說,馬上開大車,走起!

2. 數(shù)據(jù)拷貝基礎(chǔ)過程

在Linux系統(tǒng)內(nèi)部緩存和內(nèi)存容量都是有限的,更多的數(shù)據(jù)都是存儲在磁盤中。對于Web服務(wù)器來說,經(jīng)常需要從磁盤中讀取數(shù)據(jù)到內(nèi)存,然后再通過網(wǎng)卡傳輸給用戶:

上述數(shù)據(jù)流轉(zhuǎn)只是大框,接下來看看幾種模式。

2.1 僅CPU方式

  • 當應(yīng)用程序需要讀取磁盤數(shù)據(jù)時,調(diào)用read()從用戶態(tài)陷入內(nèi)核態(tài),read()這個系統(tǒng)調(diào)用最終由CPU來完成;
  • CPU向磁盤發(fā)起I/O請求,磁盤收到之后開始準備數(shù)據(jù);
  • 磁盤將數(shù)據(jù)放到磁盤緩沖區(qū)之后,向CPU發(fā)起I/O中斷,報告CPU數(shù)據(jù)已經(jīng)Ready了;
  • CPU收到磁盤控制器的I/O中斷之后,開始拷貝數(shù)據(jù),完成之后read()返回,再從內(nèi)核態(tài)切換到用戶態(tài);

2.2 CPU&DMA方式

CPU的時間寶貴,讓它做雜活就是浪費資源。

直接內(nèi)存訪問(Direct Memory Access),是一種硬件設(shè)備繞開CPU獨立直接訪問內(nèi)存的機制。所以DMA在一定程度上解放了CPU,把之前CPU的雜活讓硬件直接自己做了,提高了CPU效率。

目前支持DMA的硬件包括:網(wǎng)卡、聲卡、顯卡、磁盤控制器等。

有了DMA的參與之后的流程發(fā)生了一些變化:

最主要的變化是,CPU不再和磁盤直接交互,而是DMA和磁盤交互并且將數(shù)據(jù)從磁盤緩沖區(qū)拷貝到內(nèi)核緩沖區(qū),之后的過程類似。

敲黑板】無論從僅CPU方式和DMA&CPU方式,都存在多次冗余數(shù)據(jù)拷貝和內(nèi)核態(tài)&用戶態(tài)的切換。

我們繼續(xù)思考Web服務(wù)器讀取本地磁盤文件數(shù)據(jù)再通過網(wǎng)絡(luò)傳輸給用戶的詳細過程。

3.普通模式數(shù)據(jù)交互

一次完成的數(shù)據(jù)交互包括幾個部分:系統(tǒng)調(diào)用syscall、CPU、DMA、網(wǎng)卡、磁盤等。

系統(tǒng)調(diào)用syscall是應(yīng)用程序和內(nèi)核交互的橋梁,每次進行調(diào)用/返回就會產(chǎn)生兩次切換:

  • 調(diào)用syscall 從用戶態(tài)切換到內(nèi)核態(tài)
  • syscall返回 從內(nèi)核態(tài)切換到用戶態(tài)

來看下完整的數(shù)據(jù)拷貝過程簡圖:

讀數(shù)據(jù)過程:

  • 應(yīng)用程序要讀取磁盤數(shù)據(jù),調(diào)用read()函數(shù)從而實現(xiàn)用戶態(tài)切換內(nèi)核態(tài),這是第1次狀態(tài)切換;
  • DMA控制器將數(shù)據(jù)從磁盤拷貝到內(nèi)核緩沖區(qū),這是第1次DMA拷貝;
  • CPU將數(shù)據(jù)從內(nèi)核緩沖區(qū)復(fù)制到用戶緩沖區(qū),這是第1次CPU拷貝;
  • CPU完成拷貝之后,read()函數(shù)返回實現(xiàn)用戶態(tài)切換用戶態(tài),這是第2次狀態(tài)切換;

寫數(shù)據(jù)過程:

  • 應(yīng)用程序要向網(wǎng)卡寫數(shù)據(jù),調(diào)用write()函數(shù)實現(xiàn)用戶態(tài)切換內(nèi)核態(tài),這是第1次切換;
  • CPU將用戶緩沖區(qū)數(shù)據(jù)拷貝到內(nèi)核緩沖區(qū),這是第1次CPU拷貝;
  • DMA控制器將數(shù)據(jù)從內(nèi)核緩沖區(qū)復(fù)制到socket緩沖區(qū),這是第1次DMA拷貝;
  • 完成拷貝之后,write()函數(shù)返回實現(xiàn)內(nèi)核態(tài)切換用戶態(tài),這是第2次切換;

綜上所述:

  • 讀過程涉及2次空間切換、1次DMA拷貝、1次CPU拷貝;
  • 寫過程涉及2次空間切換、1次DMA拷貝、1次CPU拷貝;
可見傳統(tǒng)模式下,涉及多次空間切換和數(shù)據(jù)冗余拷貝,效率并不高,接下來就該零拷貝技術(shù)出場了。

4. 零拷貝技術(shù)

4.1 出現(xiàn)原因

我們可以看到,如果應(yīng)用程序不對數(shù)據(jù)做修改,從內(nèi)核緩沖區(qū)到用戶緩沖區(qū),再從用戶緩沖區(qū)到內(nèi)核緩沖區(qū)。兩次數(shù)據(jù)拷貝都需要CPU的參與,并且涉及用戶態(tài)與內(nèi)核態(tài)的多次切換,加重了CPU負擔。

我們需要降低冗余數(shù)據(jù)拷貝、解放CPU,這也就是零拷貝Zero-Copy技術(shù)。

4.2 解決思路

目前來看,零拷貝技術(shù)的幾個實現(xiàn)手段包括:mmap+write、sendfile、sendfile+DMA收集、splice等。

4.2.1 mmap方式

mmap是Linux提供的一種內(nèi)存映射文件的機制,它實現(xiàn)了將內(nèi)核中讀緩沖區(qū)地址與用戶空間緩沖區(qū)地址進行映射,從而實現(xiàn)內(nèi)核緩沖區(qū)與用戶緩沖區(qū)的共享。

這樣就減少了一次用戶態(tài)和內(nèi)核態(tài)的CPU拷貝,但是在內(nèi)核空間內(nèi)仍然有一次CPU拷貝。

mmap對大文件傳輸有一定優(yōu)勢,但是小文件可能出現(xiàn)碎片,并且在多個進程同時操作文件時可能產(chǎn)生引發(fā)coredump的signal。

4.2.2 sendfile方式

mmap+write方式有一定改進,但是由系統(tǒng)調(diào)用引起的狀態(tài)切換并沒有減少。

sendfile系統(tǒng)調(diào)用是在 Linux 內(nèi)核2.1版本中被引入,它建立了兩個文件之間的傳輸通道。

sendfile方式只使用一個函數(shù)就可以完成之前的read+write 和 mmap+write的功能,這樣就少了2次狀態(tài)切換,由于數(shù)據(jù)不經(jīng)過用戶緩沖區(qū),因此該數(shù)據(jù)無法被修改。

從圖中可以看到,應(yīng)用程序只需要調(diào)用sendfile函數(shù)即可完成,只有2次狀態(tài)切換、1次CPU拷貝、2次DMA拷貝。

但是sendfile在內(nèi)核緩沖區(qū)和socket緩沖區(qū)仍然存在一次CPU拷貝,或許這個還可以優(yōu)化。

4.2.3 sendfile+DMA收集

Linux 2.4 內(nèi)核對 sendfile 系統(tǒng)調(diào)用進行優(yōu)化,但是需要硬件DMA控制器的配合。

升級后的sendfile將內(nèi)核空間緩沖區(qū)中對應(yīng)的數(shù)據(jù)描述信息(文件描述符、地址偏移量等信息)記錄到socket緩沖區(qū)中。

DMA控制器根據(jù)socket緩沖區(qū)中的地址和偏移量將數(shù)據(jù)從內(nèi)核緩沖區(qū)拷貝到網(wǎng)卡中,從而省去了內(nèi)核空間中僅剩1次CPU拷貝。

這種方式有2次狀態(tài)切換、0次CPU拷貝、2次DMA拷貝,但是仍然無法對數(shù)據(jù)進行修改,并且需要硬件層面DMA的支持,并且sendfile只能將文件數(shù)據(jù)拷貝到socket描述符上,有一定的局限性。

4.2.4 splice方式

splice系統(tǒng)調(diào)用是Linux 在 2.6 版本引入的,其不需要硬件支持,并且不再限定于socket上,實現(xiàn)兩個普通文件之間的數(shù)據(jù)零拷貝。

splice 系統(tǒng)調(diào)用可以在內(nèi)核緩沖區(qū)和socket緩沖區(qū)之間建立管道來傳輸數(shù)據(jù),避免了兩者之間的 CPU 拷貝操作。

splice也有一些局限,它的兩個文件描述符參數(shù)中有一個必須是管道設(shè)備。


5.本文小結(jié)

本文通過介紹數(shù)據(jù)交互的基本過程、傳統(tǒng)模式的缺點,進而介紹了零拷貝的一些實現(xiàn)方法。

零拷貝技術(shù)是非常底層且重要的讀寫優(yōu)化,對于服務(wù)并發(fā)能力的提升有很大幫助,就這么多吧,下期再見

免責聲明:本文內(nèi)容由21ic獲得授權(quán)后發(fā)布,版權(quán)歸原作者所有,本平臺僅提供信息存儲服務(wù)。文章僅代表作者個人觀點,不代表本平臺立場,如有問題,請聯(lián)系我們,謝謝!

本站聲明: 本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除( 郵箱:macysun@21ic.com )。
換一批
延伸閱讀

全球嵌入式技術(shù)領(lǐng)域的年度盛會2026嵌入式世界展(Embedded World 2026,簡稱EW26)于3月10日至12日在德國紐倫堡成功舉辦。作為物聯(lián)網(wǎng)和邊緣AI領(lǐng)域的領(lǐng)先企業(yè),Silicon Labs(亦稱“芯科科...

關(guān)鍵字: 物聯(lián)網(wǎng) 邊緣AI 嵌入式

3月10日至12日,2026年嵌入式世界展(Embedded World 2026,簡稱EW26)在德國紐倫堡展覽中心成功舉辦。作為領(lǐng)先的邊緣AI與智能音頻等媒體處理技術(shù)和芯片解決方案提供商,XMOS以沉浸式演示與技術(shù)交...

關(guān)鍵字: 邊緣AI 智能音頻 嵌入式

在嵌入式系統(tǒng)開發(fā)中,SoC(System on Chip)的多樣性始終是橫亙在開發(fā)者面前的難題。以某工業(yè)物聯(lián)網(wǎng)網(wǎng)關(guān)項目為例,其需同時支持NXP i.MX8M、Rockchip RK3566和Allwinner H616三...

關(guān)鍵字: Platform Driver模型 嵌入式

在Zynq MPSoC開發(fā)中,實現(xiàn)PS端Linux與PL端自定義IP核的AXI互聯(lián)是構(gòu)建高性能異構(gòu)系統(tǒng)的關(guān)鍵環(huán)節(jié)。這種互聯(lián)方式充分發(fā)揮了ARM處理器的軟件優(yōu)勢與FPGA的硬件加速能力,為復(fù)雜應(yīng)用提供了強大的計算平臺。

關(guān)鍵字: Zynq MPSoC Linux

在物聯(lián)網(wǎng)與智能設(shè)備飛速普及的當下,嵌入式系統(tǒng)的安全性與穩(wěn)定性愈發(fā)關(guān)鍵。實時操作系統(tǒng)(RTOS)憑借其高確定性、低延遲的特性,成為工業(yè)控制、醫(yī)療設(shè)備、航空電子等安全敏感領(lǐng)域的核心支撐。而內(nèi)存保護單元(MPU)作為硬件級安全...

關(guān)鍵字: Linux Windows

在非易失性存儲器領(lǐng)域,EEPROM(電可擦除可編程只讀存儲器)曾長期占據(jù)主流地位,廣泛應(yīng)用于各類電子設(shè)備的參數(shù)存儲、日志記錄等場景。但隨著工業(yè)控制、汽車電子、醫(yī)療設(shè)備等領(lǐng)域?qū)Υ鎯π阅芴岢龈咭?,F(xiàn)RAM(鐵電隨機存取存...

關(guān)鍵字: 存儲器 可編程 嵌入式

康佳特將aReady.COM擴展至Arm架構(gòu)模塊,基于恩智浦i.MX 95處理器打造應(yīng)用就緒的軟硬件構(gòu)建模塊,集成操作系統(tǒng)、系統(tǒng)整合與IoT連接能力,賦能高價值應(yīng)用快速落地

關(guān)鍵字: 處理器 IoT 嵌入式

3月12日,2026年中國家電及消費電子博覽會(以下簡稱:AWE 2026)在上海盛大開幕。展會現(xiàn)場,場景化、系統(tǒng)化、一體化的家電解決方案成為行業(yè)焦點,消費者對家電的關(guān)注也已從基礎(chǔ)的尺寸匹配,延伸至對“空間秩序感”和“視...

關(guān)鍵字: 消費電子 蒸烤箱 嵌入式

超高效NPU IP在資源受限設(shè)備中推進邊緣AI,因而獲得認可

關(guān)鍵字: 人工智能 嵌入式 NPU
關(guān)閉