日本黄色一级经典视频|伊人久久精品视频|亚洲黄色色周成人视频九九九|av免费网址黄色小短片|黄色Av无码亚洲成年人|亚洲1区2区3区无码|真人黄片免费观看|无码一级小说欧美日免费三级|日韩中文字幕91在线看|精品久久久无码中文字幕边打电话

當前位置:首頁 > 嵌入式 > 玩轉(zhuǎn)嵌入式
[導讀]內(nèi)存訪問一次延時到底是多少?你是否會進行大概的估算?內(nèi)存存在隨機IO比順序IO慢的問題嗎?我們都知道磁盤的隨機IO要比順序IO慢的多(操作系統(tǒng)底層還專門實現(xiàn)了電梯調(diào)度算法來緩解這個問題),那么內(nèi)存的隨機IO會比順序IO慢嗎?

平時大家都知道內(nèi)存訪問很快,今天來讓我們來思考兩個問題:

問題1: 內(nèi)存訪問一次延時到底是多少?你是否會進行大概的估算?

例如筆者的內(nèi)存條的Speed顯示是1066MHz,那是否可以推算出內(nèi)存IO延時是1s/1066MHz=0.93ns? 這種算法大錯特錯。
問題2: 內(nèi)存存在隨機IO比順序IO慢的問題嗎?我們都知道磁盤的隨機IO要比順序IO慢的多(操作系統(tǒng)底層還專門實現(xiàn)了電梯調(diào)度算法來緩解這個問題),那么內(nèi)存的隨機IO會比順序IO慢嗎?
要想徹底弄明白以上兩個問題,我想我們得從內(nèi)存IO的物理過程中來尋找答案。 1先給你講個圖書管理員的故事
在開始介紹枯燥的內(nèi)存工作原理之前。我想先給你講一個故事,并帶你去認識一個人,圖書館的管理員。

在我們的這個故事中,你是故事的主角。你有一所房子,房子里有一個仆人,他每天幫你處理各種各樣的圖書數(shù)據(jù)。但是北京房價太貴,所以你的這個房子很小,只能放的下64本書。你家的馬路對面,就是北京圖書館(你家房子雖然小但是地段還不錯),你所需要的所有的圖書在那里都可以找到。圖書館有個管理員,他負責幫你把你想要的書找出來。

圖1 圖書管理員的故事
好接下來,故事開始進行!
場景1:
你發(fā)現(xiàn)你需要編號為0的書的計算結(jié)果,你的仆人穿過馬路告訴了圖書管理員,告訴他請幫我把第0-63本書取出來。圖書管理員幫你在電腦前查得該書在二樓。于是他,花了點時間坐電梯到了二樓。等到了二樓,他又花了點時間幫你找了出來。然后你的仆人抱著64本書放到了客廳,拿起第0本書幫你處理了起來。

場景2:

你發(fā)現(xiàn)你需要編號為1的書的計算結(jié)果,告訴你的仆人。你的仆人直接從客廳拿出來就可以處理了,這次你等的時間最短。

場景3:

你發(fā)現(xiàn)需要編號為65的書,你又告訴你的仆人。你的仆人穿過馬路又去找了圖書管理員。圖書管理員還在二樓呢,聽說這次需要65-127,這次他不用再花時間找樓層了。只是花時間找書就可以了。你的仆人把65-127的書放到了客廳(以前的0-63就都扔了),并幫你開始處理起65號書來。
場景4:
你發(fā)現(xiàn)你需要編號為10000的書,你告訴了你的仆人。你的仆人穿過馬路去圖書館,找到了管理員。這次管理員查得你需要的書是在10樓,他得花點時間坐電梯過去。去了之后,他又得花點時間幫你找出來。

這四個場景里,我覺得你一定發(fā)現(xiàn)了不同情形下耗時的差異。

  • 場景1和場景4花費的時間最多。因為圖書管理員需要花時間坐電梯找樓層,需要花時間在樓內(nèi)找書。

  • 場景3次之,因為圖書管理員直接就在樓層內(nèi),只需要花時間在樓內(nèi)找書既可

  • 場景2最快,因為只需要仆人幫你從客廳拿過來就好,連馬路都不需要過。

之所以編造這么一個例子,是因為內(nèi)存的工作方式和它太像了。接下來我們進入內(nèi)存的實際分析。

2內(nèi)存物理結(jié)構(gòu)

《帶你理解內(nèi)存對齊最底層原理》中我們了解了內(nèi)存顆粒的物理構(gòu)造以及IO過程,今天我們再來復習一下。

內(nèi)存是由chip構(gòu)成。每個chip內(nèi)部,是由8個bank組成的。其構(gòu)造如下圖:

圖2 內(nèi)存顆粒chip內(nèi)部結(jié)構(gòu)
而每一個bank是一個二維平面上的矩陣,前面文章中我們說到過。矩陣中每一個元素中都是保存了1個字節(jié),也就是8個bit。

圖3 bank內(nèi)部物理結(jié)構(gòu)

每當CPU向內(nèi)存請求數(shù)據(jù)的時候,內(nèi)存芯片總是8個bank并行一起工作。每個bank在定位到行地址后,把對應(yīng)的行copy到row buffer。再根據(jù)列地址把對應(yīng)的元素中的數(shù)據(jù)取出來,8個bank把數(shù)據(jù)拼接一下,一個64位寬的數(shù)據(jù)就可以返回給CPU了。
圖4 一次內(nèi)存IO的過程示意

根據(jù)上面幾張圖我們可以大致了解內(nèi)存的IO過程,在這個過程中每一步操作之間都有一些延遲,讓我們來繼續(xù)了解這些延遲。

3內(nèi)存IO延遲

《從DDR發(fā)展到DDR4,內(nèi)存核心頻率指標其實基本上就沒太大的進步》里我們提到內(nèi)存的延遲很大程度是受核心頻率制約的,你也應(yīng)該記得我們提到了內(nèi)存延遲一般是通過CL-tRCD-tRP-tRAS四個參數(shù)來標識的。我們今天來詳細理解一下這四個參數(shù)的含義:

  • CL(Column Address Latency):發(fā)送一個列地址到內(nèi)存與數(shù)據(jù)開始響應(yīng)之間的周期數(shù)

  • tRCD(Row Address to Column Address Delay):打開一行內(nèi)存并訪問其中的列所需的最小時鐘周期數(shù)

  • tRP(Row Precharge Time):發(fā)出預充電命令與打開下一行之間所需的最小時鐘周期數(shù)。

  • tRAS(Row Active Time):行活動命令與發(fā)出預充電命令之間所需的最小時鐘周期數(shù)。也就是對下一次預充電時間進行限制。

要注意除了CL是固定周期數(shù)以外,其它的三個都是最小周期。另外上面的參數(shù)都是以時鐘周期為單位的。因為現(xiàn)代的內(nèi)存都是一個時鐘周期上下沿分別各傳輸一次數(shù)據(jù),所以用Speed/2就可以得出,例如筆者的機器的Speed是1066MHz,則時鐘周期為533MHz。你自己的機器可以通過dmidecode命令查看:

# dmidecode | grep -P -A16 "Memory Device" Memory Device  ......  Speed: 1067 MHz  ...... 

和“圖書管理員”類似,內(nèi)存芯片也有類似的工作場景:

場景1:
你的進程需要內(nèi)存地址0x0000為的一個字節(jié)的數(shù)據(jù),CPU這時候向內(nèi)存控制器發(fā)出請求,內(nèi)存控制器進行行地址的預充電,需要等待tRP個時鐘周期。再發(fā)出打開一行內(nèi)存的命令,又需要等待tRCD個時鐘周期。接著發(fā)送列地址,再等待CL個周期。最終將0x0000-0x0007的數(shù)據(jù)全部返回給了CPU。CPU把這些數(shù)據(jù)放入到了自己的cache里,并幫你開始對0x0000的數(shù)據(jù)進行運算。
場景2:
你的進程需要內(nèi)存地址0x0003的一個字節(jié)數(shù)據(jù),CPU發(fā)現(xiàn)發(fā)現(xiàn)它在自己的cache里存在,直接使用就好了。這個場景里其實根本就沒有內(nèi)存IO發(fā)生。
場景3:
你的進程需要內(nèi)存地址0x0008的一個字節(jié)數(shù)據(jù),CPU的cache并沒有命中,于是向內(nèi)存控制器請求。內(nèi)存控制器發(fā)現(xiàn)行地址和上一次工作的行地址一致,這次只需要發(fā)送列地址后等待CL個周期,就可以拿到0x0008-0x0015的數(shù)據(jù)并返回給CPU了。
場景4:
你的進程需要內(nèi)存地址0xf000的一個字節(jié)數(shù)據(jù),同樣CPU的cache并不命中,向內(nèi)存控制器請求。內(nèi)存控制器一看(內(nèi)心有些許的郁悶),這次行w地址又變了,得,和場景1一樣。繼續(xù)等待tRP+tRCD+CL個周期后,才能夠取到數(shù)據(jù)并返回。
實際的計算機的內(nèi)存IO過程中還需要進行邏輯地址和物理地址的轉(zhuǎn)換,這里忽略不表。


4結(jié)論

其中場景1和場景4是隨機IO的情況,場景2無內(nèi)存IO發(fā)生,場景3是順序IO,。通過上面的過程描述我們可以得到結(jié)論。內(nèi)存也存在和磁盤一樣,隨機IO比順序IO要慢的問題。如果行地址同上一次訪問的不一致,則需要重新拷貝row buffer,延遲周期需要tRP+tRCD+CL。而如果是順序IO的話(行地址不變),只需要CL個周期既可完成。

我們接著估算下內(nèi)存的延時,筆者的機器上的內(nèi)存參數(shù)Speed為1066MHz(通過dmidecode查得),該值除以2就是時鐘周期的頻率=1066/2=533Mhz。其延遲周期為7-7-7-24。

  • 隨機IO:這種狀況下需要tRP+tRCD+CL個時鐘周期,7+7+7=21個周期。但是還有個tRAS的限制,兩次行地址預充電不得小于24。所以我們得按24來計算,24*(1s/533Mhz) = 45ns
  • 順序IO:這種狀況下只需要CL個時鐘周期 7*(1s/533Mhz)=13ns


5擴展,CPU的cache line虛擬內(nèi)存概念

因為對于內(nèi)存來說,隨機IO一次開銷比順序IO高好幾倍。所以操作系統(tǒng)在工作的時候,會盡量讓內(nèi)存通過順序IO的方式來進行。做法關(guān)鍵就是Cache Line。當CPU發(fā)現(xiàn)緩存不命中的時候,實際上從來不會向內(nèi)存去請求1個字節(jié),8個字節(jié)這種。而是一次性就要64字節(jié),然后放到自己的Cache中存起來。

用上面的例子來看,

  • 如果隨機請求8字節(jié):耗時是45ns
  • 如果隨機請求64字節(jié):耗時是45+7*13 = 136ns

開銷也沒貴多少,因為只有第一個字節(jié)是隨機IO,后面的7個字節(jié)都是順序IO。數(shù)據(jù)是8倍,但是IO耗時只有3倍,而且取出來的數(shù)據(jù)后面大概率要用,所以計算機內(nèi)部就這么搞了,通過這種方式幫你避免一些隨機IO!

另外,內(nèi)存也支持burst(突發(fā)傳輸)模式,在這種模式下可以只傳入一次行列地址,就命令內(nèi)存返回該內(nèi)存開頭的連續(xù)字節(jié)數(shù)據(jù),比如64字節(jié)。這種模式下,只有第一次的8字節(jié)需要真正的行列訪問延遲,后面的7個字節(jié)可以直接按內(nèi)存的數(shù)據(jù)頻率給吐出來。


免責聲明:本文內(nèi)容由21ic獲得授權(quán)后發(fā)布,版權(quán)歸原作者所有,本平臺僅提供信息存儲服務(wù)。文章僅代表作者個人觀點,不代表本平臺立場,如有問題,請聯(lián)系我們,謝謝!

本站聲明: 本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

LED驅(qū)動電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。

關(guān)鍵字: 驅(qū)動電源

在工業(yè)自動化蓬勃發(fā)展的當下,工業(yè)電機作為核心動力設(shè)備,其驅(qū)動電源的性能直接關(guān)系到整個系統(tǒng)的穩(wěn)定性和可靠性。其中,反電動勢抑制與過流保護是驅(qū)動電源設(shè)計中至關(guān)重要的兩個環(huán)節(jié),集成化方案的設(shè)計成為提升電機驅(qū)動性能的關(guān)鍵。

關(guān)鍵字: 工業(yè)電機 驅(qū)動電源

LED 驅(qū)動電源作為 LED 照明系統(tǒng)的 “心臟”,其穩(wěn)定性直接決定了整個照明設(shè)備的使用壽命。然而,在實際應(yīng)用中,LED 驅(qū)動電源易損壞的問題卻十分常見,不僅增加了維護成本,還影響了用戶體驗。要解決這一問題,需從設(shè)計、生...

關(guān)鍵字: 驅(qū)動電源 照明系統(tǒng) 散熱

根據(jù)LED驅(qū)動電源的公式,電感內(nèi)電流波動大小和電感值成反比,輸出紋波和輸出電容值成反比。所以加大電感值和輸出電容值可以減小紋波。

關(guān)鍵字: LED 設(shè)計 驅(qū)動電源

電動汽車(EV)作為新能源汽車的重要代表,正逐漸成為全球汽車產(chǎn)業(yè)的重要發(fā)展方向。電動汽車的核心技術(shù)之一是電機驅(qū)動控制系統(tǒng),而絕緣柵雙極型晶體管(IGBT)作為電機驅(qū)動系統(tǒng)中的關(guān)鍵元件,其性能直接影響到電動汽車的動力性能和...

關(guān)鍵字: 電動汽車 新能源 驅(qū)動電源

在現(xiàn)代城市建設(shè)中,街道及停車場照明作為基礎(chǔ)設(shè)施的重要組成部分,其質(zhì)量和效率直接關(guān)系到城市的公共安全、居民生活質(zhì)量和能源利用效率。隨著科技的進步,高亮度白光發(fā)光二極管(LED)因其獨特的優(yōu)勢逐漸取代傳統(tǒng)光源,成為大功率區(qū)域...

關(guān)鍵字: 發(fā)光二極管 驅(qū)動電源 LED

LED通用照明設(shè)計工程師會遇到許多挑戰(zhàn),如功率密度、功率因數(shù)校正(PFC)、空間受限和可靠性等。

關(guān)鍵字: LED 驅(qū)動電源 功率因數(shù)校正

在LED照明技術(shù)日益普及的今天,LED驅(qū)動電源的電磁干擾(EMI)問題成為了一個不可忽視的挑戰(zhàn)。電磁干擾不僅會影響LED燈具的正常工作,還可能對周圍電子設(shè)備造成不利影響,甚至引發(fā)系統(tǒng)故障。因此,采取有效的硬件措施來解決L...

關(guān)鍵字: LED照明技術(shù) 電磁干擾 驅(qū)動電源

開關(guān)電源具有效率高的特性,而且開關(guān)電源的變壓器體積比串聯(lián)穩(wěn)壓型電源的要小得多,電源電路比較整潔,整機重量也有所下降,所以,現(xiàn)在的LED驅(qū)動電源

關(guān)鍵字: LED 驅(qū)動電源 開關(guān)電源

LED驅(qū)動電源是把電源供應(yīng)轉(zhuǎn)換為特定的電壓電流以驅(qū)動LED發(fā)光的電壓轉(zhuǎn)換器,通常情況下:LED驅(qū)動電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。

關(guān)鍵字: LED 隧道燈 驅(qū)動電源
關(guān)閉