CPU學習（Cache Coherence）

時間：2019-04-15 19:30:01

關(guān)鍵字： cache coherence CPU 嵌入式處理器

手機看文章

掃描二維碼
隨時隨地手機看文章

[導讀]在2004年寫的一篇文章x86匯編語言學習手記(1)中，曾經(jīng)涉及到gcc編譯的代碼默認16字節(jié)棧對齊的問題。之所以這樣做，主要是性能優(yōu)化方面的考慮?！　〈蠖鄶?shù)現(xiàn)代cpu都one-die了

在2004年寫的一篇文章x86匯編語言學習手記(1)中，曾經(jīng)涉及到gcc編譯的代碼默認16字節(jié)棧對齊的問題。之所以這樣做，主要是性能優(yōu)化方面的考慮。　　大多數(shù)現(xiàn)代cpu都one-die了l1和l2cache。對于l1 cache，大多是write though的；l2 cache則是write back的，不會立即寫回memory，這就會導致cache和memory的內(nèi)容的不一致；另外，對于mp(multi processors)的環(huán)境，由于cache是cpu私有的，不同cpu的cache的內(nèi)容也存在不一致的問題，因此很多mp的的計算架構(gòu)，不論是ccnuma還是smp都實現(xiàn)了cache coherence的機制,即不同cpu的cache一致性機制?！　ache coherence的一種實現(xiàn)是通過cache-snooping協(xié)議，每個cpu通過對bus的snoop實現(xiàn)對其它cpu讀寫cache的監(jiān)控：　　首先，cache line是cache和memory之間數(shù)據(jù)傳輸?shù)淖钚卧??！　?. 當cpu1要寫cache時，其它cpu就會檢查自己cache中對應的cache line,如果是dirty的，就write back到memory,并且會將cpu1的相關(guān)cache line刷新；如果不是dirty的，就invalidate該cache line.　　2. 當cpu1要讀cache時，其它cpu就會將自己cache中對應的cache line中標記為dirty的部分write back到memory,并且會將cpu1的相關(guān)cache line刷新。　　所以，提高cpu的cache hit rate,減少cache和memory之間的數(shù)據(jù)傳輸，將會提高系統(tǒng)的性能。　　因此，在程序和二進制對象的內(nèi)存分配中保持cache line aligned就十分重要，如果不保證cache line對齊，出現(xiàn)多個cpu中并行運行的進程或者線程同時讀寫同一個cache line的情況的概率就會很大。這時cpu的cache和memory之間會反復出現(xiàn)write back和refresh情況，這種情形就叫做cache thrashing?！　榱擞行У谋苊鈉ache thrashing,通常有以下兩種途徑：　　1. 對于heap的分配，很多系統(tǒng)在malloc調(diào)用中實現(xiàn)了強制的alignment.
　　2. 對于stack的分配，很多編譯器提供了stack aligned的選項。　　當然，如果在編譯器指定了stack aligned,程序的尺寸將會變大，會占用更多的內(nèi)存。因此，這中間的取舍需要仔細考慮，下面是我在google上搜索到的一段討論：one of our customers complained about the additional code generated to
maintain the stack aligned to 16-byte boundaries, and suggested us to
default to the minimum alignment when optimizing for code size. this
has the caveat that, when you link code optimized for size with code
optimized for speed, if a function optimized for size calls a
performance-critical function with the stack misaligned, the
performance-critical function may perform poorly.

本站聲明：本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布，目的在于傳遞更多信息，并不代表本站贊同其觀點，本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者，如若文章內(nèi)容侵犯您的權(quán)益，請及時聯(lián)系本站刪除。

換一批

與傳統(tǒng)的驅(qū)動方式相比，共陰恒流驅(qū)動在能效有哪些優(yōu)勢

LED驅(qū)動電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。

關(guān)鍵字：驅(qū)動電源

[電源]

工業(yè)電機驅(qū)動電源設計：反電動勢抑制與過流保護的集成方案

在工業(yè)自動化蓬勃發(fā)展的當下，工業(yè)電機作為核心動力設備，其驅(qū)動電源的性能直接關(guān)系到整個系統(tǒng)的穩(wěn)定性和可靠性。其中，反電動勢抑制與過流保護是驅(qū)動電源設計中至關(guān)重要的兩個環(huán)節(jié)，集成化方案的設計成為提升電機驅(qū)動性能的關(guān)鍵。

關(guān)鍵字：工業(yè)電機驅(qū)動電源

[電源]

如何解決 LED 驅(qū)動電源的易損壞問題

LED 驅(qū)動電源作為 LED 照明系統(tǒng)的 “心臟”，其穩(wěn)定性直接決定了整個照明設備的使用壽命。然而，在實際應用中，LED 驅(qū)動電源易損壞的問題卻十分常見，不僅增加了維護成本，還影響了用戶體驗。要解決這一問題，需從設計、生...

關(guān)鍵字：驅(qū)動電源照明系統(tǒng) 散熱

[電力電工電路]

LED設計中LED驅(qū)動電源的公式

根據(jù)LED驅(qū)動電源的公式，電感內(nèi)電流波動大小和電感值成反比，輸出紋波和輸出電容值成反比。所以加大電感值和輸出電容值可以減小紋波。

關(guān)鍵字： LED 設計驅(qū)動電源

[汽車電子]

EV主驅(qū)IGBT隔離驅(qū)動電源方案選擇問題探討

電動汽車(EV)作為新能源汽車的重要代表，正逐漸成為全球汽車產(chǎn)業(yè)的重要發(fā)展方向。電動汽車的核心技術(shù)之一是電機驅(qū)動控制系統(tǒng)，而絕緣柵雙極型晶體管(IGBT)作為電機驅(qū)動系統(tǒng)中的關(guān)鍵元件，其性能直接影響到電動汽車的動力性能和...

關(guān)鍵字：電動汽車新能源驅(qū)動電源

[電源]

合理的驅(qū)動電源方案成為大功率區(qū)域照明的主流選擇

在現(xiàn)代城市建設中，街道及停車場照明作為基礎設施的重要組成部分，其質(zhì)量和效率直接關(guān)系到城市的公共安全、居民生活質(zhì)量和能源利用效率。隨著科技的進步，高亮度白光發(fā)光二極管(LED)因其獨特的優(yōu)勢逐漸取代傳統(tǒng)光源，成為大功率區(qū)域...

關(guān)鍵字：發(fā)光二極管驅(qū)動電源 LED

[消費電子]