日本黄色一级经典视频|伊人久久精品视频|亚洲黄色色周成人视频九九九|av免费网址黄色小短片|黄色Av无码亚洲成年人|亚洲1区2区3区无码|真人黄片免费观看|无码一级小说欧美日免费三级|日韩中文字幕91在线看|精品久久久无码中文字幕边打电话

當(dāng)前位置:首頁 > 嵌入式 > 嵌入式硬件
[導(dǎo)讀]在2004年寫的一篇文章x86匯編語言學(xué)習(xí)手記(1)中,曾經(jīng)涉及到gcc編譯的代碼默認(rèn)16字節(jié)棧對(duì)齊的問題。之所以這樣做,主要是性能優(yōu)化方面的考慮?! 〈蠖鄶?shù)現(xiàn)代cpu都o(jì)ne-die了

在2004年寫的一篇文章x86匯編語言學(xué)習(xí)手記(1)中,曾經(jīng)涉及到gcc編譯的代碼默認(rèn)16字節(jié)棧對(duì)齊的問題。之所以這樣做,主要是性能優(yōu)化方面的考慮?! 〈蠖鄶?shù)現(xiàn)代cpu都o(jì)ne-die了l1和l2cache。對(duì)于l1 cache,大多是write though的;l2 cache則是write back的,不會(huì)立即寫回memory,這就會(huì)導(dǎo)致cache和memory的內(nèi)容的不一致;另外,對(duì)于mp(multi processors)的環(huán)境,由于cache是cpu私有的,不同cpu的cache的內(nèi)容也存在不一致的問題,因此很多mp的的計(jì)算架構(gòu),不論是ccnuma還是smp都實(shí)現(xiàn)了cache coherence的機(jī)制,即不同cpu的cache一致性機(jī)制。  cache coherence的一種實(shí)現(xiàn)是通過cache-snooping協(xié)議,每個(gè)cpu通過對(duì)bus的snoop實(shí)現(xiàn)對(duì)其它c(diǎn)pu讀寫cache的監(jiān)控:  首先,cache line是cache和memory之間數(shù)據(jù)傳輸?shù)淖钚卧?。 ?. 當(dāng)cpu1要寫cache時(shí),其它c(diǎn)pu就會(huì)檢查自己cache中對(duì)應(yīng)的cache line,如果是dirty的,就write back到memory,并且會(huì)將cpu1的相關(guān)cache line刷新;如果不是dirty的,就invalidate該cache line.  2. 當(dāng)cpu1要讀cache時(shí),其它c(diǎn)pu就會(huì)將自己cache中對(duì)應(yīng)的cache line中標(biāo)記為dirty的部分write back到memory,并且會(huì)將cpu1的相關(guān)cache line刷新。  所以,提高cpu的cache hit rate,減少cache和memory之間的數(shù)據(jù)傳輸,將會(huì)提高系統(tǒng)的性能。  因此,在程序和二進(jìn)制對(duì)象的內(nèi)存分配中保持cache line aligned就十分重要,如果不保證cache line對(duì)齊,出現(xiàn)多個(gè)cpu中并行運(yùn)行的進(jìn)程或者線程同時(shí)讀寫同一個(gè)cache line的情況的概率就會(huì)很大。這時(shí)cpu的cache和memory之間會(huì)反復(fù)出現(xiàn)write back和refresh情況,這種情形就叫做cache thrashing。  為了有效的避免cache thrashing,通常有以下兩種途徑:  1. 對(duì)于heap的分配,很多系統(tǒng)在malloc調(diào)用中實(shí)現(xiàn)了強(qiáng)制的alignment.
  2. 對(duì)于stack的分配,很多編譯器提供了stack aligned的選項(xiàng)?! ‘?dāng)然,如果在編譯器指定了stack aligned,程序的尺寸將會(huì)變大,會(huì)占用更多的內(nèi)存。因此,這中間的取舍需要仔細(xì)考慮,下面是我在google上搜索到的一段討論:one of our customers complained about the additional code generated to
maintain the stack aligned to 16-byte boundaries, and suggested us to
default to the minimum alignment when optimizing for code size. this
has the caveat that, when you link code optimized for size with code
optimized for speed, if a function optimized for size calls a
performance-critical function with the stack misaligned, the
performance-critical function may perform poorly.

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除( 郵箱:macysun@21ic.com )。
換一批
延伸閱讀

由臺(tái)達(dá)集團(tuán)于2026年3月29日通過美通社發(fā)布新聞稿《集裝箱式SST直流移動(dòng)智算中心發(fā)布》中,第3張有誤,已進(jìn)行替換。特此更正,更新后的全文及圖片如下: 集裝箱式SST直流移動(dòng)智算中心發(fā)布 臺(tái)達(dá)、漢騰科技、龍芯中科攜...

關(guān)鍵字: 移動(dòng) ST 固態(tài)變壓器 CPU

面對(duì)AI Agent與Physical AI的浪潮,單純依靠增加GPU或NPU的補(bǔ)丁式方案已難以為繼,CPU架構(gòu)必須進(jìn)行面向AI的底層重塑。 阿里達(dá)摩院發(fā)布的玄鐵C950旗艦處理器,不僅刷新了單核性能紀(jì)錄,更通過原生A...

關(guān)鍵字: 玄鐵C950 CPU AI 物理AI RISC-V

北京2026年3月27日 /美通社/ -- 當(dāng)?shù)谑鍖萌珖?guó)運(yùn)動(dòng)會(huì)辦公系統(tǒng)全程穩(wěn)定運(yùn)行時(shí),當(dāng)銀行柜員輕點(diǎn)鼠標(biāo)實(shí)現(xiàn)業(yè)務(wù)秒級(jí)響應(yīng)時(shí),當(dāng)大學(xué)生刷一卡通順暢進(jìn)出宿舍、食堂、圖書館時(shí),當(dāng)新能源汽車充電樁智能調(diào)度、巨災(zāi)預(yù)警系統(tǒng)精準(zhǔn)響應(yīng)...

關(guān)鍵字: CPU 指令集 芯片 操作系統(tǒng)

成立三十余年來,Arm一直是芯片行業(yè)特殊的“幕后推手”——不生產(chǎn)一顆芯片,卻定義了全球99%智能手機(jī)的底層架構(gòu)。然而,這家長(zhǎng)期保持中立的IP授權(quán)巨頭,如今正打破自己一手建立的商業(yè)規(guī)則。

關(guān)鍵字: ARM CPU 芯片

Arm 首次將其平臺(tái)矩陣拓展至量產(chǎn)芯片產(chǎn)品,為業(yè)界提供覆蓋 IP、Arm計(jì)算子系統(tǒng) (CSS)及芯片的最廣泛的計(jì)算產(chǎn)品選擇。 發(fā)布首款由 Arm 設(shè)計(jì)的數(shù)據(jù)中心 CPU——Arm AGI CPU,專為代理式AI 基...

關(guān)鍵字: ARM CPU 數(shù)據(jù)中心 代理式AI

2026年3月24日,美國(guó)加州圣何塞訊——Super Micro Computer, Inc.(NASDAQ:SMCI)作為云端計(jì)算、AI/機(jī)器學(xué)習(xí)、存儲(chǔ)和5G/邊緣領(lǐng)域的全方位IT解決方案供應(yīng)商,宣布推出基于NVIDI...

關(guān)鍵字: DCBBS液冷架構(gòu) CPU 存儲(chǔ)

3月24日,由阿里巴巴達(dá)摩院主辦的2026玄鐵RISC-V生態(tài)大會(huì)在上海舉行。高通、Arteris、Canonical、SHD Group、海爾、中興通訊、全志科技、北京智芯微、南芯科技等全球數(shù)百家產(chǎn)學(xué)研機(jī)構(gòu)齊聚一堂,分...

關(guān)鍵字: RISC-V CPU 算力

Supermicro的NVIDIA Vera Rubin NVL72與HGX Rubin NVL8系統(tǒng)是基于DCBBS液冷架構(gòu)所設(shè)計(jì),與NVIDIA Blackwell...

關(guān)鍵字: CPU MICRO NVIDIA SUPER

3月24日消息,今日,在上海舉行的2026玄鐵RISC-V生態(tài)大會(huì)上,阿里巴巴達(dá)摩院發(fā)布新一代旗艦CPU產(chǎn)品玄鐵C950。

關(guān)鍵字: RISC-V CPU

March 18, 2026 ---- 根據(jù)TrendForce集邦咨詢最新AI Server研究,在大型云端服務(wù)供應(yīng)商(CSP)加大自研芯片力道的情況下,NVIDIA(英偉達(dá))在GTC 2026大會(huì)改為著重各領(lǐng)域的AI...

關(guān)鍵字: ASIC GPU CPU
關(guān)閉