[導(dǎo)讀]編者按:CPUBurst特性已合入Linux5.14,AnolisOS8.2、AlibabaCloudLinux2、AlibabaCloudLinux3也都支持CPUBurst特性。在系列文章的上篇中,我們討論了讓人討厭的CPU限流,它會影響運行在容器中的應(yīng)用的一些關(guān)鍵指標(biāo)。為了...
編者按:CPU Burst 特性已合入 Linux 5.14,Anolis OS 8.2、Alibaba Cloud Linux2、Alibaba Cloud Linux3也都支持CPU Burst特性。在系列文章的上篇中,我們討論了讓人討厭的 CPU 限流,它會影響運行在容器中的應(yīng)用的一些關(guān)鍵指標(biāo)。為了避免限流的出現(xiàn),有時我們不得不犧牲容器部署密度,從而導(dǎo)致資源浪費的產(chǎn)生。在解決方案部分,我們也介紹了新的CPU Burst 技術(shù),通過這一技術(shù),我們既能保證容器運行服務(wù)質(zhì)量,又不降低容器部署密度。聽起來有點像個銀彈啊?那么,使用CPU Burst的副作用是什么?是否有不適用的場景呢?為了回答這個問題,本文將介紹CPU Burst打破的調(diào)度保證,以及CPU Burst影響評估。盡管這些CPU突發(fā)的使用造成的CPU使用差異在CPU利用率上很多時候不明顯,但是我們?nèi)匀魂P(guān)心這種改變的影響。當(dāng)然,結(jié)論是明確的:CPU Burst的負(fù)面影響完全可以忽略。僅在CPU利用率高達70%的環(huán)境里CPU Burst開始影響關(guān)鍵指標(biāo),而我相信大家日常生產(chǎn)環(huán)境的CPU利用率都遠(yuǎn)遠(yuǎn)低于這個水平。CPU Bandwidth Controller的保證
使用CPU Bandwidth Controller可以避免某些進程消耗過多CPU時間,并確保所有需要CPU的進程都拿到足夠的CPU時間。之所以有這樣好的穩(wěn)定性保證,是因為當(dāng)Bandwidth Controller設(shè)置滿足時,有如下的調(diào)度穩(wěn)定性約束:其中是第i個cgroup的quota,是一個period內(nèi)該cgroup的CPU需求。Bandwidth Controller對每個周期分別做CPU時間統(tǒng)計,調(diào)度穩(wěn)定性約束保證在一個period內(nèi)提交的全部任務(wù)都能在該周期內(nèi)處理完;對每個CPU cgroup而言,這意味著任何時候提交的任務(wù)都能在一個period內(nèi)執(zhí)行完,即任務(wù)實時性約束:不管任務(wù)優(yōu)先級如何,最壞情況下任務(wù)執(zhí)行時間(WCET, Worst-Case Execution Time)不超過一個period。假如持續(xù)出現(xiàn)調(diào)度器穩(wěn)定性被打破,在每個period都有任務(wù)積攢下來,新提交的作業(yè)執(zhí)行時間不斷增加。使用CPU Burst的影響
出于改善服務(wù)質(zhì)量的需要,我們使用CPU Burst允許突發(fā)的CPU使用之后,對調(diào)度器的穩(wěn)定性產(chǎn)生什么影響?答案是當(dāng)多個cgroup同時突發(fā)使用CPU,調(diào)度器穩(wěn)定性約束和任務(wù)實時性保證有可能被打破。這時候兩個約束得到保證的概率是關(guān)鍵,如果兩個約束得到保證的概率很高,對大多數(shù)周期來任務(wù)實時性都得到保證,可以放心大膽使用CPU Burst;如果任務(wù)實時性得到保證的概率很低,這時候要改善服務(wù)質(zhì)量不能直接使用CPU Burst,應(yīng)該先降低部署密度提高CPU資源配置。于是下一個關(guān)心的問題是,怎么計算特定場景下兩個約束被打破的概率。評估影響大小
定量計算可以定義成經(jīng)典的排隊論問題,并且用蒙特卡洛模擬方法求解。定量計算的結(jié)果表明,判斷當(dāng)前場景是否可以使用CPU Burst的主要影響因素是平均CPU利用率和cgroup數(shù)目。CPU利用率越低,或者cgroup數(shù)目越多,兩個約束越不容易被打破可以放心使用CPU Burst。反之如果CPU利用率很高或者cgroup數(shù)目較少,要消除CPU限流對進程執(zhí)行的影響,應(yīng)該降低部署提高配置再使用CPU Burst。問題定義是:一共有m個cgroup,每個cgroup的quota限制為1/m,每個cgroup在每個周期產(chǎn)生的計算需求(CPU利用率)服從某個具體分布,這些分布是相互獨立的。假設(shè)任務(wù)在每個周期的開始到達,如果該周期內(nèi)的CPU需求超過100%,當(dāng)前周期任務(wù)WCET超過1個period,超過的部分累積下來和下個周期新產(chǎn)生的CPU需求一起在下個需求處理。輸入是cgroup的數(shù)目m和每個CPU需求滿足的具體分布,輸出是每個周期結(jié)束WCET > period的概率和WCET期望。使用蒙特卡洛模擬求解過程省略,詳細(xì)請關(guān)注后續(xù)系列文章。以輸入的CPU需求為帕累托分布、m=10/20/30的結(jié)果為例進行說明。選擇帕累托分布進行說明的原因是它產(chǎn)生比較多的長尾CPU突發(fā)使用,容易產(chǎn)生較大影響。表格中數(shù)據(jù)項的格式為,其中越接近1越好,概率越低越好。| u_avg | m=10 | m=20 | m=30 |
10% | 1.0000/0.00% | 1.0000/0.00% | 1.0000/0.00% |
30% | 1.0000/0.00% | 1.0000/0.00% | 1.0000/0.00% |
50% | 1.0003/0.03% | 1.0000/0.00% | 1.0000/0.00% |
70% | 1.0077/0.66% | 1.0013/0.12% | 1.0004/0.04% |
90% | 1.4061/19.35% | 1.1626/10.61% | 1.0867/6.52%
|
結(jié)果跟直覺是吻合的。一方面,CPU需求(CPU利用率)越高,CPU突發(fā)越容易打破穩(wěn)定性約束,造成任務(wù)WCET期望變長。另一方面,CPU需求獨立分布的cgroup數(shù)目越多,它們同時產(chǎn)生CPU突發(fā)需求的可能性越低,調(diào)度器穩(wěn)定性約束越容易保持,WCET的期望越接近1個period。后續(xù)
看完本文相信您對CPU Burst的影響已經(jīng)有了定性了解。如果希望對評估方法有更多了解,請期待系列文章的下篇。關(guān)于作者常懷鑫(一齋),阿里云內(nèi)核組工程師,擅長CPU調(diào)度領(lǐng)域。丁天琛(鷹羽),2021年加入阿里云內(nèi)核組,目前在調(diào)度領(lǐng)域等方面學(xué)習(xí)研究——完——加入龍蜥社群加入微信群:添加社區(qū)助理-龍蜥社區(qū)小龍(微信:openanolis_assis),備注【龍蜥】拉你入群;加入釘釘群:掃描下方釘釘群二維碼。歡迎開發(fā)者/用戶加入龍蜥OpenAnolis社區(qū)交流,共同推進龍蜥社區(qū)的發(fā)展,一起打造一個活躍的、健康的開源操作系統(tǒng)生態(tài)!龍蜥社區(qū)釘釘交流群龍蜥社區(qū)-小龍
關(guān)于龍蜥社區(qū)
龍蜥社區(qū)是由企事業(yè)單位、高等院校、科研單位、非營利性組織、個人等按照自愿、平等、開源、協(xié)作的基礎(chǔ)上組成的非盈利性開源社區(qū)。龍蜥社區(qū)成立于2020年9月,旨在構(gòu)建一個開源、中立、開放的Linux上游發(fā)行版社區(qū)及創(chuàng)新平臺。短期目標(biāo)是開發(fā)Anolis OS作為CentOS替代版,重新構(gòu)建一個兼容國際Linux主流廠商發(fā)行版。中長期目標(biāo)是探索打造一個面向未來的操作系統(tǒng),建立統(tǒng)一的開源操作系統(tǒng)生態(tài),孵化創(chuàng)新開源項目,繁榮開源生態(tài)。龍蜥OS 8.4已發(fā)布,支持x86_64和ARM64架構(gòu),完善適配Intel、飛騰、海光、兆芯、鯤鵬芯片。歡迎下載:
https://openanolis.cn/download加入我們,一起打造面向未來的開源操作系統(tǒng)!Https://openanolis.cn往期精彩回顧1.龍蜥社區(qū)成立DDE SIG,發(fā)布當(dāng)前移植進展2.跟蹤診斷技術(shù)SIG 7月運營月報:系統(tǒng)排查工具 ssar 即將開源 | 龍蜥SIG3.硬核啟動!第16屆「中國 Linux 內(nèi)核開發(fā)者大會」征稿開始4.絲般順滑!全新垃圾回收器 ZGC 初體驗 | 龍蜥技術(shù)5.Java語言與虛擬機SIG7月份運營月報:Dragonwell開發(fā)動態(tài) | 龍蜥SIG6.龍蜥社區(qū)8月運營委員會順利召開7.大連紅旗加入龍蜥社區(qū) 共建 RISC-V 開源生態(tài)8.干掉討厭的 CPU 限流,讓容器跑得更快 | 龍蜥技術(shù)9.移動云正式發(fā)布基于龍蜥 Anolis OS 的 BC-Linux V8.2 通用版操作系統(tǒng)10.商密軟件棧SIG 7月份運營月報|龍蜥SIG
本站聲明: 本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除( 郵箱:macysun@21ic.com )。
由臺達集團于2026年3月29日通過美通社發(fā)布新聞稿《集裝箱式SST直流移動智算中心發(fā)布》中,第3張有誤,已進行替換。特此更正,更新后的全文及圖片如下: 集裝箱式SST直流移動智算中心發(fā)布 臺達、漢騰科技、龍芯中科攜...
關(guān)鍵字:
移動
ST
固態(tài)變壓器
CPU
面對AI Agent與Physical AI的浪潮,單純依靠增加GPU或NPU的補丁式方案已難以為繼,CPU架構(gòu)必須進行面向AI的底層重塑。
阿里達摩院發(fā)布的玄鐵C950旗艦處理器,不僅刷新了單核性能紀(jì)錄,更通過原生A...
關(guān)鍵字:
玄鐵C950
CPU
AI
物理AI
RISC-V
北京2026年3月27日 /美通社/ -- 當(dāng)?shù)谑鍖萌珖\動會辦公系統(tǒng)全程穩(wěn)定運行時,當(dāng)銀行柜員輕點鼠標(biāo)實現(xiàn)業(yè)務(wù)秒級響應(yīng)時,當(dāng)大學(xué)生刷一卡通順暢進出宿舍、食堂、圖書館時,當(dāng)新能源汽車充電樁智能調(diào)度、巨災(zāi)預(yù)警系統(tǒng)精準(zhǔn)響應(yīng)...
關(guān)鍵字:
CPU
指令集
芯片
操作系統(tǒng)
成立三十余年來,Arm一直是芯片行業(yè)特殊的“幕后推手”——不生產(chǎn)一顆芯片,卻定義了全球99%智能手機的底層架構(gòu)。然而,這家長期保持中立的IP授權(quán)巨頭,如今正打破自己一手建立的商業(yè)規(guī)則。
關(guān)鍵字:
ARM
CPU
芯片
Arm 首次將其平臺矩陣拓展至量產(chǎn)芯片產(chǎn)品,為業(yè)界提供覆蓋 IP、Arm計算子系統(tǒng) (CSS)及芯片的最廣泛的計算產(chǎn)品選擇。
發(fā)布首款由 Arm 設(shè)計的數(shù)據(jù)中心 CPU——Arm AGI CPU,專為代理式AI 基...
關(guān)鍵字:
ARM
CPU
數(shù)據(jù)中心
代理式AI
2026年3月24日,美國加州圣何塞訊——Super Micro Computer, Inc.(NASDAQ:SMCI)作為云端計算、AI/機器學(xué)習(xí)、存儲和5G/邊緣領(lǐng)域的全方位IT解決方案供應(yīng)商,宣布推出基于NVIDI...
關(guān)鍵字:
DCBBS液冷架構(gòu)
CPU
存儲
3月24日,由阿里巴巴達摩院主辦的2026玄鐵RISC-V生態(tài)大會在上海舉行。高通、Arteris、Canonical、SHD Group、海爾、中興通訊、全志科技、北京智芯微、南芯科技等全球數(shù)百家產(chǎn)學(xué)研機構(gòu)齊聚一堂,分...
關(guān)鍵字:
RISC-V
CPU
算力
Supermicro的NVIDIA Vera Rubin NVL72與HGX Rubin NVL8系統(tǒng)是基于DCBBS液冷架構(gòu)所設(shè)計,與NVIDIA Blackwell...
關(guān)鍵字:
CPU
MICRO
NVIDIA
SUPER
3月24日消息,今日,在上海舉行的2026玄鐵RISC-V生態(tài)大會上,阿里巴巴達摩院發(fā)布新一代旗艦CPU產(chǎn)品玄鐵C950。
關(guān)鍵字:
RISC-V
CPU
March 18, 2026 ---- 根據(jù)TrendForce集邦咨詢最新AI Server研究,在大型云端服務(wù)供應(yīng)商(CSP)加大自研芯片力道的情況下,NVIDIA(英偉達)在GTC 2026大會改為著重各領(lǐng)域的AI...
關(guān)鍵字:
ASIC
GPU
CPU
可擴展邊緣計算性能,從容應(yīng)對嚴(yán)苛應(yīng)用挑戰(zhàn)
關(guān)鍵字:
邊緣計算
CPU
GPU
NVIDIA Vera CPU 為大規(guī)模數(shù)據(jù)處理、AI 訓(xùn)練和智能體式推理提供最高性能與能效
關(guān)鍵字:
數(shù)據(jù)處理
AI
CPU
近日,國產(chǎn)筆記本品牌馳為(CHUWI)深陷“CPU造假”風(fēng)波——繼其CoreBook X機型被曝用老款銳龍5 5500U冒充新款7430U之后,另一款CoreBook Plus也以完全相同的手法翻車了。
關(guān)鍵字:
CPU
【2026年3月12日,德國慕尼黑訊】隨著汽車行業(yè)向軟件定義汽車(SDV)轉(zhuǎn)型,網(wǎng)絡(luò)安全已成為保護車輛生態(tài)系統(tǒng)、主機廠(OEM)知識產(chǎn)權(quán)及終端客戶隱私的關(guān)鍵。為滿足這一需求,英飛凌科技股份公司(FSE代碼:IFX / O...
關(guān)鍵字:
微控制器
CPU
非易失性存儲器
隨著人工智能從云端向端側(cè)加速滲透,芯片設(shè)計面臨的復(fù)雜度與日俱增。企業(yè)不僅需要領(lǐng)先的技術(shù)支撐,更需要在成本控制、風(fēng)險管理和開發(fā)效率之間找到平衡。Arm技術(shù)授權(quán)訂閱模式通過Arm Flexible Access、Arm To...
關(guān)鍵字:
人工智能
芯片設(shè)計
CPU
March 10, 2026 ---- 根據(jù)TrendForce集邦咨詢最新筆電產(chǎn)業(yè)研究,2026年全球筆電市場正面臨需求疲弱、成本上升的雙重壓力,除了存儲器價格快速攀升,CPU價格也開始上調(diào)。據(jù)TrendForce集邦...
關(guān)鍵字:
筆電
存儲器
CPU
為COM-HPC Client 平臺帶來更強悍、更穩(wěn)定的性能表現(xiàn)
關(guān)鍵字:
邊緣計算
CPU
GPGPU
高性能計算分支預(yù)測失敗就像隱藏在代碼中的定時炸彈,當(dāng)CPU流水線遇到條件分支時,現(xiàn)代處理器雖然能以95%以上的準(zhǔn)確率預(yù)測執(zhí)行路徑,但剩余5%的錯誤仍會導(dǎo)致10-15個周期的流水線清空。在關(guān)鍵計算場景中,這種看似微小的失敗...
關(guān)鍵字:
if-else
CPU
在Linux系統(tǒng)中,進程管理是內(nèi)核的核心功能之一,其核心目標(biāo)是通過高效的調(diào)度機制和進程切換技術(shù),實現(xiàn)多任務(wù)并發(fā)執(zhí)行。
關(guān)鍵字:
Linux
CPU
Jan. 26, 2026 ---- 根據(jù)TrendForce集邦咨詢最新筆電產(chǎn)業(yè)調(diào)查,全球筆電品牌自2025年下半年起面臨存儲器價格顯著上漲的壓力,2026年初開始,又遭遇CPU階段性供給缺口、價格調(diào)漲的壓力,加上包括...
關(guān)鍵字:
筆電
CPU
存儲器