[導(dǎo)讀]編者按:CPUBurst特性已合入Linux5.14,AnolisOS8.2、AlibabaCloudLinux2、AlibabaCloudLinux3也都支持CPUBurst特性。在系列文章的上篇中,我們討論了讓人討厭的CPU限流,它會影響運行在容器中的應(yīng)用的一些關(guān)鍵指標(biāo)。為了...
編者按:CPU Burst 特性已合入 Linux 5.14,Anolis OS 8.2、Alibaba Cloud Linux2、Alibaba Cloud Linux3也都支持CPU Burst特性。
在系列文章的上篇中,我們討論了讓人討厭的 CPU 限流,它會影響運行在容器中的應(yīng)用的一些關(guān)鍵指標(biāo)。為了避免限流的出現(xiàn),有時我們不得不犧牲容器部署密度,從而導(dǎo)致資源浪費的產(chǎn)生。在解決方案部分,我們也介紹了新的CPU Burst 技術(shù),通過這一技術(shù),我們既能保證容器運行服務(wù)質(zhì)量,又不降低容器部署密度。聽起來有點像個銀彈啊?那么,使用CPU Burst的副作用是什么?是否有不適用的場景呢?為了回答這個問題,本文將介紹CPU Burst打破的調(diào)度保證,以及CPU Burst影響評估。盡管這些CPU突發(fā)的使用造成的CPU使用差異在CPU利用率上很多時候不明顯,但是我們?nèi)匀魂P(guān)心這種改變的影響。當(dāng)然,結(jié)論是明確的:CPU Burst的負(fù)面影響完全可以忽略。僅在CPU利用率高達(dá)70%的環(huán)境里CPU Burst開始影響關(guān)鍵指標(biāo),而我相信大家日常生產(chǎn)環(huán)境的CPU利用率都遠(yuǎn)遠(yuǎn)低于這個水平。CPU Bandwidth Controller的保證
使用CPU Bandwidth Controller可以避免某些進(jìn)程消耗過多CPU時間,并確保所有需要CPU的進(jìn)程都拿到足夠的CPU時間。之所以有這樣好的穩(wěn)定性保證,是因為當(dāng)Bandwidth Controller設(shè)置滿足時,有如下的調(diào)度穩(wěn)定性約束:
其中是第i個cgroup的quota,是一個period內(nèi)該cgroup的CPU需求。Bandwidth Controller對每個周期分別做CPU時間統(tǒng)計,調(diào)度穩(wěn)定性約束保證在一個period內(nèi)提交的全部任務(wù)都能在該周期內(nèi)處理完;對每個CPU cgroup而言,這意味著任何時候提交的任務(wù)都能在一個period內(nèi)執(zhí)行完,即任務(wù)實時性約束:
不管任務(wù)優(yōu)先級如何,最壞情況下任務(wù)執(zhí)行時間(WCET, Worst-Case Execution Time)不超過一個period。假如持續(xù)出現(xiàn)調(diào)度器穩(wěn)定性被打破,在每個period都有任務(wù)積攢下來,新提交的作業(yè)執(zhí)行時間不斷增加。
使用CPU Burst的影響
出于改善服務(wù)質(zhì)量的需要,我們使用CPU Burst允許突發(fā)的CPU使用之后,對調(diào)度器的穩(wěn)定性產(chǎn)生什么影響?答案是當(dāng)多個cgroup同時突發(fā)使用CPU,調(diào)度器穩(wěn)定性約束和任務(wù)實時性保證有可能被打破。這時候兩個約束得到保證的概率是關(guān)鍵,如果兩個約束得到保證的概率很高,對大多數(shù)周期來任務(wù)實時性都得到保證,可以放心大膽使用CPU Burst;如果任務(wù)實時性得到保證的概率很低,這時候要改善服務(wù)質(zhì)量不能直接使用CPU Burst,應(yīng)該先降低部署密度提高CPU資源配置。于是下一個關(guān)心的問題是,怎么計算特定場景下兩個約束被打破的概率。
評估影響大小
定量計算可以定義成經(jīng)典的排隊論問題,并且用蒙特卡洛模擬方法求解。定量計算的結(jié)果表明,判斷當(dāng)前場景是否可以使用CPU Burst的主要影響因素是平均CPU利用率和cgroup數(shù)目。CPU利用率越低,或者cgroup數(shù)目越多,兩個約束越不容易被打破可以放心使用CPU Burst。反之如果CPU利用率很高或者cgroup數(shù)目較少,要消除CPU限流對進(jìn)程執(zhí)行的影響,應(yīng)該降低部署提高配置再使用CPU Burst。問題定義是:一共有m個cgroup,每個cgroup的quota限制為1/m,每個cgroup在每個周期產(chǎn)生的計算需求(CPU利用率)服從某個具體分布,這些分布是相互獨立的。假設(shè)任務(wù)在每個周期的開始到達(dá),如果該周期內(nèi)的CPU需求超過100%,當(dāng)前周期任務(wù)WCET超過1個period,超過的部分累積下來和下個周期新產(chǎn)生的CPU需求一起在下個需求處理。輸入是cgroup的數(shù)目m和每個CPU需求滿足的具體分布,輸出是每個周期結(jié)束WCET > period的概率和WCET期望。使用蒙特卡洛模擬求解過程省略,詳細(xì)請關(guān)注后續(xù)系列文章。以輸入的CPU需求為帕累托分布、m=10/20/30的結(jié)果為例進(jìn)行說明。選擇帕累托分布進(jìn)行說明的原因是它產(chǎn)生比較多的長尾CPU突發(fā)使用,容易產(chǎn)生較大影響。表格中數(shù)據(jù)項的格式為,其中越接近1越好,概率越低越好。
|
u_avg
|
m=10
|
m=20
|
m=30
|
|
10%
|
1.0000/0.00%
|
1.0000/0.00%
|
1.0000/0.00%
|
30%
|
1.0000/0.00%
|
1.0000/0.00%
|
1.0000/0.00%
|
|
50%
|
1.0003/0.03%
|
1.0000/0.00%
|
1.0000/0.00%
|
70%
|
1.0077/0.66%
|
1.0013/0.12%
|
1.0004/0.04%
|
90%
|
1.4061/19.35%
|
1.1626/10.61%
|
1.0867/6.52%
|
結(jié)果跟直覺是吻合的。一方面,CPU需求(CPU利用率)越高,CPU突發(fā)越容易打破穩(wěn)定性約束,造成任務(wù)WCET期望變長。另一方面,CPU需求獨立分布的cgroup數(shù)目越多,它們同時產(chǎn)生CPU突發(fā)需求的可能性越低,調(diào)度器穩(wěn)定性約束越容易保持,WCET的期望越接近1個period。
后續(xù)
看完本文相信您對CPU Burst的影響已經(jīng)有了定性了解。如果希望對評估方法有更多了解,請期待系列文章的下篇。關(guān)于作者
常懷鑫(一齋),阿里云內(nèi)核組工程師,擅長CPU調(diào)度領(lǐng)域。
丁天琛(鷹羽),2021年加入阿里云內(nèi)核組,目前在調(diào)度領(lǐng)域等方面學(xué)習(xí)研究——完——
本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除( 郵箱:macysun@21ic.com )。
由臺達(dá)集團(tuán)于2026年3月29日通過美通社發(fā)布新聞稿《集裝箱式SST直流移動智算中心發(fā)布》中,第3張有誤,已進(jìn)行替換。特此更正,更新后的全文及圖片如下: 集裝箱式SST直流移動智算中心發(fā)布 臺達(dá)、漢騰科技、龍芯中科攜...
關(guān)鍵字:
移動
ST
固態(tài)變壓器
CPU
面對AI Agent與Physical AI的浪潮,單純依靠增加GPU或NPU的補(bǔ)丁式方案已難以為繼,CPU架構(gòu)必須進(jìn)行面向AI的底層重塑。
阿里達(dá)摩院發(fā)布的玄鐵C950旗艦處理器,不僅刷新了單核性能紀(jì)錄,更通過原生A...
關(guān)鍵字:
玄鐵C950
CPU
AI
物理AI
RISC-V
北京2026年3月27日 /美通社/ -- 當(dāng)?shù)谑鍖萌珖\動會辦公系統(tǒng)全程穩(wěn)定運行時,當(dāng)銀行柜員輕點鼠標(biāo)實現(xiàn)業(yè)務(wù)秒級響應(yīng)時,當(dāng)大學(xué)生刷一卡通順暢進(jìn)出宿舍、食堂、圖書館時,當(dāng)新能源汽車充電樁智能調(diào)度、巨災(zāi)預(yù)警系統(tǒng)精準(zhǔn)響應(yīng)...
關(guān)鍵字:
CPU
指令集
芯片
操作系統(tǒng)
成立三十余年來,Arm一直是芯片行業(yè)特殊的“幕后推手”——不生產(chǎn)一顆芯片,卻定義了全球99%智能手機(jī)的底層架構(gòu)。然而,這家長期保持中立的IP授權(quán)巨頭,如今正打破自己一手建立的商業(yè)規(guī)則。
關(guān)鍵字:
ARM
CPU
芯片
Arm 首次將其平臺矩陣拓展至量產(chǎn)芯片產(chǎn)品,為業(yè)界提供覆蓋 IP、Arm計算子系統(tǒng) (CSS)及芯片的最廣泛的計算產(chǎn)品選擇。
發(fā)布首款由 Arm 設(shè)計的數(shù)據(jù)中心 CPU——Arm AGI CPU,專為代理式AI 基...
關(guān)鍵字:
ARM
CPU
數(shù)據(jù)中心
代理式AI
2026年3月24日,美國加州圣何塞訊——Super Micro Computer, Inc.(NASDAQ:SMCI)作為云端計算、AI/機(jī)器學(xué)習(xí)、存儲和5G/邊緣領(lǐng)域的全方位IT解決方案供應(yīng)商,宣布推出基于NVIDI...
關(guān)鍵字:
DCBBS液冷架構(gòu)
CPU
存儲
3月24日,由阿里巴巴達(dá)摩院主辦的2026玄鐵RISC-V生態(tài)大會在上海舉行。高通、Arteris、Canonical、SHD Group、海爾、中興通訊、全志科技、北京智芯微、南芯科技等全球數(shù)百家產(chǎn)學(xué)研機(jī)構(gòu)齊聚一堂,分...
關(guān)鍵字:
RISC-V
CPU
算力
Supermicro的NVIDIA Vera Rubin NVL72與HGX Rubin NVL8系統(tǒng)是基于DCBBS液冷架構(gòu)所設(shè)計,與NVIDIA Blackwell...
關(guān)鍵字:
CPU
MICRO
NVIDIA
SUPER
3月24日消息,今日,在上海舉行的2026玄鐵RISC-V生態(tài)大會上,阿里巴巴達(dá)摩院發(fā)布新一代旗艦CPU產(chǎn)品玄鐵C950。
關(guān)鍵字:
RISC-V
CPU
March 18, 2026 ---- 根據(jù)TrendForce集邦咨詢最新AI Server研究,在大型云端服務(wù)供應(yīng)商(CSP)加大自研芯片力道的情況下,NVIDIA(英偉達(dá))在GTC 2026大會改為著重各領(lǐng)域的AI...
關(guān)鍵字:
ASIC
GPU
CPU
可擴(kuò)展邊緣計算性能,從容應(yīng)對嚴(yán)苛應(yīng)用挑戰(zhàn)
關(guān)鍵字:
邊緣計算
CPU
GPU
NVIDIA Vera CPU 為大規(guī)模數(shù)據(jù)處理、AI 訓(xùn)練和智能體式推理提供最高性能與能效
關(guān)鍵字:
數(shù)據(jù)處理
AI
CPU
近日,國產(chǎn)筆記本品牌馳為(CHUWI)深陷“CPU造假”風(fēng)波——繼其CoreBook X機(jī)型被曝用老款銳龍5 5500U冒充新款7430U之后,另一款CoreBook Plus也以完全相同的手法翻車了。
關(guān)鍵字:
CPU
【2026年3月12日,德國慕尼黑訊】隨著汽車行業(yè)向軟件定義汽車(SDV)轉(zhuǎn)型,網(wǎng)絡(luò)安全已成為保護(hù)車輛生態(tài)系統(tǒng)、主機(jī)廠(OEM)知識產(chǎn)權(quán)及終端客戶隱私的關(guān)鍵。為滿足這一需求,英飛凌科技股份公司(FSE代碼:IFX / O...
關(guān)鍵字:
微控制器
CPU
非易失性存儲器
隨著人工智能從云端向端側(cè)加速滲透,芯片設(shè)計面臨的復(fù)雜度與日俱增。企業(yè)不僅需要領(lǐng)先的技術(shù)支撐,更需要在成本控制、風(fēng)險管理和開發(fā)效率之間找到平衡。Arm技術(shù)授權(quán)訂閱模式通過Arm Flexible Access、Arm To...
關(guān)鍵字:
人工智能
芯片設(shè)計
CPU
March 10, 2026 ---- 根據(jù)TrendForce集邦咨詢最新筆電產(chǎn)業(yè)研究,2026年全球筆電市場正面臨需求疲弱、成本上升的雙重壓力,除了存儲器價格快速攀升,CPU價格也開始上調(diào)。據(jù)TrendForce集邦...
關(guān)鍵字:
筆電
存儲器
CPU
為COM-HPC Client 平臺帶來更強(qiáng)悍、更穩(wěn)定的性能表現(xiàn)
關(guān)鍵字:
邊緣計算
CPU
GPGPU
高性能計算分支預(yù)測失敗就像隱藏在代碼中的定時炸彈,當(dāng)CPU流水線遇到條件分支時,現(xiàn)代處理器雖然能以95%以上的準(zhǔn)確率預(yù)測執(zhí)行路徑,但剩余5%的錯誤仍會導(dǎo)致10-15個周期的流水線清空。在關(guān)鍵計算場景中,這種看似微小的失敗...
關(guān)鍵字:
if-else
CPU
在Linux系統(tǒng)中,進(jìn)程管理是內(nèi)核的核心功能之一,其核心目標(biāo)是通過高效的調(diào)度機(jī)制和進(jìn)程切換技術(shù),實現(xiàn)多任務(wù)并發(fā)執(zhí)行。
關(guān)鍵字:
Linux
CPU
Jan. 26, 2026 ---- 根據(jù)TrendForce集邦咨詢最新筆電產(chǎn)業(yè)調(diào)查,全球筆電品牌自2025年下半年起面臨存儲器價格顯著上漲的壓力,2026年初開始,又遭遇CPU階段性供給缺口、價格調(diào)漲的壓力,加上包括...
關(guān)鍵字:
筆電
CPU
存儲器