Day0首發(fā)!海光DCU高效支持智譜GLM-5大模型
2月11日,智譜AI正式上線并開(kāi)源GLM-5。海光DCU同步完成對(duì)GLM-5的Day0適配與聯(lián)合優(yōu)化,依托自研AI軟件棧與開(kāi)放生態(tài)能力,率先為全球開(kāi)發(fā)者、企業(yè)用戶提供即取即用的部署方案,助力GLM-5核心能力快速落地。
GLM-5在Coding與Agent能力上取得開(kāi)源SOTA表現(xiàn),在真實(shí)編程場(chǎng)景的使用體感逼近Claude Opus 4.5,擅長(zhǎng)復(fù)雜系統(tǒng)工程與長(zhǎng)程Agent任務(wù):
?參數(shù)規(guī)模從355B(激活32B)擴(kuò)展至744B(激活40B),預(yù)訓(xùn)練數(shù)據(jù)從23T提升至28.5T,大幅提升通用智能水平;
?構(gòu)建全新“Slime”異步強(qiáng)化學(xué)習(xí)框架,支持更大模型規(guī)模及更復(fù)雜強(qiáng)化學(xué)習(xí)任務(wù),可通過(guò)異步智能體強(qiáng)化學(xué)習(xí)算法持續(xù)從長(zhǎng)程交互中學(xué)習(xí);
?首次集成DeepSeek Sparse Attention稀疏注意力機(jī)制,在維持長(zhǎng)文本效果無(wú)損的同時(shí),大幅降低模型部署成本、提升Token Efficiency。
在本次Day0適配合作中,海光DCU團(tuán)隊(duì)深度協(xié)同智譜AI,憑借DTK等自研軟件棧優(yōu)勢(shì),重點(diǎn)優(yōu)化底層算子與硬件加速,使GLM-5在海光DCU上實(shí)現(xiàn)高吞吐、低延遲的穩(wěn)定運(yùn)行,充分發(fā)揮“國(guó)產(chǎn)算力+國(guó)產(chǎn)大模型”價(jià)值。
當(dāng)前,AI大模型正向更高參數(shù)、更優(yōu)性能、更廣場(chǎng)景邁進(jìn),底層算力的適配能力成為決定模型落地效率的關(guān)鍵因素。海光DCU通過(guò)提前布局、快速響應(yīng),實(shí)現(xiàn)與GLM-5等頂尖大模型的同步適配,不僅為用戶提供高效、可靠、低成本的算力解決方案,也打破了“算力與模型脫節(jié)”的行業(yè)痛點(diǎn),推動(dòng)國(guó)產(chǎn)算力與大模型的雙向賦能。
未來(lái),海光DCU團(tuán)隊(duì)將不斷深化與智譜AI等中國(guó)AI企業(yè)的合作,緊跟大模型技術(shù)迭代步伐,加快推進(jìn)更多前沿模型的適配與優(yōu)化工作,加速“算力+模型+場(chǎng)景”的深度融合,助力我國(guó)在全球AI競(jìng)爭(zhēng)中占據(jù)主動(dòng)地位。





