“國產(chǎn)GPU第一股”雙芯齊發(fā)!
在2025年臨近尾聲之際,國產(chǎn)GPU行業(yè)迎來了一劑強(qiáng)心針。
12月20日,備受矚目的“國產(chǎn)GPU第一股”摩爾線程在其2025年度MUSA開發(fā)者大會(huì)上,不僅發(fā)布了全新的“花港”GPU架構(gòu),更一舉推出了基于該架構(gòu)的兩款側(cè)重點(diǎn)完全不同的芯片——“華山”與“廬山”。
此舉標(biāo)志著國產(chǎn)GPU企業(yè)正從尋求“通用全能”,轉(zhuǎn)向針對(duì)AI計(jì)算與圖形渲染兩大核心賽道進(jìn)行精準(zhǔn)、深入的專業(yè)化發(fā)力。
據(jù)悉,“花港”架構(gòu)采用了全新一代指令集,支持異步編程模型與高效線程協(xié)同,不僅算力密度直接提升50%,能效比更是實(shí)現(xiàn)10倍飛躍!更關(guān)鍵的是,它首次實(shí)現(xiàn)了從FP4到FP64的全精度端到端計(jì)算支持,搭配自研MTLink高速互聯(lián)技術(shù),直接具備支撐超十萬卡級(jí)AI工廠的硬實(shí)力,為國產(chǎn)大模型訓(xùn)練掃清了算力障礙,堪稱國產(chǎn)GPU的“技術(shù)革命”。
基于“花港”架構(gòu)的兩款芯片,則完美詮釋了“術(shù)業(yè)有專攻”。其中,“華山”芯片可視作AI訓(xùn)推一體的“算力猛獸”,旨在提供一體化的AI算力解決方案。該芯片內(nèi)置新一代張量計(jì)算引擎,兼容全精度矩陣運(yùn)算與低精度優(yōu)化,片間互聯(lián)帶寬高達(dá)1314GB/s,配合SHARP網(wǎng)絡(luò)協(xié)議優(yōu)化,成為了構(gòu)建超大規(guī)模AI工廠的核心底座,部分性能已看齊國際頂尖水平。
而“廬山”芯片可稱為3A游戲玩家的“畫質(zhì)福音”,旨在為游戲、虛擬現(xiàn)實(shí)、數(shù)字內(nèi)容創(chuàng)作等領(lǐng)域提供強(qiáng)悍的視覺動(dòng)力。該芯片專攻高性能圖形渲染,光線追蹤性能暴漲50倍,3A游戲渲染效率提升15倍,原子訪存性能與顯存容量也分別實(shí)現(xiàn)了8倍、4倍提升。不僅如此,其搭載的AI生成式渲染架構(gòu)與統(tǒng)一渲染引擎,完美兼容DirectX 12 Ultimate標(biāo)準(zhǔn),讓國產(chǎn)GPU首次具備了駕馭3A大作與專業(yè)圖形創(chuàng)作的能力。
除了硬件突破,摩爾線程更是在軟件生態(tài)下足了功夫:MUSA 5.0全棧軟件的核心計(jì)算庫效率超98%,通信效率達(dá)97%,還將逐步開源計(jì)算加速庫、通信庫等核心組件,降低開發(fā)者適配門檻。截至目前,摩爾線程累計(jì)授權(quán)專利超500項(xiàng),從架構(gòu)到芯片、從硬件到軟件,實(shí)現(xiàn)了全棧自主可控,更構(gòu)建了“端-邊-云”全場景算力布局,讓國產(chǎn)GPU不再“單槍匹馬”作戰(zhàn)。
總之,從AI大模型訓(xùn)練到3A游戲體驗(yàn),從數(shù)據(jù)中心到個(gè)人設(shè)備,摩爾線程的這次發(fā)布,不僅是一次產(chǎn)品升級(jí),更是國產(chǎn)GPU從“單點(diǎn)突破”邁向“體系化領(lǐng)先”的標(biāo)志。隨著明年兩款芯片正式商用,國產(chǎn)算力自主化的進(jìn)程將全面提速,未來我們或許能在更多場景中感受到“中國芯”帶來的算力與畫質(zhì)雙重驚喜。
一款專攻AI,一款專注圖形,摩爾線程這樣的“雙線作戰(zhàn)”策略,大家看好嗎? 歡迎在評(píng)論區(qū),分享你的見解!





