日本黄色一级经典视频|伊人久久精品视频|亚洲黄色色周成人视频九九九|av免费网址黄色小短片|黄色Av无码亚洲成年人|亚洲1区2区3区无码|真人黄片免费观看|无码一级小说欧美日免费三级|日韩中文字幕91在线看|精品久久久无码中文字幕边打电话

當(dāng)前位置:首頁 > 芯聞號(hào) > 行業(yè)動(dòng)態(tài)

2025年11月13日,安謀科技Arm China在上海隆重發(fā)布新一代NPU IP“周易”X3。作為專為大模型時(shí)代打造的尖端產(chǎn)品,采用革命性的DSP+DSA混合架構(gòu),具備全面精度支持與多項(xiàng)自研硬件加速技術(shù),致力于為智能汽車、移動(dòng)終端、智能物聯(lián)網(wǎng)等關(guān)鍵領(lǐng)域注入強(qiáng)大AI算力,提升端側(cè)計(jì)算效率,推動(dòng)邊緣AI規(guī)模化部署。

安謀科技發(fā)布NPU IP“周易”X3,驅(qū)動(dòng)架構(gòu)革新再定義端側(cè)AI

 

一、架構(gòu)革新:專為大模型而生,開啟浮點(diǎn)計(jì)算新紀(jì)元

“周易”X3的核心突破在于其底層架構(gòu)的徹底革新。它采用了專為應(yīng)對復(fù)雜大模型計(jì)算挑戰(zhàn)而設(shè)計(jì)的最新DSP+DSA架構(gòu),實(shí)現(xiàn)了從傳統(tǒng)定點(diǎn)計(jì)算向高性能浮點(diǎn)計(jì)算的關(guān)鍵跨越。該架構(gòu)支持靈活的算力配置,單計(jì)算集群Cluster可提供高達(dá)8-80 FP8 TFLOPS的算力,同時(shí)單核心Core帶寬飆升至256GB/s,為數(shù)據(jù)密集型的大模型應(yīng)用提供了堅(jiān)實(shí)的數(shù)據(jù)吞吐保障。

尤為關(guān)鍵的是,“周易”X3原生支持了端側(cè)高效運(yùn)行大模型所必需的W4A8與W4A16計(jì)算加速模式。通過對模型權(quán)重進(jìn)行低比特量化,有效大幅降低了內(nèi)存帶寬消耗,打通了云端大模型向資源受限的端側(cè)設(shè)備高效遷移的技術(shù)路徑。

安謀科技發(fā)布NPU IP“周易”X3,驅(qū)動(dòng)架構(gòu)革新再定義端側(cè)AI

 

二、性能飛躍:算力密度與效率雙提升,大模型能力激增十倍

得益于架構(gòu)的根本性升級,“周易”X3在性能上實(shí)現(xiàn)了質(zhì)的飛躍。官方數(shù)據(jù)顯示,相較于前代“周易”X2,新一代“周易”X3在處理廣泛應(yīng)用的CNN模型時(shí),性能提升高達(dá)30%至50%。更為驚人的是,在相同算力規(guī)格下,其AIGC大模型處理能力實(shí)現(xiàn)了10倍級的跨越式增長。這一驚人表現(xiàn),源于其16倍的FP16 TFLOPS算力提升、4倍的計(jì)算核心帶寬增長,及超過10倍的Softmax和LayerNorm關(guān)鍵運(yùn)算性能強(qiáng)化。實(shí)測標(biāo)明,多核協(xié)同工作的算力線性度達(dá)到了優(yōu)異的70%-80%,確保了算力的高效利用。

在實(shí)際大模型推理測試中,“周易”X3的表現(xiàn)同樣耀眼。在運(yùn)行Llama2 7B等主流大模型時(shí),其預(yù)填充Prefill階段的算力利用率高達(dá)72%,而在關(guān)鍵的解碼Decode階段,在安謀科技自研解壓硬件WDC的加持下,有效帶寬利用率更是突破了100%,遠(yuǎn)超行業(yè)平均水平,充分釋放了硬件的潛在算力,為大模型在端側(cè)的流暢運(yùn)行提供了極致性能保障。

安謀科技發(fā)布NPU IP“周易”X3,驅(qū)動(dòng)架構(gòu)革新再定義端側(cè)AI

 

三、關(guān)鍵技術(shù)突破:四大核心引擎,精準(zhǔn)破解端側(cè)AI難題

“周易”X3并非簡單的性能堆砌,而是通過一系列集成化的硬件創(chuàng)新,精準(zhǔn)解決了端側(cè)部署AI大模型面臨的帶寬、調(diào)度、精度適配等核心難題。

“周易”X3搭載自研解壓硬件WDC,創(chuàng)新性地集成了權(quán)重解壓硬件單元,支持對大模型權(quán)重進(jìn)行軟件無損壓縮后直接硬件解壓,帶來約15%的等效帶寬提升,有效緩解了內(nèi)存墻壓力。同時(shí),集成的AI專屬硬件引擎AIFF與專用硬化調(diào)度器,將CPU負(fù)載降至0.5%以下,并顯著降低了任務(wù)調(diào)度延遲。這使得NPU在并行處理多路AI任務(wù)時(shí),即使在高優(yōu)先級任務(wù)需即時(shí)響應(yīng)的復(fù)雜場景下,仍能保持系統(tǒng)流暢高效運(yùn)行。

“周易”X3還支持int4/int8/int16/int32/fp4/fp8/fp16/bf16/fp32等多精度融合計(jì)算與強(qiáng)浮點(diǎn)運(yùn)算能力。憑借其全面的整數(shù)與浮點(diǎn)計(jì)算支持,該NPU IP能夠無縫適配從傳統(tǒng)CNN模型到前沿Transformer大模型的多樣化計(jì)算需求,在智能手機(jī)邊緣推理、AI PC、智能汽車等不同應(yīng)用中實(shí)現(xiàn)性能與能效的精準(zhǔn)平衡。此外,新增的端側(cè)大模型必備W4A8/W4A16計(jì)算加速模式,可對模型權(quán)重進(jìn)行低比特量化,大幅降低帶寬消耗,有效支持云端大模型向端側(cè)的高效遷移。

安謀科技發(fā)布NPU IP“周易”X3,驅(qū)動(dòng)架構(gòu)革新再定義端側(cè)AI

 

寫在最后

安謀科技Arm China “周易”X3 NPU IP的發(fā)布,標(biāo)志著端側(cè)AI計(jì)算能力邁上了一個(gè)全新臺(tái)階。其兼具高性能、高能效與高靈活性的特點(diǎn),將直接賦能智能汽車、移動(dòng)終端、智能物聯(lián)網(wǎng)、基礎(chǔ)設(shè)施等領(lǐng)域。配合其成熟易用的“周易”NPU Compass AI軟件平臺(tái),構(gòu)成了一個(gè)完整的軟硬件一體化解決方案,將極大降低開發(fā)門檻,推動(dòng)創(chuàng)新AI應(yīng)用在各行各業(yè)的快速孵化和部署。


本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時(shí)聯(lián)系本站刪除( 郵箱:macysun@21ic.com )。
換一批
延伸閱讀

在電子工程領(lǐng)域,JTAG(Joint Test Action Group)技術(shù)已成為芯片測試和系統(tǒng)調(diào)試的核心工具。從1980年代為解決PCB制造問題而誕生,到如今廣泛應(yīng)用于FPGA配置、嵌入式系統(tǒng)調(diào)試和芯片級編程,JTA...

關(guān)鍵字: JTAG ARM

在萬物互聯(lián)的智能時(shí)代,嵌入式微處理器如同數(shù)字世界的神經(jīng)末梢,支撐著從智能手表到工業(yè)機(jī)器人的各類設(shè)備運(yùn)行。ARM、MIPS、RISC-V三大主流架構(gòu)憑借各自的技術(shù)優(yōu)勢,在嵌入式領(lǐng)域形成了三足鼎立的格局。本文將從技術(shù)特性、應(yīng)...

關(guān)鍵字: ARM MIPS RISC - V

當(dāng)?shù)貢r(shí)間周三,Arm 控股公司CEO(首席執(zhí)行官)雷內(nèi)?哈斯(Rene Haas)在接受 CNBC 主持人吉姆?克萊默采訪時(shí)表示,將部分 AI 功能移出云端,有助于降低能源消耗。

關(guān)鍵字: 數(shù)據(jù)中心 ARM AI

北京2025年10月13日 /美通社/ -- 秋風(fēng)送爽,豐收正當(dāng)時(shí)。2025年10月10日至11日,"再生農(nóng)業(yè),生生不息——梨樹耘遠(yuǎn)農(nóng)場主題研討會(huì)暨豐收測產(chǎn)活動(dòng)"在吉林省拜耳梨樹耘遠(yuǎn)農(nóng)場成功舉辦。產(chǎn)學(xué)...

關(guān)鍵字: 可持續(xù)發(fā)展 研討會(huì) ARM BSP

Arm Lumex CSS平臺(tái)的發(fā)布,不僅標(biāo)志著移動(dòng)計(jì)算邁向AI優(yōu)先的新時(shí)代,更彰顯了Arm以生態(tài)協(xié)同與技術(shù)創(chuàng)新驅(qū)動(dòng)未來的雄心。從SME2賦能的5倍AI性能飛躍,到SI L1與MMU L1的系統(tǒng)級優(yōu)化,Lumex為旗艦智...

關(guān)鍵字: AI ARM Lumex CCS

ARM系統(tǒng)幾乎都采用Linux的操作系統(tǒng),而且?guī)缀跛械挠布到y(tǒng)都要單獨(dú)構(gòu)建自己的系統(tǒng),與其他系統(tǒng)不能兼容,這也導(dǎo)致其應(yīng)用軟件不能方便移植,這一點(diǎn)一直嚴(yán)重制約了ARM系統(tǒng)的發(fā)展和應(yīng)用。GOOGLE開發(fā)了開放式的Andro...

關(guān)鍵字: Linux x86 ARM
關(guān)閉