日本黄色一级经典视频|伊人久久精品视频|亚洲黄色色周成人视频九九九|av免费网址黄色小短片|黄色Av无码亚洲成年人|亚洲1区2区3区无码|真人黄片免费观看|无码一级小说欧美日免费三级|日韩中文字幕91在线看|精品久久久无码中文字幕边打电话

當前位置:首頁 > 原創(chuàng) > 劉巖軒
[導讀]近日燧原科技發(fā)布新一代“邃思”AI推理芯片,采用第二代高性能計算核心和數(shù)據(jù)引擎,由12nm工藝打造,通過架構升級,大大提高了單位面積的晶體管效率,從而實現(xiàn)了與目前業(yè)內7nm GPU相匹敵的計算能力。同時因為采用12nm的成熟工藝,也實現(xiàn)了更優(yōu)的性價比。

近日燧原科技發(fā)布了其最新的“邃思”AI推理芯片及其推理卡云燧i20,這是其推理產品的最新迭代。新一代“邃思”AI推理芯片采用第二代高性能計算核心和數(shù)據(jù)引擎,由12nm工藝打造,通過架構升級,大大提高了單位面積的晶體管效率,從而實現(xiàn)了與目前業(yè)內7nm GPU相匹敵的計算能力。同時因為采用12nm的成熟工藝,也實現(xiàn)了更優(yōu)的性價比。

另外一個重要意義在于,第二代推理產品的面市意味著燧原科技已經實現(xiàn)了推理+訓練的第二代產品組合的全面迭代,這是AI國產自研架構芯片穩(wěn)步有序邁進的體現(xiàn)。

在燧原科技“芯懷天地”新品發(fā)布會上,燧原科技CEO趙立東和COO張亞林針對推理訓練產品及其最新技術進行了精彩的分享。


AI市場新趨勢:推理產品比例變高


人工智能分為訓練和推理兩個主要的任務,訓練是指創(chuàng)建機器學習算法的過程,訓練的比例和整個數(shù)據(jù)科學家的生產力直接相關,需要大量的計算資源來部署學習框架和訓練數(shù)據(jù)集。而推理指的是使用經過訓練的算法來進行預測,因此跟整個用戶和海量的應用直接相關,與用戶和用戶所持應用的數(shù)量乘積成直接正比例的關系。

上圖是從2017到2023年AI市場的走勢,可以看到推理在整個AI市場中占的比例在逐漸增大,推理的實際應用場景也變得多元化,AI的業(yè)務從傳統(tǒng)單一的機器視覺、聲音、文字、決策、推薦等方向性的算法,逐步變成多場景、多應用的落地,廣泛分布在用戶日常生活中。結合推理的客戶需求場景,這樣的計算密集型應用對于性價比的考量也會更為敏感。所以除了GPU之外的其他更具性價比的方案,有望在這部分實現(xiàn)突圍。針對這樣的趨勢,AI芯片公司譬如燧原科技早也在推理產品上進行了投入和布局。

在去年12月,燧原科技就發(fā)布了其首款神經網絡模型推理引擎“鑒算TopsInference”及其“云燧i10”推理卡。通過鑒算TopsInference的推理加速,配合云燧i10的高算力及虛擬化技術,可以對計算密集型深度學習工作負載提供高性價比的部署方案。到了今年12月剛好一年的時間,燧原科技隨即發(fā)布了其新一代的“邃思2.5”AI推理芯片及其推理卡云燧i20。這也意味著其推理產品也進入了有序的迭代節(jié)奏中,同時也是對于當前AI市場推理產品旺盛需求的及時產品補充。


DTU2.5 :國內首顆TF23推理芯片


“邃思2.5”采用的是專門為云端推理場景而自主研發(fā)的計算架構,燧原在這顆芯片上,針對場景落地需求、包括性價比和能效比都有著嚴苛的設計要求。

據(jù)張亞東介紹,“邃思”推理芯片采用具備全AI算力空間的計算架構,具備32位的算力,從FP32一直到INT8,包含中間精度TF32、BF16、FP16五個精度構成了全AI算力空間,滿足各種各樣推理的客戶需求。單精度FP32達到了32 TFLOPS、單精度張量TF32達到了128 TFLOPS;同樣具備半精度BF16/FP16的算力,達到128 TFLOPS。在最重要的推理方面,整數(shù)精度INT8也有了提升,達到256TOPS。

據(jù)悉,這是中國第一顆具備TF32張量單精度的推理芯片,能用16位的算力達到32位的精度,實現(xiàn)4倍于FP32的算力,同時保持99%的整個模型精度一致性。

數(shù)據(jù)架構方面采用了完全自研的 (Sparse Value Segment ) 數(shù)據(jù)壓縮格式,能夠進行獨立的分層壓縮和硬件自動循環(huán)解壓,使得所有的數(shù)據(jù)(特別是稀疏數(shù)據(jù))在傳輸過程帶寬和功耗減少。同時支持硬件指令預取的操作,使得指令的預取、數(shù)據(jù)的傳輸和計算可以同時進行,進行并行的數(shù)據(jù)廣播,使得同樣的數(shù)據(jù)可以廣播到多個處理器上進行并行執(zhí)行。同時,這種數(shù)據(jù)壓縮格式還具有很強的動態(tài)功耗控制,讓整個數(shù)據(jù)傳輸?shù)膭討B(tài)功耗變得非常的有效。

內存方面是采用兩顆HBM2E,單芯片容量為16GB,最大帶寬達到819GB/s。封裝形式采用了2.5D的封裝,整合了5顆芯片進去,尺寸為55mmX55mm。

除了能效比、性價比這些關鍵因素之外,用戶的實際部署易用性也是非常重要的考量。針對當前爆炸式增長的多樣化的推理落地場景,燧原科技進一步加強推理軟件棧,使其更加泛化易用,滿足更多客戶日益增長的需求。


超越主流GPU的性價比之選


搭載2.5代DTU的推理加速卡云燧i20,縱向上實現(xiàn)了比前代產品的大幅提升,橫向上對比GPU的方案也有更好的性價比。

相比云燧i10,云燧i20的浮點32位的算力從17.6T提升到32T,浮點16位的算力從70.4T提升到了128T,INT8整點8位的算力從70.4T提升到了256T,HBM2升級到HBM2E后相應的帶寬也從512GB提升了819GB,連接方式和功耗表現(xiàn)上與前代保持一致。

如下圖所示,根據(jù)燧原科技提供的和某次旗艦GPU加速卡的對比數(shù)據(jù),以該次旗艦GPU的參數(shù)為基準,i20的浮點16位的算力是其2倍,INT8的算力是2倍,內存帶寬是2.65倍。

據(jù)張亞東介紹,在DTU2.5設計最初,燧原就定了其性能目標——至少達到主流GPU次旗艦的2.5倍以上,最高達到3.5倍。在這樣的設計目標驅動下,搭載DTU2.5出來i20的實際效果也確實是精準地完成了這一目標。

在實時性方面,DTU相比GPU也有非常出色的表現(xiàn),根據(jù)燧原科技展示的一個實時語意分析的對比demo展示,DTU的實時性能(吞吐量)是GPU的2.5倍以上,而實時的延時DTU卻只有GPU的一半不到。在這種典型的NLP——bert應用中,DTU展現(xiàn)了至少2.5倍于GPU的性能。


“訓推一體化”產品組合升級到第二代


此次全新二代云端推理產品的推出,使得燧原構建了T20+i20的第二代訓推產品組合。但僅僅有產品是不夠的,燧原科技還同步將訓推一體化的系統(tǒng)進行了增強,使得用戶可以方便使用T20和i20,完成訓練加推理一體化的部署。

據(jù)張亞東介紹,在TopsRider軟件系統(tǒng)里,從高層的圖優(yōu)化到中間的算子庫再到中間的編程模型,最后到底層的Runtime,四個階段中分別都實現(xiàn)了整個訓練和推理引擎的統(tǒng)一,使得用一套結構可以支持所有訓練和推理軟件棧。這樣統(tǒng)一的表達、統(tǒng)一的訓練推理的算子編程模型、統(tǒng)一的Runtime,讓T20+i20在訓練和推理棧上進行了很好的深度融合和充分泛化,也使得開發(fā)者在運用訓練和推理一體化的時候更加的高效、更加的精密和更加的兼容。

從“邃思”2.5和云燧i20推理卡的發(fā)布之后,燧原科技已經完成了二代產品的布局,未來的i30和T30/T31的產品也已經在研發(fā)過程中。

總結

燧原科技通過自研架構DPU,實現(xiàn)了比GPU更具性價比的AI推訓方案?!白龃笮酒⑵从部萍肌笔瞧湟恢狈钚械睦砟睿懊看a品比前代實現(xiàn)3倍能效提升、2倍性價比提升、軟件向后兼容”是其產品更新的目標。此次“邃思”2.5和云燧i20推理卡的發(fā)布,標志著其推訓一體的產品布局已經夯實,隨著AI市場的繼續(xù)發(fā)展,未來第三代產品相信也會如期而至。

聲明:該篇文章為本站原創(chuàng),未經授權不予轉載,侵權必究。
換一批
延伸閱讀

LED驅動電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。

關鍵字: 驅動電源

在工業(yè)自動化蓬勃發(fā)展的當下,工業(yè)電機作為核心動力設備,其驅動電源的性能直接關系到整個系統(tǒng)的穩(wěn)定性和可靠性。其中,反電動勢抑制與過流保護是驅動電源設計中至關重要的兩個環(huán)節(jié),集成化方案的設計成為提升電機驅動性能的關鍵。

關鍵字: 工業(yè)電機 驅動電源

LED 驅動電源作為 LED 照明系統(tǒng)的 “心臟”,其穩(wěn)定性直接決定了整個照明設備的使用壽命。然而,在實際應用中,LED 驅動電源易損壞的問題卻十分常見,不僅增加了維護成本,還影響了用戶體驗。要解決這一問題,需從設計、生...

關鍵字: 驅動電源 照明系統(tǒng) 散熱

根據(jù)LED驅動電源的公式,電感內電流波動大小和電感值成反比,輸出紋波和輸出電容值成反比。所以加大電感值和輸出電容值可以減小紋波。

關鍵字: LED 設計 驅動電源

電動汽車(EV)作為新能源汽車的重要代表,正逐漸成為全球汽車產業(yè)的重要發(fā)展方向。電動汽車的核心技術之一是電機驅動控制系統(tǒng),而絕緣柵雙極型晶體管(IGBT)作為電機驅動系統(tǒng)中的關鍵元件,其性能直接影響到電動汽車的動力性能和...

關鍵字: 電動汽車 新能源 驅動電源

在現(xiàn)代城市建設中,街道及停車場照明作為基礎設施的重要組成部分,其質量和效率直接關系到城市的公共安全、居民生活質量和能源利用效率。隨著科技的進步,高亮度白光發(fā)光二極管(LED)因其獨特的優(yōu)勢逐漸取代傳統(tǒng)光源,成為大功率區(qū)域...

關鍵字: 發(fā)光二極管 驅動電源 LED

LED通用照明設計工程師會遇到許多挑戰(zhàn),如功率密度、功率因數(shù)校正(PFC)、空間受限和可靠性等。

關鍵字: LED 驅動電源 功率因數(shù)校正

在LED照明技術日益普及的今天,LED驅動電源的電磁干擾(EMI)問題成為了一個不可忽視的挑戰(zhàn)。電磁干擾不僅會影響LED燈具的正常工作,還可能對周圍電子設備造成不利影響,甚至引發(fā)系統(tǒng)故障。因此,采取有效的硬件措施來解決L...

關鍵字: LED照明技術 電磁干擾 驅動電源

開關電源具有效率高的特性,而且開關電源的變壓器體積比串聯(lián)穩(wěn)壓型電源的要小得多,電源電路比較整潔,整機重量也有所下降,所以,現(xiàn)在的LED驅動電源

關鍵字: LED 驅動電源 開關電源

LED驅動電源是把電源供應轉換為特定的電壓電流以驅動LED發(fā)光的電壓轉換器,通常情況下:LED驅動電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。

關鍵字: LED 隧道燈 驅動電源
關閉