日本黄色一级经典视频|伊人久久精品视频|亚洲黄色色周成人视频九九九|av免费网址黄色小短片|黄色Av无码亚洲成年人|亚洲1区2区3区无码|真人黄片免费观看|无码一级小说欧美日免费三级|日韩中文字幕91在线看|精品久久久无码中文字幕边打电话

當前位置:首頁 > 芯聞號 > 充電吧
[導讀]6月23日消息,鯤云科技今天正式發(fā)布全球首款數(shù)據(jù)流AI芯片CAISA,該芯片定位于高性能AI推理,目前已完成量產(chǎn)。 據(jù)介紹,鯤云通過自主研發(fā)的數(shù)據(jù)流技術在芯片實測算力上實現(xiàn)了技術突破,較同類產(chǎn)品在芯片

6月23日消息,鯤云科技今天正式發(fā)布全球首款數(shù)據(jù)流AI芯片CAISA,該芯片定位于高性能AI推理,目前已完成量產(chǎn)。

據(jù)介紹,鯤云通過自主研發(fā)的數(shù)據(jù)流技術在芯片實測算力上實現(xiàn)了技術突破,較同類產(chǎn)品在芯片利用率上提升了11.6倍。第三方測試數(shù)據(jù)顯示僅用1/3的峰值算力,CAISA芯片可以實現(xiàn)英偉達同類產(chǎn)品最高3.91倍的實測性能。

鯤云科技成立于2016年,聚焦于基于數(shù)據(jù)流架構的定制AI計算引擎,其自主研發(fā)的CAISA架構已有近三十年技術積累。鯤云科技目前已經(jīng)完成了天使輪,A輪及A+輪融資,并在深圳、山東、倫敦研發(fā)中心。

現(xiàn)在,具體來看看這款數(shù)據(jù)流AI芯片CAISA的性能表現(xiàn)。

超高芯片利用率,定制數(shù)據(jù)流芯片架構完成3.0升級

此次發(fā)布的CAISA芯片采用鯤云自研的定制數(shù)據(jù)流芯片架構CAISA 3.0,相較于上一代芯片架構,CAISA3.0在架構效率和實測性能方面有了大幅的提升,并在算子支持上更加通用,支持絕大多數(shù)神經(jīng)網(wǎng)絡模型快速實現(xiàn)檢測、分類和語義分割部署。CAISA3.0在多引擎支持上提供了4倍更高的并行度選擇,架構的可拓展性大大提高,在AI芯片內(nèi),每一個CAISA都可以同時處理AI工作負載,進一步提升了CAISA架構的性能,在峰值算力提升6倍的同時保持了高達95.4%的芯片利用率,實測性能線性提升。同時新一代CAISA架構對編譯器RainBuilder的支持更加友好,軟硬件協(xié)作進一步優(yōu)化,在系統(tǒng)級別上為用戶提供更好的端到端性能。

CAISA3.0架構圖

CAISA3.0架構繼續(xù)保持在數(shù)據(jù)流技術路線的全球領先地位,指令集架構采用馮諾依曼計算方式,通過指令執(zhí)行次序控制計算順序,并通過分離數(shù)據(jù)搬運與數(shù)據(jù)計算提供計算通用性。CAISA架構依托數(shù)據(jù)流流動次序控制計算次序,采用計算流和數(shù)據(jù)流重疊運行方式消除空閑計算單元,并采用動態(tài)配置方式保證對于人工智能算法的通用支持,突破指令集技術對于芯片算力的限制。此次升級,CAISA架構解決了數(shù)據(jù)流架構作為人工智能計算平臺的三大核心挑戰(zhàn):

高算力性價比:在保持計算正確前提下,通過不斷壓縮每個空閑時鐘推高芯片實測性能以接近芯片物理極限,讓芯片內(nèi)的每個時鐘、每個計算單元都在執(zhí)行有效計算; 高架構通用性:在保證每個算法在CAISA上運行能夠?qū)崿F(xiàn)高芯片利用率的同時,CAISA3.0架構通用支持所有主流CNN算法; 高軟件易用性:通過專為CAISA定制的編譯工具鏈實現(xiàn)算法端到端自動部署,用戶無需底層數(shù)據(jù)流架構背景知識,簡單兩步即可實現(xiàn)算法遷移和部署,降低使用門檻。

具體來講,鯤云CAISA3.0架構的三大技術突破主要通過以下的技術方式實現(xiàn):

高算力性價比:時鐘級準確的計算

CAISA3.0架構由數(shù)據(jù)流來驅(qū)動計算過程,無指令操作,可以實現(xiàn)時鐘級準確的計算,最大限度的減少硬件計算資源的空閑時間。CAISA3.0架構通過數(shù)據(jù)計算與數(shù)據(jù)流動的重疊,壓縮計算資源的每一個空閑時鐘;通過算力資源的動態(tài)平衡,消除流水線的性能瓶頸;通過數(shù)據(jù)流的時空映射,最大化復用芯片內(nèi)的數(shù)據(jù)流帶寬,減少對外部存儲帶寬的需求。上述設計使CNN算法的計算數(shù)據(jù)在CAISA3.0內(nèi)可以實現(xiàn)不間斷的持續(xù)運算,最高可實現(xiàn)95.4%的芯片利用率,在同等峰值算力條件下,可獲得相對于GPU 3倍以上的實測算力,從而為用戶提供更高的算力性價比。

高架構通用性:流水線動態(tài)重組

CAISA3.0架構可以通過流水線動態(tài)重組實現(xiàn)對不同深度學習算法的高性能支持。通過CAISA架構層的數(shù)據(jù)流引擎、全局數(shù)據(jù)流網(wǎng)、全局數(shù)據(jù)流緩存,以及數(shù)據(jù)流引擎內(nèi)部的人工智能算子模塊、局部數(shù)據(jù)流網(wǎng)、局部數(shù)據(jù)流緩存的分層設計,在數(shù)據(jù)流配置器控制下,CAISA架構中的數(shù)據(jù)流連接關系和運行狀態(tài)都可以被自動化動態(tài)配置,從而生成面向不同AI算法的高性能定制化流水線。在保證高性能的前提下,支持用戶使用基于CAISA3.0架構的計算平臺實現(xiàn)如目標檢測、分類及語義分割等廣泛的人工智能算法應用。

高軟件易用性:算法端到端自動化部署

RainBuilder編譯工具鏈

專為CAISA3.0架構配備的RainBuilder編譯工具鏈支持從算法到芯片的端到端自動化部署,用戶和開發(fā)者無需了解架構的底層硬件配置,簡單兩步即可實現(xiàn)算法快速遷移和部署。RainBuilder編譯器可自動提取主流AI開發(fā)框架(TensorFlow,Caffe,Pytorch,ONNX等)中開發(fā)的深度學習算法的網(wǎng)絡結構和參數(shù)信息,并面向CAISA結構進行優(yōu)化;工具鏈中的運行時(Runtime)和驅(qū)動(Driver)模塊負責硬件管理并為用戶提供標準的API接口,運行時可以基于精確的CAISA性能模型,實現(xiàn)算法向CAISA架構的自動化映射,同時提供可以被高級語言直接調(diào)用的API接口;最底層的驅(qū)動可以實現(xiàn)對用戶透明的硬件控制。RainBuilder工具鏈使用簡單,部署方便,通用性強,可以讓用戶快速和低成本的部署和遷移已有算法到CAISA硬件平臺上。

首款量產(chǎn)數(shù)據(jù)流AI芯片,CAISA帶來AI芯片研發(fā)新方向

CAISA-定制數(shù)據(jù)流AI芯片

作為全球首款采用數(shù)據(jù)流技術的AI芯片,CAISA搭載了四個CAISA3.0引擎,具有超過1.6萬個MAC(乘累加)單元,峰值性能可達10.9TOPs。該芯片采用28nm工藝,通過PCIe3.0×4接口與主處理器通信,同時具有雙DDR通道,可為每個CAISA引擎提供超過340Gbps的帶寬。

CAISA芯片架構圖

作為一款面向邊緣和云端推理的人工智能芯片,CAISA可實現(xiàn)最高95.4%的芯片利用率,為客戶提供更高的算力性價比。CAISA芯片具有良好的通用性,可支持所有常用AI算子,通過數(shù)據(jù)流網(wǎng)絡中算子的不同配置和組合,CAISA芯片可支持絕大多數(shù)的CNN算法。針對CAISA芯片,鯤云提供RainBuilder3.0工具鏈,可實現(xiàn)推理模型在芯片上的端到端部署,使軟件工程師可以方便的完成CAISA芯片在AI應用系統(tǒng)中的集成。

鯤云科技發(fā)布數(shù)據(jù)流CAISA芯片

高算力性價比的AI計算平臺星空加速卡系列產(chǎn)品發(fā)布

發(fā)布會上,鯤云科技創(chuàng)始人和CEO牛昕宇還發(fā)布了基于CAISA芯片的星空系列邊緣和數(shù)據(jù)中心計算平臺,X3加速卡和X9加速卡,并公布了由人工智能產(chǎn)業(yè)技術聯(lián)盟(AIIA)測試的包括ResNet-50, YOLO v3等在內(nèi)的主流深度學習網(wǎng)絡的實測性能。

星空X3加速卡發(fā)布

星空X3加速卡是搭載單顆CAISA 芯片的數(shù)據(jù)流架構深度學習推斷計算平臺,為工業(yè)級半高半長單槽規(guī)格的PCIe板卡。得益于其輕量化的規(guī)格特點,X3加速卡可以與不同類型的計算機設備進行適配,包括個人電腦、工業(yè)計算機、網(wǎng)絡視頻錄像機、工作站、服務器等,滿足邊緣和高性能場景中的AI計算需求。相較于英偉達邊緣端旗艦產(chǎn)品Xavier,X3可實現(xiàn)1.48-4.12倍的實測性能提升。

*模型參考:https://github.com/pushyami/yolov3-caffe/blob/master/deploy.prototxt

星空X9加速卡發(fā)布

星空X9加速卡為搭載4CAISA 芯片的深度學習推斷板卡,峰值性能43.6TOPS,主要滿足高性能場景下的AI計算需求。同英偉達旗艦產(chǎn)品T4相對,X9在ResNet-50, YOLO v3等模型上的芯片利用率提升2.84-11.64倍。在實測性能方面,X9在ResNet50可達5240FPS,與T4性能接近,在YOLO v3、UNet Industrial等檢測分割網(wǎng)絡,實測性能相較T4有1.83-3.91倍性能提升。在達到最優(yōu)實測性能下,X9處理延時相比于T4降低1.83-32倍。實測性能以及處理延時的大幅領先,讓數(shù)據(jù)流架構為AI芯片的發(fā)展提供了提升峰值性能之外的另一條技術路線。

*模型參考:https://github.com/pushyami/yolov3-caffe/blob/master/deploy.prototxt

鯤云科技通過CAISA數(shù)據(jù)流架構提高芯片利用率,同樣的實測性能,對芯片峰值算力的要求可大幅降低3-10倍,從而降低芯片的制造成本,為客戶提供更高的算力性價比。目前星空X3加速卡已經(jīng)實現(xiàn)量產(chǎn),星空X9加速卡將于今年8月推出市場。鯤云科技成為國內(nèi)首家在發(fā)布會現(xiàn)場披露Benchmark的AI芯片公司。

商業(yè)落地先行,鯤云加速卡實現(xiàn)多領域規(guī)模落地

作為技術驅(qū)動的AI芯片公司,鯤云科技自成立以來一直注重商業(yè)落地,目前鯤云科技已與多家行業(yè)巨頭達成戰(zhàn)略合作,成為英特爾全球旗艦FPGA合作伙伴,在技術培訓、營銷推廣以及應用部署等方面進行合作;與浪潮、戴爾達成戰(zhàn)略簽約,在AI計算加速方面開展深入合作;與山東產(chǎn)業(yè)技術研究院共建山東產(chǎn)研鯤云人工智能研究院,推進人工智能芯片及應用技術的規(guī)?;涞?。明星產(chǎn)品“星空”加速卡已在電力、教育、航空航天、智能制造、智慧城市等領域落地。自2016年成立至今,鯤云科技已經(jīng)完成了天使輪,Pre-A輪及A輪融資,設有深圳、山東、倫敦研發(fā)中心。2018年成立人工智能創(chuàng)新應用研究院,定位于建立人工智能產(chǎn)業(yè)化技術平臺,支持人工智能最新技術在各垂直領域快速實際落地,啟動鯤云高校計劃,開展人工智能課程培訓和科研合作。除與Intel合作進行人工智能課程培訓外,鯤云人工智能應用創(chuàng)新研究院已同帝國理工學院、哈爾濱工業(yè)大學、北京航空航天大學、天津大學、香港城市大學等成立聯(lián)合實驗室,在定制計算、AI芯片安全、工業(yè)智能等領域開展前沿研究合作。

本站聲明: 本文章由作者或相關機構授權發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

LED驅(qū)動電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。

關鍵字: 驅(qū)動電源

在工業(yè)自動化蓬勃發(fā)展的當下,工業(yè)電機作為核心動力設備,其驅(qū)動電源的性能直接關系到整個系統(tǒng)的穩(wěn)定性和可靠性。其中,反電動勢抑制與過流保護是驅(qū)動電源設計中至關重要的兩個環(huán)節(jié),集成化方案的設計成為提升電機驅(qū)動性能的關鍵。

關鍵字: 工業(yè)電機 驅(qū)動電源

LED 驅(qū)動電源作為 LED 照明系統(tǒng)的 “心臟”,其穩(wěn)定性直接決定了整個照明設備的使用壽命。然而,在實際應用中,LED 驅(qū)動電源易損壞的問題卻十分常見,不僅增加了維護成本,還影響了用戶體驗。要解決這一問題,需從設計、生...

關鍵字: 驅(qū)動電源 照明系統(tǒng) 散熱

根據(jù)LED驅(qū)動電源的公式,電感內(nèi)電流波動大小和電感值成反比,輸出紋波和輸出電容值成反比。所以加大電感值和輸出電容值可以減小紋波。

關鍵字: LED 設計 驅(qū)動電源

電動汽車(EV)作為新能源汽車的重要代表,正逐漸成為全球汽車產(chǎn)業(yè)的重要發(fā)展方向。電動汽車的核心技術之一是電機驅(qū)動控制系統(tǒng),而絕緣柵雙極型晶體管(IGBT)作為電機驅(qū)動系統(tǒng)中的關鍵元件,其性能直接影響到電動汽車的動力性能和...

關鍵字: 電動汽車 新能源 驅(qū)動電源

在現(xiàn)代城市建設中,街道及停車場照明作為基礎設施的重要組成部分,其質(zhì)量和效率直接關系到城市的公共安全、居民生活質(zhì)量和能源利用效率。隨著科技的進步,高亮度白光發(fā)光二極管(LED)因其獨特的優(yōu)勢逐漸取代傳統(tǒng)光源,成為大功率區(qū)域...

關鍵字: 發(fā)光二極管 驅(qū)動電源 LED

LED通用照明設計工程師會遇到許多挑戰(zhàn),如功率密度、功率因數(shù)校正(PFC)、空間受限和可靠性等。

關鍵字: LED 驅(qū)動電源 功率因數(shù)校正

在LED照明技術日益普及的今天,LED驅(qū)動電源的電磁干擾(EMI)問題成為了一個不可忽視的挑戰(zhàn)。電磁干擾不僅會影響LED燈具的正常工作,還可能對周圍電子設備造成不利影響,甚至引發(fā)系統(tǒng)故障。因此,采取有效的硬件措施來解決L...

關鍵字: LED照明技術 電磁干擾 驅(qū)動電源

開關電源具有效率高的特性,而且開關電源的變壓器體積比串聯(lián)穩(wěn)壓型電源的要小得多,電源電路比較整潔,整機重量也有所下降,所以,現(xiàn)在的LED驅(qū)動電源

關鍵字: LED 驅(qū)動電源 開關電源

LED驅(qū)動電源是把電源供應轉換為特定的電壓電流以驅(qū)動LED發(fā)光的電壓轉換器,通常情況下:LED驅(qū)動電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。

關鍵字: LED 隧道燈 驅(qū)動電源
關閉