日本黄色一级经典视频|伊人久久精品视频|亚洲黄色色周成人视频九九九|av免费网址黄色小短片|黄色Av无码亚洲成年人|亚洲1区2区3区无码|真人黄片免费观看|无码一级小说欧美日免费三级|日韩中文字幕91在线看|精品久久久无码中文字幕边打电话

當(dāng)前位置:首頁 > 原創(chuàng) > 劉巖軒
[導(dǎo)讀]強(qiáng)化端側(cè)AI體驗(yàn),DSP需要有更高效的結(jié)構(gòu)。Cadence的DNA 100和HiFi 5分別面向視頻和語音識別的NN算法加速,通過稀疏計(jì)算引擎來實(shí)現(xiàn)高效高性能。

想要實(shí)現(xiàn)更有效率的人工智能體驗(yàn),很多工作都需要在設(shè)備端直接完成。在視覺識別和語音助手這兩大熱門應(yīng)用中,常常都會見到DSP的身影;而Cadece的Tensilica系列DSP產(chǎn)品,一直受到華為等諸多廠商的喜愛。近日,Cadence在北京召開了發(fā)布會,發(fā)布了全新的DNA100和HiFi5的產(chǎn)品。作為Vision系列和HiFi系列的最新產(chǎn)品,有何高明之處?Cadence公司IP事業(yè)部Tensilica資深產(chǎn)品總監(jiān)Lazaar Louis先生和IP事業(yè)部Tensilica技術(shù)營銷總監(jiān)Yipeng Liu進(jìn)行了詳細(xì)的講解。

DNA100: 通過稀疏計(jì)算引擎實(shí)現(xiàn)高效人工智能結(jié)構(gòu)

Cadence最新發(fā)布的DNA 100是其首款神經(jīng)網(wǎng)絡(luò)加速器IP,作為端側(cè)的運(yùn)算單元,功耗仍然是客戶非常敏感的指標(biāo);從0.5到數(shù)百TMAC均可實(shí)現(xiàn)高性能和高能效。換言之,不論是電池驅(qū)動(dòng)的小型IoT設(shè)備,還是譬如手機(jī)等多核處理器中,DNA 100均可發(fā)揮巨大作用。

相較其它采用相似陣列尺寸大小的乘法累加運(yùn)輸商解決方案,DNA 100的性能提升高達(dá)4.7倍,每瓦性能提高2.3倍。據(jù)悉,這種性能提升和功耗的降低得益于其采用了稀疏計(jì)算引擎。“神經(jīng)網(wǎng)絡(luò)的特征在于權(quán)重和激活函數(shù)的固有稀疏度,加載和乘以零會早晨其它處理器不必要的MAC消耗。DNA 100移除了這兩項(xiàng)任務(wù),利用稀疏度提高能效并降低計(jì)算量。神經(jīng)網(wǎng)絡(luò)再訓(xùn)練有助于提高網(wǎng)絡(luò)的稀疏度,并通過DNA 100處理器的稀疏計(jì)算引擎實(shí)現(xiàn)最高性能。DNA 100處理器能夠利用更小的陣列實(shí)現(xiàn)最大吞吐量。作為例證,4K MAC配置環(huán)境下,ResNet 50推理性能預(yù)計(jì)能實(shí)現(xiàn)每秒高達(dá)2550幀(fps)和3.4TMAC / W(在16 nm工藝)。”

如何在資源有限的邊緣端實(shí)現(xiàn)高效AI? Cadence發(fā)布DNA 100和HiFi 5兩款全新DSP IP

稀疏計(jì)算引擎專門處理卷積階段以及完全連接的分類層的任務(wù)。 單個(gè)稀疏計(jì)算引擎可以在256,512或1024 MAC中擴(kuò)展,之后IP通過添加更多引擎進(jìn)行擴(kuò)展,上圖中可見最多可以達(dá)到4個(gè)引擎。 這意味著最大配置的單個(gè)DNA 100硬件塊最多包含4096個(gè)MAC。

帶寬是限制NN硬件效率的一個(gè)關(guān)鍵瓶頸,因此壓縮帶寬是實(shí)現(xiàn)最佳性能必備條件。就原始帶寬而言,DNA 100提供了從1到4 AXI 128或256位接口,這意味著在最寬的配置中,最高可達(dá)1024位總線寬度。

如何在資源有限的邊緣端實(shí)現(xiàn)高效AI? Cadence發(fā)布DNA 100和HiFi 5兩款全新DSP IP

Cadence仍然提供DNA 100和Vision Q6產(chǎn)品的耦合使用方案,可以在執(zhí)行某些特定NN運(yùn)算時(shí)實(shí)現(xiàn)更高效率。這種方案相較之前的P6+C5的方案有了很大提升,客戶也可以進(jìn)行深度的定制。

如何在資源有限的邊緣端實(shí)現(xiàn)高效AI? Cadence發(fā)布DNA 100和HiFi 5兩款全新DSP IP

在軟件方面,Cadence提供完整的軟件堆棧和神經(jīng)網(wǎng)絡(luò)編譯器,以方便客戶充分利用硬件,包括網(wǎng)絡(luò)分析儀和優(yōu)化器以及所需的設(shè)備驅(qū)動(dòng)程序。Cadence最近還宣布將支持Facebook的Glow編譯器——一種跨硬件平臺的機(jī)器學(xué)習(xí)編譯器。

HiFi5:實(shí)現(xiàn)設(shè)備端語音UI

隨著家庭數(shù)字語音助手的興起,HiFi 4得到了大量的應(yīng)用,而數(shù)字語音助手的下一個(gè)升級體驗(yàn)是實(shí)現(xiàn)更好的語音UI,這需要更好的原場處理算法和基于NN的語音識別,HiFi5將幫助客戶實(shí)現(xiàn)這一設(shè)計(jì)。重點(diǎn)仍然是,能在端側(cè)完成的 ,要實(shí)現(xiàn)快速反饋,這樣才能帶來更好的用戶體驗(yàn)。

高性能的DSP核是語音UI實(shí)現(xiàn)的關(guān)鍵器件,另外,還需要耕地精度的NN內(nèi)存權(quán)重,以減少內(nèi)存大小和帶寬需求;這兩個(gè)指標(biāo)在端側(cè)同樣是非常敏感的資源,如此這般才能構(gòu)建節(jié)能高效的邊緣語音交互設(shè)備。

如何在資源有限的邊緣端實(shí)現(xiàn)高效AI? Cadence發(fā)布DNA 100和HiFi 5兩款全新DSP IP

HiFi 5可根據(jù)其可使用的執(zhí)行單元和內(nèi)存控制器進(jìn)行配置。 為了支持波束成形等任務(wù),DSP管道能夠使用浮點(diǎn)數(shù)。而在DNN的工作任務(wù)中,DSP的管道可以由浮點(diǎn)單元轉(zhuǎn)為專注于低分辨率定點(diǎn)運(yùn)算,降低到多個(gè)8x8并行乘法;或者可以在沒有用于傳統(tǒng)音頻處理的DNN聚焦模式的情況下部署DSP。同樣的,因?yàn)椴捎昧似鋵S械南∈栌?jì)算引擎,因此可以減少零權(quán)重操作以及壓縮帶寬,從而實(shí)現(xiàn)更高效能。此特性已經(jīng)在DNA 100的介紹中提及,此處不再贅述。

如何在資源有限的邊緣端實(shí)現(xiàn)高效AI? Cadence發(fā)布DNA 100和HiFi 5兩款全新DSP IP

作為HiFi 4的升級產(chǎn)品,HiFi 5的預(yù)處理和后處理的MAC性能提高2倍;神經(jīng)網(wǎng)絡(luò)處理MAC性能提高4倍;而且提供專門優(yōu)化的函數(shù)庫,可以與主流機(jī)器學(xué)習(xí)框架集成;兼容HiFi產(chǎn)品線300多個(gè)語音增強(qiáng)軟件包。

據(jù)悉,首批客戶之一是Ambiq Micro,想必大家并不陌生,這是一家專門構(gòu)建電池驅(qū)動(dòng)音頻控制器的廠商。

 

未來端側(cè)的高性能推理的工作將越來越多,比如汽車的自動(dòng)駕駛、語音UI、物聯(lián)網(wǎng)邊緣的AI處理以及手機(jī)AI強(qiáng)化。如何在有限的資源條件下,實(shí)現(xiàn)實(shí)時(shí)高效的AI處理,這是端側(cè)需要解決的問題。而這一問題的解決,Cadence的DNA 100和HiFi 5無疑都是最佳助手。

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

慕尼黑2025年9月11日 /美通社/ -- 高端智能電動(dòng)汽車品牌問界(AITO)在2025年德國國際汽車及智慧出行博覽會(IAA MOBILITY)上,正式發(fā)布了其最新全球產(chǎn)品陣容——專為中東市場深度本地化打造的AIT...

關(guān)鍵字: AI 智能駕駛 測試 生態(tài)系統(tǒng)

香港2025年 9月12日 /美通社/ -- 全球領(lǐng)先的互聯(lián)網(wǎng)社區(qū)創(chuàng)建者 - 網(wǎng)龍網(wǎng)絡(luò)控股有限公司 ("網(wǎng)龍"或"本公司",香港交易所股票代碼:777)欣然宣布,其子公司My...

關(guān)鍵字: AI 遠(yuǎn)程控制 控制技術(shù) BSP

AI賦能制造,黃埔匯聚全球新機(jī)遇 廣州2025年9月11日 /美通社/ -- 2025年9月10日,由廣州開發(fā)區(qū)投資集團(tuán)有限公司、廣州開發(fā)區(qū)黃埔區(qū)具身智能機(jī)器人產(chǎn)業(yè)發(fā)展促進(jìn)會、華南美國商會共同主辦的"2025...

關(guān)鍵字: 智能制造 AI 人工智能 供應(yīng)鏈

天津2025年9月11日 /美通社/ -- 國際能源署(IEA)數(shù)據(jù)顯示,2024 年全球數(shù)據(jù)中心電力消耗達(dá) 415 太瓦時(shí),占全球總用電量的 1.5%,預(yù)計(jì)到 2030 年,這一數(shù)字將飆升至 945 太瓦時(shí),近乎翻番,...

關(guān)鍵字: 模型 AI 數(shù)據(jù)中心 BSP

深圳2025年9月11日 /美通社/ -- 近日,德國柏林國際電子消費(fèi)品展覽會(簡稱IFA)期間,國際公認(rèn)的測試、檢驗(yàn)和認(rèn)證機(jī)構(gòu)SGS為極殼(Hypershell) 全球首款戶外動(dòng)力外骨骼產(chǎn)品Hypershell X 系...

關(guān)鍵字: SHELL RS AI SI

近日,一則關(guān)于 AI 算力領(lǐng)域的消息引發(fā)行業(yè)震動(dòng)!據(jù)科技網(wǎng)站 The Information 援引四位知情人士爆料,中國科技巨頭阿里巴巴與百度已正式將自研芯片應(yīng)用于 AI 大模型訓(xùn)練,打破了此前對英偉達(dá)芯片的單一依賴。

關(guān)鍵字: AI 算力 阿里 百度 芯片 AI模型

2025年9月11日,中國上海 — 思特威(上海)電子科技股份有限公司(股票簡稱:思特威,股票代碼:688213)近日宣布,全新推出5000萬像素0.7μm像素尺寸手機(jī)應(yīng)用CMOS圖像傳感器——SC535XS。SC535...

關(guān)鍵字: CMOS圖像傳感器 手機(jī) AI

2025年上半年,中國電子行業(yè)在 AI 與智能制造雙輪驅(qū)動(dòng)下活力迸發(fā),規(guī)模以上電子信息制造業(yè)增加值同比增長11.1%,出口、AI 終端創(chuàng)新與國產(chǎn)軟硬件生態(tài)均呈向好態(tài)勢。作為感知層核心的傳感器,正成為技術(shù)變革與產(chǎn)業(yè)躍遷的關(guān)...

關(guān)鍵字: AI 智能制造 傳感器

2025 IPC CEMAC電子制造年會將于9月25日至26日在上海舉辦。年會以“Shaping a Sustainable Future(共塑可持續(xù)未來)”為主題,匯聚國內(nèi)外專家學(xué)者、產(chǎn)業(yè)領(lǐng)袖與制造精英,圍繞先進(jìn)封裝、...

關(guān)鍵字: PCB 電子制造 AI
關(guān)閉