日本黄色一级经典视频|伊人久久精品视频|亚洲黄色色周成人视频九九九|av免费网址黄色小短片|黄色Av无码亚洲成年人|亚洲1区2区3区无码|真人黄片免费观看|无码一级小说欧美日免费三级|日韩中文字幕91在线看|精品久久久无码中文字幕边打电话

當(dāng)前位置:首頁 > 通信技術(shù) > 通信技術(shù)
[導(dǎo)讀]AVS(Audio Video Coding STandard)是由我國數(shù)字音視頻標(biāo)準(zhǔn)工作組制定的具有自主知識產(chǎn)權(quán)的第二代音視頻壓縮準(zhǔn)。AVS實行1 元專利費用的原則,相比其它音視頻編解碼標(biāo)準(zhǔn)具有編碼效率高、專利費用低、授權(quán)模式簡單等優(yōu)勢

AVS(Audio Video Coding STandard)是由我國數(shù)字音視頻標(biāo)準(zhǔn)工作組制定的具有自主知識產(chǎn)權(quán)的第二代音視頻壓縮準(zhǔn)。AVS實行1 元專利費用的原則,相比其它音視頻編解碼標(biāo)準(zhǔn)具有編碼效率高、專利費用低、授權(quán)模式簡單等優(yōu)勢。AVS解碼器的結(jié)構(gòu)復(fù)雜、運算量較大,要在嵌入式平臺上實現(xiàn)實時解碼具有較大難度。在對解碼器性能優(yōu)化的過程中可以依據(jù)使用平臺對其進行匯編指令集的優(yōu)化或者針對解碼器的關(guān)鍵算法模塊進行改良,以上方法對解碼器性能的提高均有一定作用,本文提出一種利用嵌入式平臺的L1P Cache高速緩沖功能實現(xiàn)處理器對程序代碼的高效率訪問的方法,從而達(dá)到提高AVS解碼器性能的目的。

  1 高速緩存Cache的應(yīng)用

  目前越來越多的編解碼算法采用DSP的方式實現(xiàn),隨著DSP芯片主頻的不斷攀升,存儲器的訪問速度日益成為系統(tǒng)性能提升的瓶頸。在現(xiàn)有的制造工藝下,片上存儲單元的增加將導(dǎo)致數(shù)據(jù)線負(fù)載電容的增加,影響到數(shù)據(jù)線上信號的開關(guān)時間,這意味著片上高速存儲單元的增加將是十分有限的。為了解決存儲器速度與CPU內(nèi)核速度不匹配的問題,高性能的CPU普遍采用高速緩存(Cache)機制。

  以TI的C64x DSP為例,存儲器系統(tǒng)由片內(nèi)存儲器和片外存儲器兩部分組成。其中,片內(nèi)存儲器采用兩級緩存結(jié)構(gòu),第1級L1距離DSP核最近,數(shù)據(jù)訪問速度最快,可以達(dá)到每秒600Mbyte,只能作為不能尋址的Cache使用,由相互獨立的L1P和L1D 組成。

  L1P Cache是處理器訪問程序代碼的高速緩沖存儲器,大小為16 kbyte,采用直接映射方式,每行大小32byte;L1D Cache是處理器訪問數(shù)據(jù)的高速緩沖存儲器,大小為16 kbyte,采用2路映射,每行大小為64byte。第2級L2是一個統(tǒng)一的程序/數(shù)據(jù)空間,可以整體作為SRAM映射到存儲空間,也可以作為Cache和SRAM按比例的一種組合。L2與L1之間的數(shù)據(jù)交互速率為每秒300 Mbyte,L2與SDRAM之間的數(shù)據(jù)交換速率為每秒100 Mbyte。片外存儲器是第3級,一般由SDRAM構(gòu)成。L1、L2和片外SDRAM構(gòu)成了整個存儲器系統(tǒng)的層次結(jié)構(gòu)。C64X的兩級緩存結(jié)構(gòu)若能運用恰當(dāng),將能極大地提高程序性能。

  根據(jù)圖1的三層次的存儲器系統(tǒng), C64X讀取程序代碼時,先查看1級緩存L1,若L1已緩存了所需代碼,則直接從L1讀取;若L1沒有該代碼的緩存,則訪問2級緩存L2;若L2也沒有,則通過EMIF接口訪問外部SDRAM,把所需代碼從外部SDRAM拷貝到L2緩存區(qū),再從L2緩存區(qū)拷貝到L1,最后由DSP內(nèi)核取得。

  

 

  圖1 三層次的存儲器系統(tǒng)(圖中B代表byte)

  研究表明,采用這種多級緩存的架構(gòu)可以達(dá)到采用完全片上存儲器結(jié)構(gòu)的系統(tǒng)約80%的執(zhí)行效率。本文致力于更深入地研究Cache的機制,對算法的數(shù)據(jù)結(jié)構(gòu)、處理流程以及程序結(jié)構(gòu)等進行優(yōu)化,以提高Cache的命中率,更有效地發(fā)揮Cache的作用,從而達(dá)到提高解碼器運行效率的目的。

  2 基于Cache的視頻解碼算法實現(xiàn)

  為了克服上述不足,本文通過更改視頻解碼算法的實現(xiàn)架構(gòu),充分利用Cache中L1P,減少CPU讀取程序代碼的缺失次數(shù),提高解碼程序的執(zhí)行效率。

  在具體實施過程中,本文根據(jù)L1P的容量和程序中各個功能單元代碼的大小,將圖2中的功能單元分為四個模塊,每個模塊代碼大小均小于16 kbyte,各模塊所包含的功能單元為:模塊A,讀入一個宏塊;模塊B,熵解碼、反掃描、反量化、反變換;模塊C,重建;模塊D,環(huán)路濾波。

  一個視頻宏塊只有遍歷這四個模塊之后才算最終完成解碼,各個模塊之間傳遞的中間數(shù)據(jù)如果放置在片外SDRAM中,勢必影響下一個模塊獲取數(shù)據(jù)的速度,如果數(shù)據(jù)放置在片內(nèi)SRAM中,由于片內(nèi)RAM空間有限不能存儲整幀數(shù)據(jù)。所以權(quán)衡考慮,每個模塊完成一個宏塊行(假設(shè)一幅圖像包含有M個宏塊行,每行有N個宏塊)的解碼后再交給下一個模塊處理,這樣既可以將中間數(shù)據(jù)放置在片內(nèi)又可以充分利用L1P,減少各個模塊之間的代碼沖刷,直到M 個宏塊行全部處理完畢,這樣就得到一幀數(shù)據(jù)的解碼圖像。

  

圖2 解碼算法流程

 

  如圖3所示,本文以一個宏塊行為處理單位,在進行解碼時,首先執(zhí)行模塊A將整個宏塊行讀入高圖3 處理一個宏塊行的新流程速緩存中,執(zhí)行完畢模塊A后,讀入模塊B的代碼,該部分代碼將會沖掉模塊A 的代碼。執(zhí)行完畢模塊B后,讀入模塊C的代碼,該部分代碼將會沖掉模塊B 的代碼。依此類推,當(dāng)執(zhí)行完畢模塊D后,再重復(fù)執(zhí)行以對下一個宏塊行進行解碼。

  

圖3 處理一個宏塊行的新流程

 

  每個模塊在執(zhí)行一個宏塊行的解碼過程中,會被反復(fù)執(zhí)行N 次,在此期間程序代碼保留在L1P中不被沖刷,直到第二個模塊執(zhí)行的時候第一個模塊的代碼才被沖刷。所以此方法解碼一個宏塊行才發(fā)生四次沖刷,完成一幀圖像的解碼共發(fā)生4 ×M 次代碼沖刷,較改進之前減少沖刷次數(shù)4 ×M ×(N - 1)。

  表1中的測試序列分辨率為720 ×576,調(diào)整結(jié)構(gòu)后解碼速率均有不同程度的提高,通過對統(tǒng)計結(jié)果的平均得知,效率提高20%左右。

  表1 實驗結(jié)果

  

 

  3 結(jié)論

  本文解碼器優(yōu)化充分利用了處理器的程序Cache功能,模塊分配方式依據(jù)Cache大小而定,針對不同處理器的不同Cache, 可以有不同的模塊劃分方式,只需要保證每個模塊代碼量小于程序Cache容量即可。處理器對于數(shù)據(jù)的讀取同樣可以采用類似方法,以達(dá)到充分利用數(shù)據(jù)Cache的目的。此方法不僅可以應(yīng)用于AVS解碼器,也可應(yīng)用于AVS編碼器,還可以應(yīng)用于與之擁有類似結(jié)構(gòu)的H. 264、MPEG、VC1等編解碼算法。

本站聲明: 本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

隨著在線會議、直播和游戲語音交流的普及,高質(zhì)量的音頻輸入設(shè)備變得越來越重要。為此,邊緣AI和智能音頻專家XMOS攜手其全球首家增值分銷商飛騰云科技,利用其集邊緣AI、DSP、MCU和靈活I(lǐng)/O于一顆芯片的xcore處理器...

關(guān)鍵字: AI DSP MCU

多DSP集群的實時信號處理系統(tǒng),通信拓?fù)涞膬?yōu)化直接決定任務(wù)調(diào)度效率與系統(tǒng)吞吐量。RapidIO與SRIO作為嵌入式領(lǐng)域的主流互連協(xié)議,其帶寬利用率差異與QoS配置策略對集群性能的影響尤為顯著。以無線基站、雷達(dá)陣列等典型應(yīng)...

關(guān)鍵字: DSP 通信拓?fù)鋬?yōu)化

隨著5G網(wǎng)絡(luò)普及與物聯(lián)網(wǎng)設(shè)備爆發(fā)式增長,邊緣計算正從概念驗證走向規(guī)?;渴稹?jù)IDC預(yù)測,2025年全球邊緣數(shù)據(jù)量將占總體數(shù)據(jù)量的50%,這對邊緣節(jié)點的實時處理能力提出嚴(yán)苛要求。在此背景下,AI加速器的DSP化趨勢與可重...

關(guān)鍵字: AI加速器 DSP

在工業(yè)控制領(lǐng)域,數(shù)字信號處理器(DSP)的性能直接決定了系統(tǒng)的實時控制能力和可靠性。德州儀器(TI)的C2000系列芯片憑借其卓越的采樣、控制和功率管理能力,長期以來在全球工業(yè)控制市場占據(jù)絕對領(lǐng)導(dǎo)地位,廣泛應(yīng)用于能源、電...

關(guān)鍵字: TI C2000 DSP 格見半導(dǎo)體 芯來 RISC-V 工控

2025年7月16日 – 專注于引入新品的全球電子元器件和工業(yè)自動化產(chǎn)品授權(quán)代理商貿(mào)澤電子 (Mouser Electronics) 持續(xù)供貨Texas Instruments (TI) 的新產(chǎn)品和解決方案。作為一家授權(quán)...

關(guān)鍵字: 線性穩(wěn)壓器 柵極驅(qū)動器 DSP

綜合性IP產(chǎn)品系列可支持H.264的基本/主流/高性能配置和H.265的主流/主流10/主流靜態(tài)圖像配置,提供了跨越不同應(yīng)用的無縫集成和無與倫比的靈活性

關(guān)鍵字: 編碼器 解碼器

在當(dāng)今數(shù)字化浪潮的推動下,數(shù)據(jù)流量呈爆炸式增長,數(shù)據(jù)中心、5G通信網(wǎng)絡(luò)以及云計算等領(lǐng)域?qū)Ω咚俟馔ㄐ诺男枨笥l(fā)迫切。800G光模塊作為高速光通信的關(guān)鍵組件,其性能直接影響著整個通信系統(tǒng)的傳輸效率和可靠性。數(shù)字信號處理(DS...

關(guān)鍵字: 800G DSP PAM4均衡算法

以氫燃料電池空壓機為研究對象 ,開發(fā)超高速永磁同步電機控制器 ,采用傳統(tǒng)的IGBT主功率器件 ,且為兩電平主回 路結(jié)構(gòu)形式 ,通過改進的V/F控制算法 ,完成了控制器的設(shè)計。搭建了試驗平臺進行測試 ,結(jié)果表明 ,控制器能...

關(guān)鍵字: 超高速永磁同步電機 V/F控制 DSP

中國深圳,2025年5月——全球領(lǐng)先的邊緣AI和智能音頻解決方案提供商XMOS宣布:將于5月27-30日亮相第23屆廣州國際專業(yè)燈光、音響展覽會(prolight + sound Guangzhou,以下簡稱“廣州展”,...

關(guān)鍵字: 智能音頻 邊緣AI 解碼器

醫(yī)療設(shè)備智能化進程,數(shù)字信號處理器(DSP)作為核心計算單元,承擔(dān)著實時處理生物電信號、醫(yī)學(xué)影像等敏感數(shù)據(jù)的重任。然而,隨著醫(yī)療設(shè)備與網(wǎng)絡(luò)互聯(lián)的深化,數(shù)據(jù)泄露風(fēng)險顯著增加。美國《健康保險流通與責(zé)任法案》(HIPAA)明確...

關(guān)鍵字: 醫(yī)療設(shè)備 DSP
關(guān)閉