日本黄色一级经典视频|伊人久久精品视频|亚洲黄色色周成人视频九九九|av免费网址黄色小短片|黄色Av无码亚洲成年人|亚洲1区2区3区无码|真人黄片免费观看|无码一级小说欧美日免费三级|日韩中文字幕91在线看|精品久久久无码中文字幕边打电话

當前位置:首頁 > 單片機 > 單片機
[導讀]隨著DSP技術的不斷發(fā)展和完善,數(shù)字信號處理的應用范圍越來越廣泛。工控、計算機、通信和消費電子產(chǎn)品中,都會找到它的影子。

       1 引言

       隨著DSP技術的不斷發(fā)展和完善,數(shù)字信號處理的應用范圍越來越廣泛。工控、計算機、通信和消費電子產(chǎn)品中,都會找到它的影子。近年來,隨著多媒體通信的蓬勃發(fā)展,DSP也越來越多的應用在多媒體通信中,而在多媒體通信中DSP多用于語音壓縮和圖像處理等方面,而這些都需要巨大的計算量,在實時通信中一些低速DSP難以滿足要求,而使用高速DSP會大大提高成本,所以對代碼進行優(yōu)化是現(xiàn)在DSP開發(fā)中常用的一種方法。由于DSP的特殊結構,編譯器的編譯效率都比較低,難以將DSP計算能力全部發(fā)揮出來,所以就必須根據(jù)DSP的特殊結構和指令集代碼進行手工的匯編優(yōu)化

       本文結合筆者在TI公司的TMS320VC5402 DSP上的對G.729算法的優(yōu)化經(jīng)驗,提出一些優(yōu)化的方法和建議,而這些方法也適用其他54系列的DSP。 

       
2 芯片介紹

       TMS320C54X是TI公司于1996年推出的新一代定點數(shù)字處理器,它具有功耗小、高度并行等優(yōu)點,可以滿足電信等眾多領域的實時處理要求。54系列有很多不同型號的芯片,它們的結構都是一樣的,只是在接口和存儲器空間上有些不同。在54系列眾多DSP芯片中 TMS320VC5402是使用最廣泛的一種芯片,接下來將以TMS320VC5402為例介紹54系列DSP的性能特點:

 ● 運算速度最高達100MIPS
● 具有先進的多總線結構,三條16 位數(shù)據(jù)存儲器總線和一條程序存儲器總線
● 40位算術邏輯單元(ALU),包括一個40位桶形移位器和兩個40位累加器
● 一個17bit×17bit乘法器和40位專用加法器,允許16位帶/不帶符號乘法
● 8個輔助寄存器和一個軟件棧
● 內部采用改進的哈佛結構,程序空間和數(shù)據(jù)空間分開,允許同時取指令和取操作數(shù),并且允許在程序和數(shù)據(jù)空間相互傳送數(shù)據(jù)
● 最大64K×16bit外部數(shù)據(jù)空間,最大1M×16bit外部程序空間,4K×16bit片內ROM,16K×16bit片內RAM
● 內置可編程等待狀態(tài)發(fā)生器、鎖相環(huán)(PLL)時鐘發(fā)生器、兩個多通道緩沖串口、一個8位并行與外部處理器通信的HPI口、兩個16位定時器以及6通道DMA控制器
● 支持單指令循環(huán)和塊循環(huán),采用六級流水線,將一條指令執(zhí)行所需要的取指、譯碼、取操作數(shù)并執(zhí)行等幾個步驟同時完成,是指令周期降到最小適合算法的優(yōu)化

       3 代碼優(yōu)化

       對C代碼進行手工匯編優(yōu)化有三種方法:1.對照C代碼寫出匯編代碼,這種方法優(yōu)化的效率很高,但是開發(fā)難度很大特別是當代碼量很大,結構很復雜時優(yōu)化很容易出錯;2.先用編譯器產(chǎn)生匯編代碼,然后改寫匯編代碼,這種方法優(yōu)化的效率較低,因為框架被限定了,但是開發(fā)難度降低了,不容易出錯。
由于現(xiàn)在常用的一些音頻、圖像處理算法都是結構很復雜的程序,所以建議使用第二種優(yōu)化方法。

       3.1產(chǎn)生匯編代碼

       TI公司為DSP開發(fā)者提供一套編譯開發(fā)平臺叫CCS (Code Composer Studio),該工具提供了編譯器可以將C語言的程序編譯為DSP的匯編語言程序,然后鏈接生成可以在DSP上執(zhí)行的COFF格式的out文件。 

產(chǎn)生匯編代碼
           
       而CCS自身也提供優(yōu)化器可對C代碼進行優(yōu)化,并產(chǎn)生匯編語言程序,具體過程如圖1所示。

       CCS提供了4級的文件優(yōu)化方案,分別是O0、O1、O2、O3,以下具體說明
。
       (1) O0 寄存器級別

● 執(zhí)行控制流程簡化
● 用寄存器分配變量
● 執(zhí)行交替循環(huán)
● 排除未用的代碼
● 簡化公式和表述
● 擴大對內連函數(shù)的調用 

       (2) O1 局部級別

      執(zhí)行所有O0級別的優(yōu)化,并且:

● 執(zhí)行局部常量的傳播
● 排除未用的賦值
● 排除局部共用表達式

       (3) O2 函數(shù)級別

       執(zhí)行所有O1級別的優(yōu)化,并且:

● 執(zhí)行循環(huán)優(yōu)化
● 排除全局共用子表達式
● 排除全局不用的賦值
● 執(zhí)行打開循環(huán)

       (4) O3 文件級別

       執(zhí)行所有O1級別的優(yōu)化,并且:

● 排除未被調用的函數(shù)
● 簡化返回值沒被使用的函數(shù)
● 讓小函數(shù)變成內聯(lián)調用
● 保存函數(shù)說明,以便主函數(shù)被優(yōu)化時知道被調用 函數(shù)的屬性
● 識別文件級別的變量的特性

       在使用O3級別的優(yōu)化時,還可以使用別的選項執(zhí)行更細致的優(yōu)化

● OLN 得到標準庫函數(shù)的文件
● ONN 創(chuàng)造優(yōu)化信息文件
● PM 執(zhí)行程序級別優(yōu)化,編譯多個源文件

 
       而我們在做優(yōu)化時,選的是O2級別的優(yōu)化,因為使用O2級別優(yōu)化后產(chǎn)生的匯編文件帶有比較多的注釋信息,比較容易看懂程序,建議對程序不太熟和對匯編語言不太熟練的人使用。

       3.2手工匯編優(yōu)化

       因為匯編語言可讀性很差,并且代碼量很大,所以手工優(yōu)化工作量很大,并且容易出錯。為了確保優(yōu)化不出錯,我們就先制作一段測試序列即程序的輸入,然后運行程序對其進行處理,生成一段正確的結果序列,檢驗手工優(yōu)化是否正確就是用優(yōu)化過的程序對相同的測試序列進行處理,比較生成的結果序列和正確的結果序列是否一樣,一樣的話就代表優(yōu)化無誤。不過測試序列要比較長,因為有的錯誤開始不會顯現(xiàn)出來,只是慢慢累積,運行一段時間才會出現(xiàn)。

       接下來,就開始手工優(yōu)化的工作。下面就是我對手工優(yōu)化的一些經(jīng)驗。

       (1) 盡量少進行函數(shù)調用。因為進行函數(shù)調用的時候,要將PC壓棧,還要將一些寄存器壓棧,函數(shù)調用完后,還要出棧,這都是一些不必要的操作,所以一些小的函數(shù),就不調用,而是直接寫入主函數(shù)里,這樣可以就可以減少那些壓棧出棧的操作,提高速度。

       (2) 優(yōu)化循環(huán)時,盡量將一些操作放到循環(huán)外面去,減少操作的次數(shù)。例如一些賦值和初始化操作,可以提到循環(huán)外面去做,來提高速度。

       (3) 去除一些冗余的賦值。編譯器產(chǎn)生的代碼有很多賦值,經(jīng)常將一個值賦給寄存器,再賦給變量,這樣就產(chǎn)生了冗余。

       (4) 盡量使用RPT和RPTB來執(zhí)行循環(huán)操作。在編譯器產(chǎn)生的代碼里很多循環(huán)操作是通過條件判別來實現(xiàn)的,這樣就多了很多無用的判別代碼,而54x的DSP芯片就提供專門的循環(huán)指令:RPT和RPTB。RPT的功能就是循環(huán)執(zhí)行下一條指令,循環(huán)次數(shù)由RC寄存器的值決定,循環(huán)次數(shù)是RC寄存器的值加1,所以執(zhí)行循環(huán)前要將循環(huán)次數(shù)減1賦給RC寄存器;RPTB是塊循環(huán)指令,它的功能是循環(huán)執(zhí)行一段指令,它的循環(huán)次數(shù)由BRC寄存器決定,循環(huán)次數(shù)是BRC的寄存器的值加1,所以使用前需將循環(huán)次數(shù)減1賦給BRC寄存器。

       (5) 使用比較快的尋址方式。在數(shù)字信號處理里面,會對大量的數(shù)據(jù)進行大量的運算,如果使用比較快的尋址方式會大大減少指令周期。因為數(shù)據(jù)大多是順序存放,所以我們用寄存器去尋址,操作完后自加1而指向下個數(shù)據(jù),這樣尋址會減少很多指令周期。

       (6) 使用循環(huán)緩沖區(qū)。因為FFT,F(xiàn)IR等常用運算中都需要對數(shù)據(jù)進行移位操作,如果數(shù)據(jù)量大的話,程序花在數(shù)據(jù)移位上的開銷就很大了,如果使用循環(huán)緩沖區(qū)就可以不進行這些操作從而提高速度。

       (7) 使用一些專用指令。在54的指令系統(tǒng)里,有一些專用指令執(zhí)行一些特殊的操作,例如平方,F(xiàn)IR等,如果用其他指令代替需要多個指令周期,而使用專用指令值需要一個指令周期。 

       (8) 使用并行指令。因為DSP的流水線結構,可以讓一些指令同時運行,就產(chǎn)生了并行指令,使用并行指令會大大減少指令周期。

       (9) 將一些常用的程序和數(shù)據(jù),放在片內RAM運行。DSP芯片上一般都帶有RAM,而片內RAM的尋址速度比片外RAM快一至兩倍,所以將常用程序和數(shù)據(jù)放在片內,會大大提高運行速度。

       3.3優(yōu)化中常遇見的問題

       在手工優(yōu)化過程時會遇到很多問題,以下幾點比較常見。 

       (1) 對一些寄存器的設置。因為是手工優(yōu)化,所以對一些寄存器都要自己賦值,例如ST0、ST1和PMST等,不同的設置會導致運算結果的不一樣。其中一些用的比較多的位有SXM、OVM和FRCT。SXM是符號擴展位,如果SXM=0就不進行符號擴展,如果SXM=1就進行符號擴展(見圖2a)。OVM是溢出模式位,當發(fā)生溢出時,如果OVM=0溢出的結果就被送往目的寄存器,如果OVM=1就往目的寄存器送最大的正數(shù)(007FFFFFFFh)或最小的負數(shù)(FF80000000h)。FRCT是小數(shù)模式位,當FRCT=1時乘法的結果會左移一位(見圖2b)。以上3個標志位的置位和復位是由SSBX和 RSBX指令來完成的。 
                        
例子  

       (2) 注意流水線沖突。5402的芯片有一個6級深度的指令流水線,這6級流水線彼此是獨立的,在任何一個機器周期內,可以有1至6條不同的指令在工作。這6級流水線的功能分別是預取指、取指、譯碼、尋址、讀數(shù)和執(zhí)行。C5402多級流水線操作可以讓多條指令同時指令訪問CPU資源,如果多個流水線同時訪問到相同的資源,就可能發(fā)生流水線沖突,有些沖突可以由CPU通過延遲尋址的方法自動緩解,而有的沖突是不能防止的,需要由程序重新安排指令或插入空操作來解決。當用CCS編譯器對C程序進行編譯的時候,編譯器會自動加入NOP指令來解決流水線沖突,而進行手工優(yōu)化的時候,就要特別注意這個問題,大部分流水線沖突都是因為同時訪問到某些寄存器,只要根據(jù)等待周期表加入相應的NOP指令就可以解決。

例子                       

       (3) 對一些參數(shù)的保存。在手工優(yōu)化的過程中,我們會用某些寄存器來傳遞數(shù)據(jù),而在此過程中,如果調用了別的函數(shù),這些寄存器的值就有可能被改變,所以在調用這些函數(shù)的時候,要先將這些參數(shù)壓棧保存,調用完后再將其出?;謴?。還有就是某些標志位的保存,因為在調用函數(shù)的過程會改變這些狀態(tài)標志位,所以在調用完后要將其恢復。

       (4) 循環(huán)緩沖區(qū)地址分配問題。循環(huán)緩沖區(qū)的地址分配必須對齊,長度為R的緩沖區(qū)必須從N位地址的邊界開始(即循環(huán)緩沖區(qū)基地址的N個最低有效位必須為0),N 是滿足2N>R的最小的整數(shù)。例如,長度R=31的循環(huán)緩沖區(qū)必須從地址XXXX XXXX XXX0 00002(N=5,25>>31,該地址的最低5位為0)。

       (5) 內存泄漏問題。因為DSP使用的是哈佛結構,數(shù)據(jù)空間和程序空間是分開的,一般數(shù)據(jù)的操作不會影響到程序。但是DSP芯片上都帶有RAM,而這些空間數(shù)據(jù)和程序是共享的,所以對該部分的數(shù)據(jù)進行操作,如果有泄漏的話會改寫程序,導致程序跑飛。因此程序跑飛的話,就要考慮是否有內存泄漏。 

       4 結論

       以上經(jīng)驗和技巧均是筆者在實際的DSP工程中總結得出,實踐證明對實際開發(fā)非常有幫助。以筆者對G.729算法優(yōu)化為例,在優(yōu)化之前,G.729的運算量為1000MIPS,優(yōu)化后的運算量為30MIPS,提高了30多倍,可見優(yōu)化的效果很明顯。以上這些經(jīng)驗主要是針對TI公司的 54系列,但對于別的型號的DSP也有借鑒作用。 

       參考文獻

1 彭啟琮.TMS320C54X實用教程.電子科技大學出版社,2000
2 戴明楨.TMS320C54X數(shù)字信號處理器結構、原理及應用.TI DSPS UNIVERSITY,2000

本站聲明: 本文章由作者或相關機構授權發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內容真實性等。需要轉載請聯(lián)系該專欄作者,如若文章內容侵犯您的權益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

成都2022年10月19日 /美通社/ -- 近期,平安養(yǎng)老險積極籌備個人養(yǎng)老金的產(chǎn)品設計和系統(tǒng)開發(fā)工作,發(fā)展多樣化的養(yǎng)老金融產(chǎn)品,推動商業(yè)養(yǎng)老保險、個人養(yǎng)老金、專屬商業(yè)養(yǎng)老保險等產(chǎn)品供給。 搭養(yǎng)老政策東風 ...

關鍵字: 溫度 BSP 東風 大眾

廣東佛山2022年10月19日 /美通社/ -- 空間是人居生活的基礎單元,承載著生存與活動的最基本功能。而對于理想空間的解構意義卻在物理性容器之外,體現(xiàn)出人們對于空間和生活深層關系的思考,同時也塑造著人與空間的新型連接...

關鍵字: 溫度 BSP 智能化 進程

上海2022年10月19日 /美通社/ -- 10月17日晚間,安集科技披露業(yè)績預告。今年前三季度,公司預計實現(xiàn)營業(yè)收入7.54億元至8.33億元,同比增長60.24%至77.03%;歸母凈利潤預計為1.73億...

關鍵字: 電子 安集科技 BSP EPS

北京2022年10月19日 /美通社/ -- 10月18日,北京市經(jīng)濟和信息化局發(fā)布2022年度第一批北京市市級企業(yè)技術中心創(chuàng)建名單的通知,諾誠健華正式獲得"北京市企業(yè)技術中心"認定。 北京市企業(yè)技...

關鍵字: BSP ARMA COM 代碼

北京2022年10月18日 /美通社/ -- 10月14日,國際數(shù)據(jù)公司(IDC)發(fā)布《2022Q2中國軟件定義存儲及超融合市場研究報告》,報告顯示:2022年上半年浪潮超融合銷售額同比增長59.4%,近5倍于...

關鍵字: IDC BSP 數(shù)字化 數(shù)據(jù)中心

上海2022年10月18日 /美通社/ -- 2022年9月5日,是首都銀行集團成立60周年的紀念日。趁著首都銀行集團成立60周年與首都銀行(中國)在華深耕經(jīng)營12年的“大日子”,圍繞作為外資金融機構對在華戰(zhàn)略的構想和業(yè)...

關鍵字: 數(shù)字化 BSP 供應鏈 控制

東京2022年10月18日  /美通社/ -- NIPPON EXPRESS HOLDINGS株式會社(NIPPON EXPRESS HOLDINGS, INC.)旗下集團公司上海通運國際物流有限公司(Nipp...

關鍵字: 溫控 精密儀器 半導體制造 BSP

廣州2022年10月18日 /美通社/ -- 10月15日,第 132 屆中國進出口商品交易會("廣交會")于"云端"開幕。本屆廣交會上高新技術企業(yè)云集,展出的智能產(chǎn)品超過140,...

關鍵字: 中國智造 BSP 手機 CAN

要問機器人公司哪家強,波士頓動力絕對是其中的佼佼者。近來年該公司在機器人研發(fā)方面獲得的一些成果令人印象深刻,比如其開發(fā)的機器人會后空翻,自主爬樓梯等。這不,波士頓動力又發(fā)布了其機器人組團跳男團舞的新視頻,表演的機器人包括...

關鍵字: 機器人 BSP 工業(yè)機器人 現(xiàn)代汽車

南京2022年10月17日 /美通社/ -- 日前《2022第三屆中國高端家電品牌G50峰會》于浙江寧波落幕,來自兩百余名行業(yè)大咖、專家學者共同探討了在形勢依然嚴峻的當下,如何以科技創(chuàng)新、高端化轉型等手段,幫助...

關鍵字: LINK AI BSP 智能家電

單片機

21600 篇文章

關注

發(fā)布文章

編輯精選

技術子站

關閉