日本黄色一级经典视频|伊人久久精品视频|亚洲黄色色周成人视频九九九|av免费网址黄色小短片|黄色Av无码亚洲成年人|亚洲1区2区3区无码|真人黄片免费观看|无码一级小说欧美日免费三级|日韩中文字幕91在线看|精品久久久无码中文字幕边打电话

當(dāng)前位置:首頁(yè) > 嵌入式 > 嵌入式硬件
[導(dǎo)讀]定義一臺(tái)抽象機(jī)器,用于描述 Mali GPU和驅(qū)動(dòng)程序軟件對(duì)應(yīng)用程序可見(jiàn)的行為。此機(jī)器的用意是為開(kāi)發(fā)人員提供 OpenGL ES API 下有趣行為的一個(gè)心智模型,而這反過(guò)來(lái)也可用于解

定義一臺(tái)抽象機(jī)器,用于描述 Mali GPU和驅(qū)動(dòng)程序軟件對(duì)應(yīng)用程序可見(jiàn)的行為。此機(jī)器的用意是為開(kāi)發(fā)人員提供 OpenGL ES API 下有趣行為的一個(gè)心智模型,而這反過(guò)來(lái)也可用于解釋影響其應(yīng)用程序性能的問(wèn)題。我在本系列后面幾篇博文中繼續(xù)使用這一模型,探討開(kāi)發(fā)人員在開(kāi)發(fā)圖形應(yīng)用程序時(shí)常常遇到的一些性能缺口。

這篇博文將繼續(xù)開(kāi)發(fā)這臺(tái)抽象機(jī)器,探討 Mali GPU系列基于區(qū)塊的渲染模型。你應(yīng)該已經(jīng)閱讀了關(guān)于管線化的第一篇博文;如果還沒(méi)有,建議你先讀一下。

“傳統(tǒng)”方式

在傳統(tǒng)的主線驅(qū)動(dòng)型桌面 GPU 架構(gòu)中 — 通常稱為直接模式架構(gòu) — 片段著色器按照順序在每一繪制調(diào)用、每一原語(yǔ)上執(zhí)行。每一原語(yǔ)渲染結(jié)束后再開(kāi)始下一個(gè),其利用類似于如下所示的算法:

1. foreach( primitive )

2. foreach( fragment )

3. render fragment

由于流中的任何三角形可能會(huì)覆蓋屏幕的任何部分,由這些渲染器維護(hù)的數(shù)據(jù)工作集將會(huì)很大;通常至少包含全屏尺寸顏色緩沖、深度緩沖,還可能包含模板緩沖?,F(xiàn)代設(shè)備的典型工作集是 32 位/像素 (bpp) 顏色,以及 32 bpp 封裝的深度/模板。因此,1080p 顯示屏擁有一個(gè) 16MB 工作集,而 4k2k 電視機(jī)則有一個(gè) 64MB 工作集。由于其大小原因,這些工作緩沖必須存儲(chǔ)在芯片外的 DRAM 中。

 


每一次混合、深度測(cè)試和模板測(cè)試運(yùn)算都需要從這一工作集中獲取當(dāng)前片段像素坐標(biāo)的數(shù)據(jù)值。被著色的所有片段通常會(huì)接觸到這一工作集,因此在高清顯示中,置于這一內(nèi)存上的帶寬負(fù)載可能會(huì)特別高,每一片段也都有多個(gè)讀-改-寫運(yùn)算,盡管緩存可能會(huì)稍稍緩減這一問(wèn)題。這一對(duì)高帶寬存取的需求反過(guò)來(lái)推動(dòng)了對(duì)具備許多針腳的寬內(nèi)存接口和專用高頻率內(nèi)存的需求,這兩者都會(huì)造成能耗特別密集的外部?jī)?nèi)存訪問(wèn)。

Mali 方式

Mali GPU 系列采用非常不同的方式,通常稱為基于區(qū)塊的的渲染,其設(shè)計(jì)宗旨是竭力減少渲染期間所需的功耗巨大的外部?jī)?nèi)存訪問(wèn)。如本系列第一篇博文中所述,Mali 對(duì)每一渲染目標(biāo)使用獨(dú)特的兩步驟渲染算法。它首先執(zhí)行全部的幾何處理,然后執(zhí)行所有的片段處理。在幾何處理階段中,Mali GPU 將屏幕分割為微小的16x16 像素區(qū)塊,并對(duì)每個(gè)區(qū)塊中存在的渲染原語(yǔ)構(gòu)建一份清單。GPU 片段著色步驟開(kāi)始時(shí),每一著色器核心一次處理一個(gè) 16x16 像素區(qū)塊,將它渲染完后再開(kāi)始下一區(qū)塊。對(duì)于基于區(qū)塊的架構(gòu),其算法相當(dāng)于:

1. foreach( tile )

2. foreach( primitive in tile )

3. foreach( fragment in primitive in tile )

4. render fragment

由于 16x16 區(qū)塊僅僅是總屏幕面積的一小部分,所以有可能將整個(gè)區(qū)塊的完整工作集(顏色、深度和模板)存放在和 GPU 著色器核心緊密耦合的快速 RAM 中。

 


這種基于區(qū)塊的方式有諸多優(yōu)勢(shì)。它們大體上對(duì)開(kāi)發(fā)人員透明,但也值得了解,尤其是在嘗試了解你內(nèi)容的帶寬成本時(shí):

對(duì)工作集的所有訪問(wèn)都屬于本地訪問(wèn),速度快、功耗低。讀取或?qū)懭胪獠?DRAM 的功耗因系統(tǒng)設(shè)計(jì)而異,但對(duì)于提供的每 1GB/s 帶寬,它很容易達(dá)到大約 120mW。與這相比,內(nèi)部?jī)?nèi)存訪問(wèn)的功耗要大約少一個(gè)數(shù)量級(jí),所以你會(huì)發(fā)現(xiàn)這真的大有關(guān)系。

混合不僅速度快,而且功耗低,因?yàn)樵S多混合方式需要的目標(biāo)顏色數(shù)據(jù)都隨時(shí)可用。

區(qū)塊足夠小,我們實(shí)際上可以在區(qū)塊內(nèi)存中本地存儲(chǔ)足夠數(shù)量的樣本,實(shí)現(xiàn) 4 倍、8 倍和 16 倍多采樣抗鋸齒1。這可提供質(zhì)量高、開(kāi)銷很低的抗鋸齒。由于涉及的工作集大小(一般單一采樣渲染目標(biāo)的 4、8 或 16 倍;4k2k 顯示面板的 16x MSAA需要巨大的 1GB 工作集數(shù)據(jù)),少數(shù)直接模式渲染器甚至將 MSAA 作為一項(xiàng)功能提供給開(kāi)發(fā)人員,因?yàn)橥獠績(jī)?nèi)存大小和帶寬通常導(dǎo)致其成本過(guò)于高昂。

Mali 僅僅需要將單一區(qū)塊的顏色數(shù)據(jù)寫回到區(qū)塊末尾的內(nèi)存,此時(shí)我們便能知道其最終狀態(tài)。我們可以通過(guò) CRC 檢查將塊的顏色與主內(nèi)存中的當(dāng)前數(shù)據(jù)進(jìn)行比較 — 這一過(guò)程叫做“事務(wù)消除”— 如果區(qū)塊內(nèi)容相同,則可完全跳過(guò)寫出,從而節(jié)省了 SoC 功耗。我的同事 Tom Olson 針對(duì)這一技術(shù)寫了一篇 優(yōu)秀的博文,文中還提供了“事務(wù)消除”的一個(gè)現(xiàn)實(shí)世界示例(某個(gè)名叫“憤怒的小鳥(niǎo)”的游戲;你或許聽(tīng)說(shuō)過(guò))。有關(guān)這一技術(shù)的詳細(xì)信息還是由 Tom 的博文來(lái)介紹;不過(guò),這兒也稍稍了解一下該技術(shù)的運(yùn)用(僅“多出的粉色”區(qū)塊由 GPU 寫入 - 其他全被成功丟棄)。

 


我們可以采用快速的無(wú)損壓縮方案 — ARM 幀緩沖壓縮 (AFBC) — ,對(duì)逃過(guò)事務(wù)消除的區(qū)塊的顏色數(shù)據(jù)進(jìn)行壓縮,從而進(jìn)一步降低帶寬和功耗。這一壓縮可以應(yīng)用到離屏 FBO 渲染目標(biāo),后者可在隨后的渲染步驟中由 GPU 作為紋理讀回;也可以應(yīng)用到主窗口表面,只要系統(tǒng)中存在兼容 AFBC 的顯示控制器,如 Mali-DP500。

大多數(shù)內(nèi)容擁有深度緩沖和模板緩沖,但幀渲染結(jié)束后就不必再保留其內(nèi)容。如果開(kāi)發(fā)人員告訴 Mali 驅(qū)動(dòng)程序不需要保留深度緩沖和模板緩沖2— 理想方式是通過(guò)調(diào)用 glDiscardFramebufferEXT (OpenGL ES 2.0) 或 glInvalidateFramebuffer (OpenGLES 3.0),雖然在某些情形中可由驅(qū)動(dòng)程序推斷 — 那么區(qū)塊的深度內(nèi)容和模板內(nèi)容也就徹底不用寫回到主內(nèi)存中。我們又大幅節(jié)省了帶寬和功耗!

上表中可以清晰地看出,基于區(qū)塊的渲染具有諸多優(yōu)勢(shì),尤其是可以大幅降低與幀緩沖數(shù)據(jù)相關(guān)的帶寬和功耗,而且還能夠提供低成本的抗鋸齒功能。那么,有些什么劣勢(shì)呢?[!--empirenews.page--]

任何基于區(qū)塊的渲染方案的主要額外開(kāi)銷是從頂點(diǎn)著色器到片段著色器的交接點(diǎn)。幾何處理階段的輸出、各頂點(diǎn)可變數(shù)和區(qū)塊中間狀態(tài)必須寫出到主內(nèi)存,再由片段處理階段重新讀取。因此,必須要在可變數(shù)據(jù)和區(qū)塊狀態(tài)消耗的額外帶寬與幀緩沖數(shù)據(jù)節(jié)省的帶寬之間取得平衡。

當(dāng)今的現(xiàn)代消費(fèi)類電子設(shè)備正大步向更高分辨率顯示屏邁進(jìn);1080p 現(xiàn)在已是智能手機(jī)的常態(tài),配備Mali-T604 的 Google Nexus 10 等平板電腦以 WQXGA (2560x1600) 分辨率運(yùn)行,而 4k2k 正逐漸成為電視機(jī)市場(chǎng)上新的“不二之選”。屏幕分辨率以及幀緩沖帶寬正快速發(fā)展。在這一方面,Mali 確實(shí)表現(xiàn)出眾,而且以對(duì)應(yīng)用程序開(kāi)發(fā)人員基本透明的方式實(shí)現(xiàn) - 無(wú)需任何代價(jià),就能獲得所有這些好處,而且還不用更改應(yīng)用程序!

在幾何處理方面,Mali 也能處理好復(fù)雜度。許多高端基準(zhǔn)測(cè)試正在接近每幀百萬(wàn)個(gè)三角形,其復(fù)雜度比 Android 應(yīng)用商店中的熱門游戲應(yīng)用程序高出一個(gè)(或兩個(gè))數(shù)量級(jí)。然而,由于中間幾何數(shù)據(jù)的確到達(dá)主內(nèi)存,所以可以應(yīng)用一些有用的技巧和訣竅,來(lái)優(yōu)化 GPU 性能并充分發(fā)揮系統(tǒng)能力。這些技巧值得通過(guò)一篇博文來(lái)細(xì)談,所以我們會(huì)在這一系列的后續(xù)博文中再予以介紹。

小結(jié)

在這篇博文中,我比較了桌面型直接模式渲染器與 Mali 所用的基于區(qū)塊方式的異同,尤其探討了兩種方式對(duì)內(nèi)存帶寬的影響。

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

LED驅(qū)動(dòng)電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。

關(guān)鍵字: 驅(qū)動(dòng)電源

在工業(yè)自動(dòng)化蓬勃發(fā)展的當(dāng)下,工業(yè)電機(jī)作為核心動(dòng)力設(shè)備,其驅(qū)動(dòng)電源的性能直接關(guān)系到整個(gè)系統(tǒng)的穩(wěn)定性和可靠性。其中,反電動(dòng)勢(shì)抑制與過(guò)流保護(hù)是驅(qū)動(dòng)電源設(shè)計(jì)中至關(guān)重要的兩個(gè)環(huán)節(jié),集成化方案的設(shè)計(jì)成為提升電機(jī)驅(qū)動(dòng)性能的關(guān)鍵。

關(guān)鍵字: 工業(yè)電機(jī) 驅(qū)動(dòng)電源

LED 驅(qū)動(dòng)電源作為 LED 照明系統(tǒng)的 “心臟”,其穩(wěn)定性直接決定了整個(gè)照明設(shè)備的使用壽命。然而,在實(shí)際應(yīng)用中,LED 驅(qū)動(dòng)電源易損壞的問(wèn)題卻十分常見(jiàn),不僅增加了維護(hù)成本,還影響了用戶體驗(yàn)。要解決這一問(wèn)題,需從設(shè)計(jì)、生...

關(guān)鍵字: 驅(qū)動(dòng)電源 照明系統(tǒng) 散熱

根據(jù)LED驅(qū)動(dòng)電源的公式,電感內(nèi)電流波動(dòng)大小和電感值成反比,輸出紋波和輸出電容值成反比。所以加大電感值和輸出電容值可以減小紋波。

關(guān)鍵字: LED 設(shè)計(jì) 驅(qū)動(dòng)電源

電動(dòng)汽車(EV)作為新能源汽車的重要代表,正逐漸成為全球汽車產(chǎn)業(yè)的重要發(fā)展方向。電動(dòng)汽車的核心技術(shù)之一是電機(jī)驅(qū)動(dòng)控制系統(tǒng),而絕緣柵雙極型晶體管(IGBT)作為電機(jī)驅(qū)動(dòng)系統(tǒng)中的關(guān)鍵元件,其性能直接影響到電動(dòng)汽車的動(dòng)力性能和...

關(guān)鍵字: 電動(dòng)汽車 新能源 驅(qū)動(dòng)電源

在現(xiàn)代城市建設(shè)中,街道及停車場(chǎng)照明作為基礎(chǔ)設(shè)施的重要組成部分,其質(zhì)量和效率直接關(guān)系到城市的公共安全、居民生活質(zhì)量和能源利用效率。隨著科技的進(jìn)步,高亮度白光發(fā)光二極管(LED)因其獨(dú)特的優(yōu)勢(shì)逐漸取代傳統(tǒng)光源,成為大功率區(qū)域...

關(guān)鍵字: 發(fā)光二極管 驅(qū)動(dòng)電源 LED

LED通用照明設(shè)計(jì)工程師會(huì)遇到許多挑戰(zhàn),如功率密度、功率因數(shù)校正(PFC)、空間受限和可靠性等。

關(guān)鍵字: LED 驅(qū)動(dòng)電源 功率因數(shù)校正

在LED照明技術(shù)日益普及的今天,LED驅(qū)動(dòng)電源的電磁干擾(EMI)問(wèn)題成為了一個(gè)不可忽視的挑戰(zhàn)。電磁干擾不僅會(huì)影響LED燈具的正常工作,還可能對(duì)周圍電子設(shè)備造成不利影響,甚至引發(fā)系統(tǒng)故障。因此,采取有效的硬件措施來(lái)解決L...

關(guān)鍵字: LED照明技術(shù) 電磁干擾 驅(qū)動(dòng)電源

開(kāi)關(guān)電源具有效率高的特性,而且開(kāi)關(guān)電源的變壓器體積比串聯(lián)穩(wěn)壓型電源的要小得多,電源電路比較整潔,整機(jī)重量也有所下降,所以,現(xiàn)在的LED驅(qū)動(dòng)電源

關(guān)鍵字: LED 驅(qū)動(dòng)電源 開(kāi)關(guān)電源

LED驅(qū)動(dòng)電源是把電源供應(yīng)轉(zhuǎn)換為特定的電壓電流以驅(qū)動(dòng)LED發(fā)光的電壓轉(zhuǎn)換器,通常情況下:LED驅(qū)動(dòng)電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。

關(guān)鍵字: LED 隧道燈 驅(qū)動(dòng)電源
關(guān)閉