對圖像處理和卷積神經(jīng)網(wǎng)絡架構的案例分析和概念理解

時間：2020-08-06 07:36:01

關鍵字：圖像處理機器視覺

手機看文章

掃描二維碼
隨時隨地手機看文章

[導讀] 近日，Dishashree Gupta 在 AnalyTIcsvidhya 上發(fā)表了一篇題為《Architecture of ConvoluTIonal Neural Networks (CNN

近日，Dishashree Gupta 在 AnalyTIcsvidhya 上發(fā)表了一篇題為《Architecture of ConvoluTIonal Neural Networks (CNNs) demysTIfied》的文章，對用于圖像識別和分類的卷積神經(jīng)網(wǎng)絡架構作了深度揭秘；作者在文中還作了通盤演示，期望對 CNN 的工作機制有一個深入的剖析。

引言

先坦白地說，有一段時間我無法真正理解深度學習。我查看相關研究論文和文章，感覺深度學習異常復雜。我嘗試去理解神經(jīng)網(wǎng)絡及其變體，但依然感到困難。

接著有一天，我決定一步一步，從基礎開始。我把技術操作的步驟分解開來，并手動執(zhí)行這些步驟（和計算），直到我理解它們?nèi)绾喂ぷ?。這相當費時，且令人緊張，但是結果非凡。

現(xiàn)在，我不僅對深度學習有了全面的理解，還在此基礎上有了好想法，因為我的基礎很扎實。隨意地應用神經(jīng)網(wǎng)絡是一回事，理解它是什么以及背后的發(fā)生機制是另外一回事。

今天，我將與你共享我的心得，展示我如何上手卷積神經(jīng)網(wǎng)絡并最終弄明白了它。我將做一個通盤的展示，從而使你對 CNN 的工作機制有一個深入的了解。

在本文中，我將會討論 CNN 背后的架構，其設計初衷在于解決圖像識別和分類問題。同時我也會假設你對神經(jīng)網(wǎng)絡已經(jīng)有了初步了解。

1. 機器如何看圖？

人類大腦是一非常強大的機器，每秒內(nèi)能看（捕捉）多張圖，并在意識不到的情況下就完成了對這些圖的處理。但機器并非如此。機器處理圖像的第一步是理解，理解如何表達一張圖像，進而讀取圖片。

簡單來說，每個圖像都是一系列特定排序的圖點（像素）。如果你改變像素的順序或顏色，圖像也隨之改變。舉個例子，存儲并讀取一張上面寫著數(shù)字 4 的圖像。

基本上，機器會把圖像打碎成像素矩陣，存儲每個表示位置像素的顏色碼。在下圖的表示中，數(shù)值 1 是白色，256 是最深的綠色（為了簡化，我們示例限制到了一種顏色）。

一旦你以這種格式存儲完圖像信息，下一步就是讓神經(jīng)網(wǎng)絡理解這種排序與模式。

2. 如何幫助神經(jīng)網(wǎng)絡識別圖像？

表征像素的數(shù)值是以特定的方式排序的。

假設我們嘗試使用全連接網(wǎng)絡識別圖像，該如何做？

全連接網(wǎng)絡可以通過平化它，把圖像當作一個數(shù)組，并把像素值當作預測圖像中數(shù)值的特征。明確地說，讓網(wǎng)絡理解理解下面圖中發(fā)生了什么，非常的艱難。

即使人類也很難理解上圖中表達的含義是數(shù)字 4。我們完全丟失了像素的空間排列。

我們能做什么呢？可以嘗試從原圖像中提取特征，從而保留空間排列。

案例 1

這里我們使用一個權重乘以初始像素值。

現(xiàn)在裸眼識別出這是「4」就變得更簡單了。但把它交給全連接網(wǎng)絡之前，還需要平整化（flatten) 它，要讓我們能夠保留圖像的空間排列。

案例 2

現(xiàn)在我們可以看到，把圖像平整化完全破壞了它的排列。我們需要想出一種方式在沒有平整化的情況下把圖片饋送給網(wǎng)絡，并且還要保留空間排列特征，也就是需要饋送像素值的 2D/3D 排列。

我們可以嘗試一次采用圖像的兩個像素值，而非一個。這能給網(wǎng)絡很好的洞見，觀察鄰近像素的特征。既然一次采用兩個像素，那也就需要一次采用兩個權重值了。

希望你能注意到圖像從之前的 4 列數(shù)值變成了 3 列。因為我們現(xiàn)在一次移用兩個像素（在每次移動中像素被共享），圖像變的更小了。雖然圖像變小了，我們?nèi)阅茉诤艽蟪潭壬侠斫膺@是「4」。而且，要意識到的一個重點是，我們采用的是兩個連貫的水平像素，因此只會考慮水平的排列。

這是我們從圖像中提取特征的一種方式。我們可以看到左邊和中間部分，但右邊部分看起來不那么清楚。主要是因為兩個問題：

1. 圖片角落左邊和右邊是權重相乘一次得到的。
2. 左邊仍舊保留，因為權重值高；右邊因為略低的權重，有些丟失。

現(xiàn)在我們有兩個問題，需要兩個解決方案。

案例 3

本站聲明：本文章由作者或相關機構授權發(fā)布，目的在于傳遞更多信息，并不代表本站贊同其觀點，本站亦不保證或承諾內(nèi)容真實性等。需要轉載請聯(lián)系該專欄作者，如若文章內(nèi)容侵犯您的權益，請及時聯(lián)系本站刪除。

換一批

與傳統(tǒng)的驅動方式相比，共陰恒流驅動在能效有哪些優(yōu)勢

LED驅動電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。

關鍵字：驅動電源

[電源]

工業(yè)電機驅動電源設計：反電動勢抑制與過流保護的集成方案

在工業(yè)自動化蓬勃發(fā)展的當下，工業(yè)電機作為核心動力設備，其驅動電源的性能直接關系到整個系統(tǒng)的穩(wěn)定性和可靠性。其中，反電動勢抑制與過流保護是驅動電源設計中至關重要的兩個環(huán)節(jié)，集成化方案的設計成為提升電機驅動性能的關鍵。

關鍵字：工業(yè)電機驅動電源

[電源]

如何解決 LED 驅動電源的易損壞問題

LED 驅動電源作為 LED 照明系統(tǒng)的 “心臟”，其穩(wěn)定性直接決定了整個照明設備的使用壽命。然而，在實際應用中，LED 驅動電源易損壞的問題卻十分常見，不僅增加了維護成本，還影響了用戶體驗。要解決這一問題，需從設計、生...

關鍵字：驅動電源照明系統(tǒng) 散熱

[電力電工電路]

LED設計中LED驅動電源的公式

根據(jù)LED驅動電源的公式，電感內(nèi)電流波動大小和電感值成反比，輸出紋波和輸出電容值成反比。所以加大電感值和輸出電容值可以減小紋波。

關鍵字： LED 設計驅動電源

[汽車電子]

EV主驅IGBT隔離驅動電源方案選擇問題探討

電動汽車(EV)作為新能源汽車的重要代表，正逐漸成為全球汽車產(chǎn)業(yè)的重要發(fā)展方向。電動汽車的核心技術之一是電機驅動控制系統(tǒng)，而絕緣柵雙極型晶體管(IGBT)作為電機驅動系統(tǒng)中的關鍵元件，其性能直接影響到電動汽車的動力性能和...

關鍵字：電動汽車新能源驅動電源

[電源]

合理的驅動電源方案成為大功率區(qū)域照明的主流選擇

在現(xiàn)代城市建設中，街道及停車場照明作為基礎設施的重要組成部分，其質(zhì)量和效率直接關系到城市的公共安全、居民生活質(zhì)量和能源利用效率。隨著科技的進步，高亮度白光發(fā)光二極管(LED)因其獨特的優(yōu)勢逐漸取代傳統(tǒng)光源，成為大功率區(qū)域...

關鍵字：發(fā)光二極管驅動電源 LED

[消費電子]

AC-DC電源轉換拓撲結構設計

LED通用照明設計工程師會遇到許多挑戰(zhàn)，如功率密度、功率因數(shù)校正(PFC)、空間受限和可靠性等。

關鍵字： LED 驅動電源功率因數(shù)校正

[電源]

針對于LED照明驅動電源技術中的電磁干擾其中的三大硬件問題措施

在LED照明技術日益普及的今天，LED驅動電源的電磁干擾(EMI)問題成為了一個不可忽視的挑戰(zhàn)。電磁干擾不僅會影響LED燈具的正常工作，還可能對周圍電子設備造成不利影響，甚至引發(fā)系統(tǒng)故障。因此，采取有效的硬件措施來解決L...

關鍵字： LED照明技術電磁干擾驅動電源

[電源]

LED驅動電源的核心部分“開關管”和“變換器”設計技巧

開關電源具有效率高的特性,而且開關電源的變壓器體積比串聯(lián)穩(wěn)壓型電源的要小得多,電源電路比較整潔,整機重量也有所下降,所以,現(xiàn)在的LED驅動電源

關鍵字： LED 驅動電源開關電源

[電源]

最全LED驅動電源及散熱設計方案介紹

LED驅動電源是把電源供應轉換為特定的電壓電流以驅動LED發(fā)光的電壓轉換器，通常情況下：LED驅動電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。

關鍵字： LED 隧道燈驅動電源

對圖像處理和卷積神經(jīng)網(wǎng)絡架構的案例分析和概念理解

與傳統(tǒng)的驅動方式相比，共陰恒流驅動在能效有哪些優(yōu)勢

工業(yè)電機驅動電源設計：反電動勢抑制與過流保護的集成方案

如何解決 LED 驅動電源的易損壞問題

LED設計中LED驅動電源的公式

EV主驅IGBT隔離驅動電源方案選擇問題探討

合理的驅動電源方案成為大功率區(qū)域照明的主流選擇

AC-DC電源轉換拓撲結構設計

針對于LED照明驅動電源技術中的電磁干擾其中的三大硬件問題措施

LED驅動電源的核心部分“開關管”和“變換器”設計技巧

最全LED驅動電源及散熱設計方案介紹

常用的LED驅動電源有哪些？工作原理是什么？

LED驅動電源的類型可分為有哪些？

解散全部員工！深圳又一電子大廠宣布停產(chǎn)結業(yè)

崧盛股份：大功率LED驅動電源行業(yè)門檻高，新進入者面臨三大壁壘

關于LED驅動電源的分類以及特點解析，你了解嗎？

你知道常見的LED驅動電源種類以及它們有哪些特點嗎？

關于LED驅動電源特點以及在設計時需要注意的關鍵點

多路 LED 驅動電源技術的開發(fā)與可靠性研究分析

值得大家學習的LED驅動電源的特點以及工作原理概述

Cree宣布徹底告別LED和照明行業(yè)