深度學(xué)習(xí)完整解決方案 可節(jié)省80%開(kāi)發(fā)時(shí)間
不只軟、硬件廠(chǎng)商,許多云端服務(wù)商也紛紛卡位人工智能(AI)市場(chǎng),但競(jìng)爭(zhēng)白熱化對(duì)于開(kāi)發(fā)者來(lái)說(shuō)倒也不是一件壞事,再加上大廠(chǎng)之間互相合作,這也促使整個(gè)AI生態(tài)系走向開(kāi)放的型態(tài),至少在市場(chǎng)上,資源會(huì)來(lái)越豐富與完整,從而降低開(kāi)發(fā)者的入門(mén)門(mén)檻。
資源缺乏集成性 容易讓開(kāi)發(fā)出現(xiàn)斷層雖然市場(chǎng)上已有相當(dāng)充足的資源供開(kāi)發(fā)者使用,說(shuō)來(lái)簡(jiǎn)單,但實(shí)際上要投入開(kāi)發(fā)卻也不簡(jiǎn)單。在深度學(xué)習(xí)復(fù)雜龐大的知識(shí)體系下,開(kāi)發(fā)者難以專(zhuān)精于每種技術(shù)層面,就好比擅長(zhǎng)對(duì)大數(shù)據(jù)進(jìn)行整理與分析的人,對(duì)于最底層運(yùn)算環(huán)境中的硬件架構(gòu)、IT技術(shù)知之甚少。
一個(gè)擁有資料科學(xué)背景的人尚可自己訓(xùn)練一個(gè)深度學(xué)習(xí)模型,畢竟市場(chǎng)上有許多流行的深度學(xué)習(xí)開(kāi)源框架可以使用,象是Tensor Flow、Caffe、CNTK、Theano等,這些框架都各有自己的優(yōu)缺點(diǎn)。
加上過(guò)去由史丹佛大學(xué)(Stanford University)舉辦ImageNet圖象識(shí)別競(jìng)賽中,包括Google、微軟(Microsoft)、百度等大型企業(yè)除了爭(zhēng)奪圖象識(shí)別寶座外,也會(huì)藉此機(jī)會(huì)同時(shí)測(cè)試自家系統(tǒng)的效能與極限,因此在比賽過(guò)程中,透過(guò)自家的深度學(xué)習(xí)框架訓(xùn)練出一些新的神經(jīng)網(wǎng)絡(luò)算法,這些資源經(jīng)過(guò)大廠(chǎng)的「監(jiān)定」與「驗(yàn)證」,開(kāi)發(fā)者若有需求都可取之。
利用已成熟的資源投入模型的訓(xùn)練不難,但若開(kāi)發(fā)者要再往下探究到更底層的運(yùn)算環(huán)境,包括選擇合適的硬件組裝,或是建立基礎(chǔ)運(yùn)算環(huán)境時(shí),情況就變得更復(fù)雜了。研華智能系統(tǒng)事業(yè)群協(xié)理劉厚儀觀察,過(guò)去在深度學(xué)習(xí)的開(kāi)發(fā)環(huán)境中,由于各技術(shù)層面之間壁壘分明,資源更難以集成。
就算開(kāi)發(fā)者想對(duì)外尋求協(xié)助,在市場(chǎng)上也缺乏一套較完整的解決方案可以透過(guò)一次性的導(dǎo)入,解決系統(tǒng)建置所耗費(fèi)的繁瑣工程,以及軟件開(kāi)發(fā)的設(shè)計(jì),這讓如SI的業(yè)者很容易在建立最基礎(chǔ)的運(yùn)算系統(tǒng)過(guò)程中止步,迫使開(kāi)發(fā)進(jìn)程出現(xiàn)斷層。
深度學(xué)習(xí)完整解決方案 縮短開(kāi)發(fā)時(shí)間、提高效率因此,集成性的設(shè)備對(duì)于縮短系統(tǒng)建置時(shí)間至關(guān)重要。市場(chǎng)上最具有代表性的是NVIDIA在2016年所推出的DGX-1,當(dāng)中便結(jié)合了硬件、深度學(xué)習(xí)軟件、程序開(kāi)發(fā)工具軟件等,是全球第一款專(zhuān)為AI分析所打造的集成性設(shè)備。
DGX-1集成基礎(chǔ)運(yùn)算環(huán)境所需的資源與工具,用以減少系統(tǒng)集成與軟件工程設(shè)計(jì)所需的時(shí)間,有了這樣的設(shè)備,企業(yè)能快速、簡(jiǎn)易地部署相關(guān)的運(yùn)算環(huán)境。不過(guò)DGX-1造價(jià)不斐,尤其對(duì)小規(guī)模的企業(yè)或是個(gè)人開(kāi)發(fā)者而言,基于成本的考量很容易望之卻步。
所幸研華也發(fā)現(xiàn)市場(chǎng)上面臨資源分散、系統(tǒng)難以集成的問(wèn)題,為了降低業(yè)者在建置訓(xùn)練系統(tǒng)的復(fù)雜性與技術(shù)門(mén)檻,研華近年也積極投入人工智能市場(chǎng),并攜手大廠(chǎng)技術(shù)合作,開(kāi)發(fā)深度學(xué)習(xí)完整解決方案。
研華將訓(xùn)練系統(tǒng)中最底層包括硬件設(shè)備、深度學(xué)習(xí)軟件開(kāi)發(fā)套件、模型訓(xùn)練平臺(tái)等基礎(chǔ)運(yùn)算環(huán)境所需的資源集成起來(lái),藉此除了協(xié)助業(yè)者加速訓(xùn)練系統(tǒng)的建置,縮減人力和時(shí)間成本外,亦能讓諸如SI的業(yè)者能投入更多資源專(zhuān)注于解決終端使用者的需求。
開(kāi)發(fā)者唯一要做的事,便是「搜集資料、整理資料」如此簡(jiǎn)單,而最繁瑣的系統(tǒng)建置工程,未來(lái)都能透過(guò)市場(chǎng)上完整部署的解決方案來(lái)完成。這也是為什么研華積極從投入人工智能市場(chǎng)、攜手大廠(chǎng)集成最底層運(yùn)算資源的原因,「目的即是讓開(kāi)發(fā)者將有限的開(kāi)發(fā)時(shí)間,投入在最具有價(jià)值的資料處理與分析上?!寡腥A智能系統(tǒng)事業(yè)群協(xié)理鮑志偉如此強(qiáng)調(diào)。
然而,「訓(xùn)練」只是深度學(xué)習(xí)的開(kāi)始,更大的挑戰(zhàn)是接下來(lái)如何將深度學(xué)習(xí)技術(shù)實(shí)際運(yùn)用到各種場(chǎng)景中進(jìn)行預(yù)測(cè)和分析,而這部份的關(guān)鍵則是終端的推理系統(tǒng)。各種終端應(yīng)用場(chǎng)景象是交通運(yùn)輸、機(jī)器人、醫(yī)療保健和公共安全等,而每個(gè)應(yīng)用場(chǎng)景實(shí)際上也面臨一些特殊需求。
例如在交通場(chǎng)景需要極度安全且可靠的硬件設(shè)備進(jìn)行感知、在公共安全領(lǐng)域則需要質(zhì)量穩(wěn)定的攝影鏡頭以維持可靠的執(zhí)行效率,同樣地,在苛刻和嚴(yán)峻的應(yīng)用環(huán)境中也面臨各種挑戰(zhàn)。因此,若業(yè)者無(wú)法如實(shí)掌握產(chǎn)業(yè)端的特性,在系統(tǒng)建構(gòu)的第一步便容易卡關(guān)、遇到阻礙。
這對(duì)于在產(chǎn)業(yè)深耕已久的研華來(lái)說(shuō),除了擁有積累多年的產(chǎn)業(yè)Know-how外,更能比一般業(yè)者熟悉市場(chǎng)客戶(hù)的需求。研華也在市場(chǎng)上提供以產(chǎn)業(yè)端需求為中心所設(shè)計(jì)的推理系統(tǒng),以加速AI在終端應(yīng)用場(chǎng)景中落地。
象是在研華所開(kāi)發(fā)的IVA(Intelligent Video Analysis)推理系統(tǒng)中,使用者便可透過(guò)內(nèi)含多種智能影像分析功能,包括移動(dòng)偵測(cè)、人臉偵測(cè)、人群密度偵測(cè)等,將其快速導(dǎo)入到AI應(yīng)用的開(kāi)發(fā)中。而研華完整的深度學(xué)習(xí)解決方案不僅包括前端所需的訓(xùn)練服務(wù)器,也集成終端推論環(huán)境所需的資料存儲(chǔ)設(shè)備、網(wǎng)絡(luò)設(shè)備等。
80%時(shí)間都耗在開(kāi)發(fā)前資料處理前百度首席科學(xué)家吳恩達(dá)曾把深度學(xué)習(xí)比喻成一個(gè)火箭。在火箭的結(jié)構(gòu)中,推進(jìn)火箭最重要的部分就是引擎,而目前在深度學(xué)習(xí)這個(gè)領(lǐng)域里,引擎的核心就是神經(jīng)網(wǎng)絡(luò)。而火箭除了引擎外,還需要有燃料,那么大數(shù)據(jù)便是構(gòu)成火箭的重要組成部分─燃料。
大數(shù)據(jù)對(duì)于深度學(xué)習(xí)的發(fā)展與推進(jìn)至關(guān)重要。研華智能系統(tǒng)事業(yè)群協(xié)理鮑志偉認(rèn)為,驅(qū)動(dòng)人工智能的核心便是來(lái)自于大數(shù)據(jù)資料,一旦獲取的數(shù)據(jù)量越多,便能藉此優(yōu)化訓(xùn)練模型,讓模型的推理與分析更佳精準(zhǔn)。不過(guò),具有分析價(jià)值的數(shù)據(jù)必然事先經(jīng)過(guò)整理,否則最終只是「Garbage in, garbage out」。
然而,處理數(shù)據(jù)非常消耗人力與時(shí)間,以往由于缺乏資料處理工具,通常開(kāi)發(fā)者在訓(xùn)練模型的過(guò)程中,會(huì)花費(fèi)將近80%的時(shí)間在資料處理,象是整理或收集資料組合、10%的時(shí)間在運(yùn)算,而10%的時(shí)間則在優(yōu)化模型。
消耗大量的資料處理時(shí)間會(huì)拖慢開(kāi)發(fā)進(jìn)度,而市場(chǎng)也試圖解決這個(gè)惱人的問(wèn)題。象是在研華的深度學(xué)習(xí)超級(jí)工作站中,因其內(nèi)建自動(dòng)卷標(biāo)工具,開(kāi)發(fā)者唯一需要做得便是檢查卷標(biāo)是否正確,因而開(kāi)發(fā)者在資料處理工具的輔助下,便能有效地節(jié)省80%的資料處理時(shí)間。
AI開(kāi)發(fā)走向平民化人工智能之所以掀起熱潮,除了歸功于硬件運(yùn)算能力的提升、類(lèi)神經(jīng)網(wǎng)絡(luò)算法的突破外,云端服務(wù)的興起也讓系統(tǒng)建置成本大幅降低。在云端建置訓(xùn)練與推論系統(tǒng)的好處除了不需花費(fèi)大量成本建構(gòu)實(shí)體機(jī)外,還可以相當(dāng)彈性地選擇擴(kuò)充或減少部署。
開(kāi)發(fā)者現(xiàn)今可以透過(guò)各種云端服務(wù)商來(lái)建置訓(xùn)練、或是推論系統(tǒng),也可以選擇直接在終端環(huán)境中部署。但基本上,選擇在終端的成本無(wú)疑是最昂貴的,原則上有點(diǎn)像買(mǎi)斷與租用的區(qū)別。若是在終端建置推論系統(tǒng),由于需配合產(chǎn)業(yè)端的特性與需求,這對(duì)業(yè)者來(lái)說(shuō)仍有一定的門(mén)檻。
現(xiàn)今市場(chǎng)上的云端平臺(tái)除了提供運(yùn)算資源,更打包好包括基礎(chǔ)設(shè)施、儲(chǔ)存空間及各種API等整套服務(wù)。目前市場(chǎng)上較知名的云端運(yùn)算服務(wù)有AWS EC2、Azure或GCP平臺(tái)。
亞馬遜AWS由于創(chuàng)立較早,和其它平臺(tái)相比擁有先發(fā)優(yōu)勢(shì),如今提供的運(yùn)算、儲(chǔ)存、資料庫(kù)、分析、應(yīng)用程序服務(wù)等超過(guò)70種,覆蓋面極廣,自然成為用戶(hù)首選;而微軟于2010年成立的Azure也不惶多讓?zhuān)瑩碛?7項(xiàng)服務(wù),與微軟的產(chǎn)品結(jié)合度高;GCP則挾帶Google本身在人工智能領(lǐng)域的優(yōu)勢(shì),以低價(jià)策略搶食市場(chǎng)大餅;而IBM的Bluemix則釋出許多人工智能API。





