日本黄色一级经典视频|伊人久久精品视频|亚洲黄色色周成人视频九九九|av免费网址黄色小短片|黄色Av无码亚洲成年人|亚洲1区2区3区无码|真人黄片免费观看|无码一级小说欧美日免费三级|日韩中文字幕91在线看|精品久久久无码中文字幕边打电话

當(dāng)前位置:首頁 > 物聯(lián)網(wǎng) > 物聯(lián)網(wǎng)技術(shù)文庫
[導(dǎo)讀] 數(shù)據(jù)倉庫是所有產(chǎn)品的數(shù)據(jù)中心,公司體系下的所有產(chǎn)品產(chǎn)生的所有數(shù)據(jù)最終都流向數(shù)據(jù)倉庫,可以說數(shù)據(jù)倉庫不產(chǎn)生數(shù)據(jù),也不消費(fèi)數(shù)據(jù),只是數(shù)據(jù)的搬運(yùn)工。 記得很久以前曾有一位前輩和我說過

數(shù)據(jù)倉庫是所有產(chǎn)品的數(shù)據(jù)中心,公司體系下的所有產(chǎn)品產(chǎn)生的所有數(shù)據(jù)最終都流向數(shù)據(jù)倉庫,可以說數(shù)據(jù)倉庫不產(chǎn)生數(shù)據(jù),也不消費(fèi)數(shù)據(jù),只是數(shù)據(jù)的搬運(yùn)工。

記得很久以前曾有一位前輩和我說過:“進(jìn)來的數(shù)據(jù)是垃圾數(shù)據(jù),出去也是垃圾數(shù)據(jù)”。

在實(shí)際環(huán)境中,往往我們一條業(yè)務(wù)線會由多個不同的系統(tǒng)支撐組成(例如:很多電商后端業(yè)務(wù)線都區(qū)分為庫存系統(tǒng)、售后系統(tǒng)、采購系統(tǒng)、CRM系統(tǒng)等)。這些系統(tǒng)由于本身設(shè)計(jì)的缺陷或業(yè)務(wù)流程變更等問題,所產(chǎn)生的數(shù)據(jù)往往都是有缺失、冗余的,如果直接使用這些數(shù)據(jù)去進(jìn)行數(shù)據(jù)分析,那最后分析出來的結(jié)論多半也不正確。

因此需要有個數(shù)據(jù)產(chǎn)品來對數(shù)據(jù)進(jìn)行整合加工,而數(shù)據(jù)倉庫就是這樣一款產(chǎn)品。

要想了解怎么搭建數(shù)據(jù)倉庫,首先需要明白數(shù)據(jù)倉庫的作用:

存儲數(shù)據(jù)

校準(zhǔn)數(shù)據(jù)

整合數(shù)據(jù)

輸出數(shù)據(jù)

基于以上幾點(diǎn),需要將數(shù)據(jù)分層次管理,每一層分工合作,對數(shù)據(jù)進(jìn)行不同程度的處理,如同工廠里的流水線一般,從而確保數(shù)據(jù)的生命性、生態(tài)性。

大數(shù)據(jù)體系整體架構(gòu)

數(shù)據(jù)倉庫并不是獨(dú)立存在的一個個體,而是與整個大數(shù)據(jù)體系融為一體的——換句話說,數(shù)據(jù)倉庫就像人的心臟,人只有心臟而沒有其他器官是無法單獨(dú)存活下來的。

大數(shù)據(jù)體系架構(gòu)如圖所示:

來源系統(tǒng)

數(shù)據(jù)的來源系統(tǒng),可以理解為數(shù)據(jù)的收集系統(tǒng)。

如圖所示為基于電商業(yè)務(wù)下的大數(shù)據(jù)體系,因此數(shù)據(jù)大體可分為業(yè)務(wù)數(shù)據(jù)和用戶行為數(shù)據(jù),其來源系統(tǒng)更多是與電商業(yè)務(wù)相關(guān)的后端訂單、庫存等業(yè)務(wù)系統(tǒng)以及前端商城帶來的用戶行為數(shù)據(jù)。

原始數(shù)據(jù)層

顧名思義,即存放從來源系統(tǒng)過來的原始數(shù)據(jù),所謂原始數(shù)據(jù)——即未經(jīng)過任何加工處理的數(shù)據(jù)。

這一層次咋看之下有點(diǎn)多余,但實(shí)際上是有所考量的:

1)將數(shù)據(jù)倉庫與業(yè)務(wù)系統(tǒng)分隔開

數(shù)據(jù)倉庫的數(shù)據(jù),實(shí)時性要求不高,而準(zhǔn)確性、清潔型必須較高,因此清洗的腳本繁多。如果每條數(shù)據(jù)都實(shí)時傳送到數(shù)據(jù)倉庫的話,那腳本執(zhí)行的頻率將非常高,所占用的系統(tǒng)資源也隨之增加。

2)分擔(dān)業(yè)務(wù)系統(tǒng)的報(bào)表任務(wù)

總所周知,搭建大數(shù)據(jù)體系架構(gòu)所使用的硬件資源是相對較高的,而業(yè)務(wù)系統(tǒng)往往只是支撐業(yè)務(wù)持續(xù)開展,從性能上往往無法支撐大數(shù)據(jù)量報(bào)表的導(dǎo)出。因此,原始數(shù)據(jù)層可以承載此項(xiàng)功能,業(yè)務(wù)系統(tǒng)數(shù)據(jù)傳輸?shù)膶?shí)時性也保證了從原始數(shù)據(jù)層導(dǎo)出的數(shù)據(jù)符合業(yè)務(wù)人員對報(bào)表實(shí)時性的需要。

數(shù)據(jù)倉庫

一般來說,數(shù)據(jù)倉庫可區(qū)分為三層:基礎(chǔ)數(shù)據(jù)層、主題層、模型層

基礎(chǔ)數(shù)據(jù)層

原始數(shù)據(jù)層以天為時間周期,將每天的數(shù)據(jù)傳輸?shù)綌?shù)據(jù)倉庫,數(shù)據(jù)倉庫通過ETL(抽取、轉(zhuǎn)化、加載)的方式,將數(shù)據(jù)按照設(shè)定的數(shù)據(jù)表格式存儲好,形成基礎(chǔ)數(shù)據(jù)層的數(shù)據(jù)。

何謂ETL呢?

ETL即:Extra、Transfer、Load——簡單來說,即數(shù)據(jù)清洗。先將數(shù)據(jù)抽取出來,將冗余數(shù)據(jù),錯誤數(shù)據(jù),有歧義的數(shù)據(jù)按照既定的規(guī)則進(jìn)行刪減、填充、修改,再填充入已設(shè)定好的表結(jié)構(gòu)的數(shù)據(jù)庫表中。

舉個栗子:

從訂單系統(tǒng)過來的訂單數(shù)據(jù)上,客戶名稱多種多樣,相同一個客戶,有大寫的名稱、小寫的名稱、有些訂單甚至沒有客戶的相關(guān)信息(這當(dāng)然是業(yè)務(wù)系統(tǒng)本身的歷史遺留問題導(dǎo)致的)。此時,作為數(shù)據(jù)產(chǎn)品經(jīng)理必須要了解這些數(shù)據(jù)的“坑”,并且和對應(yīng)業(yè)務(wù)系統(tǒng)的產(chǎn)品經(jīng)理共同商討如何處理這批數(shù)據(jù),確定好清洗邏輯(例如:所有名稱統(tǒng)一轉(zhuǎn)化為小寫,如果客戶名稱、地址、電話號碼都是同一個的,歸為同一個客戶),程序猿們根據(jù)數(shù)據(jù)產(chǎn)品經(jīng)理的清洗規(guī)則寫好腳本進(jìn)行清洗。

主題層

數(shù)據(jù)清洗就像打掃衛(wèi)生一樣,將不要的東西扔掉,將破舊的東西擦拭干凈,但并不代表數(shù)據(jù)是完整的。

主題層的構(gòu)建相對復(fù)雜,搭建的規(guī)則主要是看未來的需要以及產(chǎn)品經(jīng)理對業(yè)務(wù)的理解。

舉個栗子:

題主所在的公司是一家大型零售分銷公司,因此往往有一張訂單賣給零售商,零售商再下一張訂單給零售店,零售單再下一張訂單給終端用戶。此時,每一級訂單是斷層,且來源于不同的系統(tǒng)的,因此每一級訂單的表結(jié)構(gòu)完全不同。

這樣導(dǎo)致的結(jié)果是:無法從全鏈條上看到每一個商品在渠道中的流轉(zhuǎn),也無法實(shí)時跟蹤到每個商品的具體轉(zhuǎn)化效率。所以,需要把每一級的訂單按照主題分門別類(一級訂單、二級訂單、三級訂單),并且建立一種關(guān)聯(lián)關(guān)系,使這三者能串聯(lián)起來,形成一整個渠道流程。

模型層

數(shù)據(jù)來到模型層,也就意味著他們最終要成為“炮彈”,發(fā)射到數(shù)據(jù)分析平臺了,因此模型層的最主要作用是:將主題數(shù)據(jù)組合成數(shù)據(jù)分析模型。

假設(shè)我們需要在數(shù)據(jù)分析平臺上體現(xiàn)出“不同商品在不同區(qū)域不同客戶的熱銷情況”,那在模型層就需要以訂單表作為最基礎(chǔ)的表,關(guān)聯(lián)上區(qū)域表、客戶表、商品表,關(guān)聯(lián)出一個以區(qū)域+商品+客戶特征維度劃分的明細(xì)數(shù)據(jù)。每個區(qū)域每個商品每個客戶對應(yīng)一行銷售數(shù)據(jù),根據(jù)這份數(shù)據(jù)匯總出一個按區(qū)域+商品+客戶特征的模型,輸出到數(shù)據(jù)分析平臺,展示出不同區(qū)域,不同商品的客戶特征是怎樣的。

需要注意的是:模型層的數(shù)據(jù)都是呈現(xiàn)出星狀結(jié)構(gòu)和高度索引化的。

因?yàn)樵诖髷?shù)據(jù)平臺上,數(shù)據(jù)與數(shù)據(jù)之間往往是需要存在關(guān)聯(lián)的,運(yùn)營人員看到商品在不同區(qū)域上的銷量分布,往往也想進(jìn)一步看到在不同區(qū)域上的商品有什么特征,客戶有什么特征,這些都需要和區(qū)域強(qiáng)關(guān)聯(lián)起來的。

數(shù)據(jù)應(yīng)用層

數(shù)據(jù)應(yīng)用層嚴(yán)格意義上不屬于大數(shù)據(jù)架構(gòu),因?yàn)樗藭婕案魇礁鳂拥臄?shù)據(jù)分析平臺,還會涉及到業(yè)務(wù)系統(tǒng)。

數(shù)據(jù)反哺

上文提到過,業(yè)務(wù)系統(tǒng)對于數(shù)據(jù)倉庫而言更多是作為數(shù)據(jù)收集工具,但同時業(yè)務(wù)系統(tǒng)也存在著數(shù)據(jù)的需求,我把這樣的過程稱為數(shù)據(jù)反哺。

往往支撐公司業(yè)務(wù)開展下去的業(yè)務(wù)系統(tǒng)不止一個,很可能是有多個,而各式各樣的業(yè)務(wù)系統(tǒng)之間也需要數(shù)據(jù)交互。例如:一般電商公司會有一套前端商家平臺,也會一套后端的管理平臺,這兩套平臺使用的往往不是同一套SKU,因此需要將后端SKU同步到前端來進(jìn)行mapping。

那么為什么不能直接讓這兩套系統(tǒng)直接進(jìn)行數(shù)據(jù)交互呢?

因?yàn)閿?shù)據(jù)已經(jīng)不再干凈,需要數(shù)據(jù)倉庫進(jìn)行清洗過后,將冗余的數(shù)據(jù)去除后方可推送至前端商家平臺。

分析模型輸出

數(shù)據(jù)倉庫的數(shù)據(jù),最終除了會流向業(yè)務(wù)系統(tǒng)以外,更多的會流向各大數(shù)據(jù)應(yīng)用系統(tǒng),即:數(shù)據(jù)大屏,大數(shù)據(jù)分析平臺等

此時的數(shù)據(jù),已經(jīng)過層層清洗加工、模型搭建,形成一個個炮彈,通過接口的形式推送至各大數(shù)據(jù)平臺。對于這些數(shù)據(jù)分析、數(shù)據(jù)展示平臺而言,更多的只需要考慮如何直觀展示數(shù)據(jù)即可。

總結(jié)

數(shù)據(jù)倉庫不產(chǎn)生數(shù)據(jù),也不消費(fèi)數(shù)據(jù),如果把數(shù)據(jù)比作是水的話,可以將它理解成礦泉水廠商:負(fù)責(zé)將水抽取上來->排污->打包->運(yùn)送。說來容易,做來難,其中辛酸與難度只有數(shù)據(jù)產(chǎn)品經(jīng)理能理解。

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

LED驅(qū)動電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。

關(guān)鍵字: 驅(qū)動電源

在工業(yè)自動化蓬勃發(fā)展的當(dāng)下,工業(yè)電機(jī)作為核心動力設(shè)備,其驅(qū)動電源的性能直接關(guān)系到整個系統(tǒng)的穩(wěn)定性和可靠性。其中,反電動勢抑制與過流保護(hù)是驅(qū)動電源設(shè)計(jì)中至關(guān)重要的兩個環(huán)節(jié),集成化方案的設(shè)計(jì)成為提升電機(jī)驅(qū)動性能的關(guān)鍵。

關(guān)鍵字: 工業(yè)電機(jī) 驅(qū)動電源

LED 驅(qū)動電源作為 LED 照明系統(tǒng)的 “心臟”,其穩(wěn)定性直接決定了整個照明設(shè)備的使用壽命。然而,在實(shí)際應(yīng)用中,LED 驅(qū)動電源易損壞的問題卻十分常見,不僅增加了維護(hù)成本,還影響了用戶體驗(yàn)。要解決這一問題,需從設(shè)計(jì)、生...

關(guān)鍵字: 驅(qū)動電源 照明系統(tǒng) 散熱

根據(jù)LED驅(qū)動電源的公式,電感內(nèi)電流波動大小和電感值成反比,輸出紋波和輸出電容值成反比。所以加大電感值和輸出電容值可以減小紋波。

關(guān)鍵字: LED 設(shè)計(jì) 驅(qū)動電源

電動汽車(EV)作為新能源汽車的重要代表,正逐漸成為全球汽車產(chǎn)業(yè)的重要發(fā)展方向。電動汽車的核心技術(shù)之一是電機(jī)驅(qū)動控制系統(tǒng),而絕緣柵雙極型晶體管(IGBT)作為電機(jī)驅(qū)動系統(tǒng)中的關(guān)鍵元件,其性能直接影響到電動汽車的動力性能和...

關(guān)鍵字: 電動汽車 新能源 驅(qū)動電源

在現(xiàn)代城市建設(shè)中,街道及停車場照明作為基礎(chǔ)設(shè)施的重要組成部分,其質(zhì)量和效率直接關(guān)系到城市的公共安全、居民生活質(zhì)量和能源利用效率。隨著科技的進(jìn)步,高亮度白光發(fā)光二極管(LED)因其獨(dú)特的優(yōu)勢逐漸取代傳統(tǒng)光源,成為大功率區(qū)域...

關(guān)鍵字: 發(fā)光二極管 驅(qū)動電源 LED

LED通用照明設(shè)計(jì)工程師會遇到許多挑戰(zhàn),如功率密度、功率因數(shù)校正(PFC)、空間受限和可靠性等。

關(guān)鍵字: LED 驅(qū)動電源 功率因數(shù)校正

在LED照明技術(shù)日益普及的今天,LED驅(qū)動電源的電磁干擾(EMI)問題成為了一個不可忽視的挑戰(zhàn)。電磁干擾不僅會影響LED燈具的正常工作,還可能對周圍電子設(shè)備造成不利影響,甚至引發(fā)系統(tǒng)故障。因此,采取有效的硬件措施來解決L...

關(guān)鍵字: LED照明技術(shù) 電磁干擾 驅(qū)動電源

開關(guān)電源具有效率高的特性,而且開關(guān)電源的變壓器體積比串聯(lián)穩(wěn)壓型電源的要小得多,電源電路比較整潔,整機(jī)重量也有所下降,所以,現(xiàn)在的LED驅(qū)動電源

關(guān)鍵字: LED 驅(qū)動電源 開關(guān)電源

LED驅(qū)動電源是把電源供應(yīng)轉(zhuǎn)換為特定的電壓電流以驅(qū)動LED發(fā)光的電壓轉(zhuǎn)換器,通常情況下:LED驅(qū)動電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。

關(guān)鍵字: LED 隧道燈 驅(qū)動電源
關(guān)閉