日本黄色一级经典视频|伊人久久精品视频|亚洲黄色色周成人视频九九九|av免费网址黄色小短片|黄色Av无码亚洲成年人|亚洲1区2区3区无码|真人黄片免费观看|无码一级小说欧美日免费三级|日韩中文字幕91在线看|精品久久久无码中文字幕边打电话

當(dāng)前位置:首頁 > 單片機(jī) > 架構(gòu)師社區(qū)
[導(dǎo)讀]常規(guī)的大數(shù)據(jù)平臺(tái)架構(gòu)方案是基于大數(shù)據(jù)平臺(tái)Lamda架構(gòu)設(shè)計(jì)的。事實(shí)上,業(yè)界也基本是按照這種架構(gòu)模型搭建自己的大數(shù)據(jù)平臺(tái)。接著我們來看一下淘寶、美團(tuán)和滴滴的大數(shù)據(jù)平臺(tái),一方面進(jìn)一步學(xué)習(xí)大廠大數(shù)據(jù)平臺(tái)的架構(gòu),另一方面也學(xué)習(xí)大廠的工程師如何畫架構(gòu)圖。通過大廠的這些架構(gòu)圖,就會(huì)發(fā)現(xiàn),不但...

淘寶、美團(tuán)、滴滴分別如何搭建大數(shù)據(jù)平臺(tái)?

常規(guī)的大數(shù)據(jù)平臺(tái)架構(gòu)方案是基于大數(shù)據(jù)平臺(tái)Lamda架構(gòu)設(shè)計(jì)的。事實(shí)上,業(yè)界也基本是按照這種架構(gòu)模型搭建自己的大數(shù)據(jù)平臺(tái)。

接著我們來看一下淘寶、美團(tuán)和滴滴的大數(shù)據(jù)平臺(tái),一方面進(jìn)一步學(xué)習(xí)大廠大數(shù)據(jù)平臺(tái)的架構(gòu),另一方面也學(xué)習(xí)大廠的工程師如何畫架構(gòu)圖。通過大廠的這些架構(gòu)圖,就會(huì)發(fā)現(xiàn),不但這些知名大廠的大數(shù)據(jù)平臺(tái)設(shè)計(jì)方案大同小異,架構(gòu)圖的畫法也有套路。

淘寶大數(shù)據(jù)平臺(tái)

淘寶可能是中國互聯(lián)網(wǎng)業(yè)界較早搭建了自己大數(shù)據(jù)平臺(tái)的公司,圖5.7是淘寶早期的Hadoop大數(shù)據(jù)平臺(tái),比較典型。

淘寶、美團(tuán)、滴滴分別如何搭建大數(shù)據(jù)平臺(tái)?


淘寶的大數(shù)據(jù)平臺(tái)基本分成三部分,上面是數(shù)據(jù)源與數(shù)據(jù)同步模塊;中間是云梯1,即淘寶的Hadoop大數(shù)據(jù)集群;下面是大數(shù)據(jù)的應(yīng)用,即使用大數(shù)據(jù)集群的計(jì)算結(jié)果。

數(shù)據(jù)源主要來自O(shè)racle和MySQL的備庫,以及日志系統(tǒng)和爬蟲系統(tǒng),這些數(shù)據(jù)通過數(shù)據(jù)同步網(wǎng)關(guān)服務(wù)器導(dǎo)入Hadoop集群。其中DataExchange非實(shí)時(shí)全量同步數(shù)據(jù)庫數(shù)據(jù),DBSync實(shí)時(shí)同步數(shù)據(jù)庫增量數(shù)據(jù),TimeTunnel實(shí)時(shí)同步日志和爬蟲數(shù)據(jù)。數(shù)據(jù)全部寫入HDFS。

在Hadoop中的計(jì)算任務(wù)會(huì)通過天網(wǎng)調(diào)度系統(tǒng),根據(jù)集群資源和作業(yè)優(yōu)先級,調(diào)度作業(yè)的提交和執(zhí)行。計(jì)算結(jié)果寫入HDFS,再經(jīng)過DataExchange同步到MySQL和Oracle數(shù)據(jù)庫。處于平臺(tái)下方的數(shù)據(jù)魔方、推薦系統(tǒng)等從數(shù)據(jù)庫中讀取數(shù)據(jù),就可以實(shí)時(shí)響應(yīng)用戶的操作請求。

淘寶大數(shù)據(jù)平臺(tái)的核心是位于架構(gòu)圖左側(cè)的天網(wǎng)調(diào)度系統(tǒng),提交到Hadoop集群上的任務(wù)需要按序、按優(yōu)先級調(diào)度執(zhí)行,Hadoop集群上已經(jīng)定義好的任務(wù)也需要調(diào)度執(zhí)行,何時(shí)從數(shù)據(jù)庫、日志、爬蟲系統(tǒng)導(dǎo)入數(shù)據(jù)也需要調(diào)度執(zhí)行,何時(shí)將Hadoop執(zhí)行結(jié)果導(dǎo)出到應(yīng)用系統(tǒng)的數(shù)據(jù)庫,仍然需要調(diào)度執(zhí)行??梢哉f,整個(gè)大數(shù)據(jù)平臺(tái)都是在天網(wǎng)調(diào)度系統(tǒng)的統(tǒng)一規(guī)劃和安排下運(yùn)作的,如圖5.8所示。

淘寶、美團(tuán)、滴滴分別如何搭建大數(shù)據(jù)平臺(tái)?


DBSync、TimeTunnel、DataExchange這些數(shù)據(jù)同步組件也是淘寶內(nèi)部開發(fā)的,可以針對不同的數(shù)據(jù)源和同步需求導(dǎo)入、導(dǎo)出數(shù)據(jù)。這些組件淘寶大多已經(jīng)開源,我們可以參考使用。

美團(tuán)大數(shù)據(jù)平臺(tái)

美團(tuán)大數(shù)據(jù)平臺(tái)的數(shù)據(jù)源來自MySQL數(shù)據(jù)庫和日志,數(shù)據(jù)庫通過Canal獲得MySQL的binlog,輸出給消息隊(duì)列Kafka,日志通過Flume輸出到Kafka,如圖5.9所示。

淘寶、美團(tuán)、滴滴分別如何搭建大數(shù)據(jù)平臺(tái)?


Kafka的數(shù)據(jù)會(huì)被流式計(jì)算和批處理計(jì)算兩個(gè)引擎分別消費(fèi)。流處理使用Storm進(jìn)行計(jì)算,結(jié)果輸出到HBase或者數(shù)據(jù)庫。批處理計(jì)算使用Hive進(jìn)行分析計(jì)算,結(jié)果輸出到查詢系統(tǒng)和BI(商業(yè)智能)平臺(tái)。

數(shù)據(jù)分析師可以通過BI產(chǎn)品平臺(tái)進(jìn)行交互式的數(shù)據(jù)查詢訪問,也可以通過可視化的報(bào)表工具查看已經(jīng)處理好的常用分析指標(biāo);公司高管也可以通過平臺(tái)上的天機(jī)系統(tǒng)查看公司主要業(yè)務(wù)指標(biāo)和報(bào)表。

美團(tuán)大數(shù)據(jù)平臺(tái)的整個(gè)過程管理通過調(diào)度平臺(tái)進(jìn)行管理。公司內(nèi)部開發(fā)者使用數(shù)據(jù)開發(fā)平臺(tái)訪問大數(shù)據(jù)平臺(tái),進(jìn)行ETL(數(shù)據(jù)提取、轉(zhuǎn)換、裝載)開發(fā),提交任務(wù)作業(yè)并進(jìn)行數(shù)據(jù)管理。

滴滴大數(shù)據(jù)平臺(tái)

滴滴大數(shù)據(jù)平臺(tái)分為實(shí)時(shí)計(jì)算平臺(tái)(流式計(jì)算平臺(tái))和離線計(jì)算平臺(tái)(批處理計(jì)算平臺(tái))兩個(gè)部分。

實(shí)時(shí)計(jì)算平臺(tái)架構(gòu)如圖5.10所示。數(shù)據(jù)采集以后輸出到Kafka消息隊(duì)列,消費(fèi)通道有兩個(gè),一個(gè)是數(shù)據(jù)ETL,使用Spark Streaming或者Flink將數(shù)據(jù)進(jìn)行清洗、轉(zhuǎn)換、處理后記錄到HDFS中,供后續(xù)批處理計(jì)算;另一個(gè)通道是Druid,計(jì)算實(shí)時(shí)監(jiān)控指標(biāo),將結(jié)果輸出到報(bào)警系統(tǒng)和實(shí)時(shí)圖表系統(tǒng)DashBoard,如圖5.10所示。

淘寶、美團(tuán)、滴滴分別如何搭建大數(shù)據(jù)平臺(tái)?

離線計(jì)算平臺(tái)架構(gòu)如5.11所示。滴滴的離線大數(shù)據(jù)平臺(tái)是基于Hadoop?2HDFS、Yarn、MapReduce)和Spark以及Hive構(gòu)建在此基礎(chǔ)上開發(fā)了自己的調(diào)度系統(tǒng)和開發(fā)系統(tǒng)。調(diào)度系統(tǒng)和前面其他系統(tǒng)一樣,調(diào)度大數(shù)據(jù)作業(yè)的優(yōu)先級和執(zhí)行順序。開發(fā)平臺(tái)是一個(gè)可視化的SQL編輯器,可以方便地查詢表結(jié)構(gòu)、開發(fā)SQL,并發(fā)布到大數(shù)據(jù)集群上。

淘寶、美團(tuán)、滴滴分別如何搭建大數(shù)據(jù)平臺(tái)?

此外,滴滴還重度使用HBase,并對相關(guān)產(chǎn)品(HBase、Phoenix)做了一些自定義的開發(fā),維護(hù)著一個(gè)和實(shí)時(shí)、離線兩個(gè)大數(shù)據(jù)平臺(tái)同級別的HBase平臺(tái),它的架構(gòu)圖參見圖5.12。

淘寶、美團(tuán)、滴滴分別如何搭建大數(shù)據(jù)平臺(tái)?

來自實(shí)時(shí)計(jì)算平臺(tái)和離線計(jì)算平臺(tái)的計(jì)算結(jié)果被保存到HBase中,然后應(yīng)用程序通過Phoenix訪問HBase。而Phoenix是一個(gè)構(gòu)建在HBase上的SQL引擎,可以通過SQL方式訪問HBase上的數(shù)據(jù)。


學(xué)架構(gòu)就是學(xué)架構(gòu)模式


可以看到,這些知名大廠的大數(shù)據(jù)平臺(tái)真的是大同小異,雖然由于各自場景和技術(shù)棧的不同,在大數(shù)據(jù)產(chǎn)品選型和架構(gòu)細(xì)節(jié)上略有差異,但整體思路基本上都是一樣的。

不過也正是這種大同小異,讓我們能從各個(gè)角度了解大數(shù)據(jù)平臺(tái)架構(gòu),對大數(shù)據(jù)平臺(tái)架構(gòu)有更深刻的認(rèn)知。

我在阿里巴巴工作期間,有一陣子不斷參加各種基礎(chǔ)技術(shù)產(chǎn)品的架構(gòu)評審會(huì)。有一次,另一個(gè)和我一樣經(jīng)常參加這類會(huì)議的架構(gòu)師說:“我感覺這些產(chǎn)品的架構(gòu)怎么都一樣”。經(jīng)他一提醒,大家紛紛點(diǎn)頭稱是,好像確實(shí)如此。

同一類問題的解決方案通常是相似的。一個(gè)解決方案可以解決重復(fù)出現(xiàn)的同類問題,這種解決方案就稱為模式。模式幾乎無處不在,一旦一個(gè)解決方案被證明是行之有效的,就會(huì)被重復(fù)使用解決同類的問題。

所以我們看到,很多大數(shù)據(jù)產(chǎn)品的架構(gòu)也都差不多,比如Hadoop 1、Yarn、Spark、Flink、Storm,這些產(chǎn)品的架構(gòu)部署真的是太像了。

對于有志于成為架構(gòu)師的工程師來說,一方面當(dāng)然要提高自己的編程水平,另一方面也可以多看看各種架構(gòu)設(shè)計(jì)文檔,多參加一些架構(gòu)師技術(shù)大會(huì)。在我看來,編程需要天分;而架構(gòu)設(shè)計(jì),真的是熟能生巧。

今天聯(lián)合「電子工業(yè)博文視點(diǎn)出版社」給大家?guī)?/span>3大數(shù)據(jù)技術(shù)架構(gòu):核心原理與應(yīng)用實(shí)踐技術(shù)書籍福利,免費(fèi)送給大家!感謝博文視點(diǎn)的大力贊助與支持!
抽獎(jiǎng)規(guī)則:

1、添加小編微信的前3名好友直接中獎(jiǎng)!2、掃以下二維碼回復(fù)“好書”即可獲得小編的微信

淘寶、美團(tuán)、滴滴分別如何搭建大數(shù)據(jù)平臺(tái)?

關(guān)于作者:李智慧,同程旅行交通首席架構(gòu)師。曾任阿里巴巴、Intel架構(gòu)師,長期從事分布式系統(tǒng)與大數(shù)據(jù)開發(fā),Apache Spark 代碼貢獻(xiàn)者,騰訊云 TVP,著有暢銷書《大型網(wǎng)站技術(shù)架構(gòu):核心原理與案例分析》。

?

本文節(jié)選自《大數(shù)據(jù)技術(shù)架構(gòu):核心原理與應(yīng)用實(shí)踐》(博文視點(diǎn)出品),經(jīng)出版方授權(quán)發(fā)布。

更多精彩內(nèi)容請閱讀《大數(shù)據(jù)技術(shù)架構(gòu):核心原理與應(yīng)用實(shí)踐》點(diǎn)擊上圖了解及購買

未來的生活一定是數(shù)字化的生活,掌握一些大數(shù)據(jù)技術(shù)總是好事。但本質(zhì)上它也只是一個(gè)工具,人生的旅程,既要緊跟時(shí)代,也要謹(jǐn)防隨波逐流。相信各位讀者能以《大數(shù)據(jù)技術(shù)架構(gòu):核心原理與應(yīng)用實(shí)踐》一書的內(nèi)容為起點(diǎn)而非終點(diǎn),繼續(xù)探索,走出自己的光明大道。


▼點(diǎn)擊閱讀原文,即可購買此書

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時(shí)聯(lián)系本站刪除( 郵箱:macysun@21ic.com )。
換一批
延伸閱讀

在全球汽車產(chǎn)業(yè)向電動(dòng)化、智能化轉(zhuǎn)型的浪潮中,中國電動(dòng)汽車制造商憑借完整的產(chǎn)業(yè)鏈優(yōu)勢和技術(shù)創(chuàng)新能力,正從“產(chǎn)品出?!毕颉吧鷳B(tài)出?!笨缭健N锫?lián)網(wǎng)作為連接車輛、基礎(chǔ)設(shè)施、用戶與云端的核心技術(shù),打破了地域、標(biāo)準(zhǔn)與服務(wù)的邊界,通過...

關(guān)鍵字: 物聯(lián)網(wǎng) 新能源 大數(shù)據(jù)

3月10日消息,近日,生鮮電商平臺(tái)叮咚買菜發(fā)布人事公告,宣布核心管理層重大調(diào)整。

關(guān)鍵字: 美團(tuán) 機(jī)器人 AI

在數(shù)字化浪潮席卷全球的今天,云計(jì)算、大數(shù)據(jù)、人工智能等新興技術(shù)正以前所未有的速度重塑著我們的生活與工作方式。而在這些技術(shù)的背后,虛擬化技術(shù)作為基石,默默支撐著整個(gè)IT架構(gòu)的高效運(yùn)轉(zhuǎn)。從大型企業(yè)的數(shù)據(jù)中心到個(gè)人電腦的虛擬機(jī)...

關(guān)鍵字: 虛擬化 大數(shù)據(jù)

在人工智能、自動(dòng)駕駛與大數(shù)據(jù)處理等高性能計(jì)算場景的驅(qū)動(dòng)下,傳統(tǒng)存儲(chǔ)體系面臨著速度、功耗與可靠性的三重瓶頸。作為典型的非易失性磁電存儲(chǔ)技術(shù),磁阻隨機(jī)存取存儲(chǔ)器(MRAM)憑借高速讀寫、低功耗、非易失性與高耐久性的核心優(yōu)勢,...

關(guān)鍵字: 人工智能 自動(dòng)駕駛 大數(shù)據(jù)

上海2025年12月18日 /美通社/ -- 時(shí)隔三年,美通社新傳播年度大獎(jiǎng)與論壇即將在2026年1月15日于上海舉辦。本次活動(dòng)不僅將表彰過去一年以來,在內(nèi)容創(chuàng)新、傳播策略與技術(shù)監(jiān)測等領(lǐng)域做出杰出貢獻(xiàn)的品牌與個(gè)人,還將啟...

關(guān)鍵字: AI 大數(shù)據(jù) 觸點(diǎn) NAS

在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動(dòng)力。從用戶行為追蹤到供應(yīng)鏈優(yōu)化,從市場趨勢預(yù)測到風(fēng)險(xiǎn)管控,數(shù)據(jù)的價(jià)值正以前所未有的速度被挖掘。然而,面對海量、多源、異構(gòu)的數(shù)據(jù),傳統(tǒng)IT架構(gòu)已難以滿足高效處理與分析...

關(guān)鍵字: 云計(jì)算 大數(shù)據(jù)

蘇州2025年11月27日 /美通社/ -- 由希鷗網(wǎng)主辦的第36屆華商創(chuàng)新論壇將于2026年1月11日在蘇州市會(huì)議中心隆重舉行。同期還將舉辦第十一屆金鷗獎(jiǎng)?lì)C獎(jiǎng)典禮及ABEC亞洲影響力年度創(chuàng)新盛典。本次活動(dòng)由金鷗斯瑞大數(shù)...

關(guān)鍵字: 人工智能 矩陣 大數(shù)據(jù) 網(wǎng)絡(luò)

北京2025年11月24日 /美通社/ -- 11月20日,2025 CDCC SUMMIT 中國數(shù)據(jù)中心標(biāo)準(zhǔn)大會(huì)在行業(yè)矚目下隆重召開。會(huì)上,臺(tái)達(dá)攜手美團(tuán)、秦淮數(shù)據(jù)聯(lián)合宣布,基于SST(固態(tài)變壓器)的智能直流供...

關(guān)鍵字: 智能直流供電 ST 數(shù)據(jù)中心 美團(tuán)

11月4日消息,昨日,美團(tuán)LongCat(龍貓)團(tuán)隊(duì)正式推出全新開源大模型LongCat-Flash-Omni。

關(guān)鍵字: 美團(tuán) 機(jī)器人 AI

在當(dāng)今數(shù)字化浪潮中,智算時(shí)代正以前所未有的速度席卷而來。隨著人工智能、大數(shù)據(jù)、云計(jì)算等前沿技術(shù)的迅猛發(fā)展,對算力的需求呈指數(shù)級增長。數(shù)據(jù)中心作為算力的核心承載平臺(tái),其規(guī)模和復(fù)雜度不斷攀升,而由此帶來的散熱問題成為了制約行...

關(guān)鍵字: 算力 人工智能 大數(shù)據(jù)
關(guān)閉