日本黄色一级经典视频|伊人久久精品视频|亚洲黄色色周成人视频九九九|av免费网址黄色小短片|黄色Av无码亚洲成年人|亚洲1区2区3区无码|真人黄片免费观看|无码一级小说欧美日免费三级|日韩中文字幕91在线看|精品久久久无码中文字幕边打电话

當(dāng)前位置:首頁 > 單片機 > 架構(gòu)師社區(qū)
[導(dǎo)讀]為什么很多看起來不是很復(fù)雜的網(wǎng)站,比如 Facebook 需要大量頂尖高手來開發(fā)?


為什么很多看起來不是很復(fù)雜的網(wǎng)站,比如 Facebook 需要大量頂尖高手來開發(fā)?

子柳:

就拿淘寶來說說,當(dāng)作給新人一些科普。

先說你看到的頁面上,最重要的幾個:

  • 搜索商品:這個功能,如果你有幾千條商品,完全可以用select * from tableXX where title like %XX%這樣的操作來搞定。但是——當(dāng)你有10000000000(一百億)條商品的時候,任何一個數(shù)據(jù)庫都無法存放了,請問你怎么搜索?這里需要用到分布式的數(shù)據(jù)存儲方案,另外這個搜索也不可能直接從數(shù)據(jù)庫里來取數(shù)據(jù),必然要用到搜索引擎(簡單來說搜索引擎更快)。好,能搜出商品了,是否大功告成可以啵一個了呢?早著呢,誰家的商品出現(xiàn)在第一頁?這里需要用到巨復(fù)雜的排序算法。要是再根據(jù)你的購買行為做一些個性化的推薦——這夠一幫牛叉的算法工程師奮斗終生了。

  • 商品詳情:就是搜索完畢,看到你感興趣的,點擊查看商品的頁面,這個頁面有商品的屬性、詳細(xì)描述、評價、賣家信息等等,這個頁面的每天展示次數(shù)在30億以上,同樣的道理,如果你做一個網(wǎng)站每天有10個人訪問,你絲毫感覺不到服務(wù)器的壓力,但是30億,要解決的問題就多了去了。首先,這些請求不能直接壓到數(shù)據(jù)庫上,任何單機或分布式的數(shù)據(jù)庫,承受30億每天的壓力,都將崩潰到完全沒有幸福感,這種情況下要用到的技術(shù)就是大規(guī)模的分布式緩存,所有的賣家信息、評價信息、商品描述都是從緩存里面來取到的,甚至更加極致的一點“商品的瀏覽量”這個信息,每打開頁面一次都要刷新,你猜能夠從緩存里面來取嗎?淘寶做到了,整個商品的詳情都在緩存里面。

  • 商品圖片:一個商品有5個圖片,商品描述里面有更多圖片,你猜淘寶有多少張圖片要存儲?100億以上。這么多圖片要是在你的硬盤里面,你怎么去查找其中的一張?要是你的同學(xué)想拷貝你的圖片,你需要他準(zhǔn)備多少塊硬盤?你需要配置多少大的帶寬?你們的網(wǎng)卡是否能夠承受?你需要多長時間拷貝給他?這樣的規(guī)模,很不幸市面上已經(jīng)沒有任何商業(yè)的解決方案,最終我們必須自己來開發(fā)一套存儲系統(tǒng),如果你聽說過google的GFS,我們跟他類似,叫TFS。順便說一下,騰訊也有這樣的一套,也叫TFS。

  • 廣告系統(tǒng):淘寶上有很多廣告,什么,你不知道?那說明我們的廣告做的還不錯,居然很多人不認(rèn)為它是廣告,賣家怎么出價去買淘寶的廣告位?廣告怎么展示?怎么查看廣告效果?這又是一套算法精奇的系統(tǒng)。

  • BOSS系統(tǒng):淘寶的工作人員怎么去管理這么龐大的一個系統(tǒng),例如某時刻突然宣布某位作家的作品全部從淘寶消失,從數(shù)據(jù)庫到搜索引擎到廣告系統(tǒng),里面的相關(guān)數(shù)據(jù)在幾分鐘內(nèi)全部消失,這又需要一個牛叉的后臺支撐系統(tǒng)。

  • 運維體系:支持這么龐大的一個網(wǎng)站,你猜需要多少臺服務(wù)器?幾千臺?那是零頭。這么多服務(wù)器,上面部署什么操作系統(tǒng),操作系統(tǒng)的內(nèi)核能否優(yōu)化?Java虛擬機能否優(yōu)化?通信模塊有沒有榨取性能的空間?軟件怎么部署上去?出了問題怎么回滾?你裝過操作系統(tǒng)吧,優(yōu)化過吧,被360坑過沒,崩潰過沒?這里面又有很多門道。

不再多寫了,除了上面提到的這些,還有很多很多需要做的技術(shù),當(dāng)然并不是這些東西有多么高不可攀,任何復(fù)雜的龐大的東西都是從小到大做起來的,里面需要牛叉到不行的大犇,也需要充滿好奇心的菜鳥,最后這一句,你當(dāng)我是別有用心好了。

知乎網(wǎng)友@蔡正海 :

剛看了一篇很有意思的文章,講的很清楚——《你剛才在淘寶上買了一件東西》

你發(fā)現(xiàn)快要過年了,于是想給你的女朋友買一件毛衣,你打開了淘寶網(wǎng)址。這時你的瀏覽器首先查詢DNS服務(wù)器,將淘寶網(wǎng)址轉(zhuǎn)換成ip地址。不過首先你會發(fā)現(xiàn),你在不同的地區(qū)或者不同的網(wǎng)絡(luò)(電信、聯(lián)通、移動)的情況下,轉(zhuǎn)換后的IP地址很可能是 不一樣的,這首先涉及到負(fù)載均衡的第一步,通過DNS解析域名時將你的訪問分配到不同的入口,同時盡可能保證你所訪問的入口是所有入口中可能較快的一個 (這和后文的CDN不一樣)。

你通過這個入口成功的訪問了淘寶官網(wǎng)的實際的入口IP地址。這時你產(chǎn)生了一個PV,即Page View,頁面訪問。每日每個網(wǎng)站的總PV量是形容一個網(wǎng)站規(guī)模的重要指標(biāo)。淘寶網(wǎng)全網(wǎng)在平日(非促銷期間)的PV大概是16-25億之間。同時作為一個獨立的用戶,你這次訪問淘寶網(wǎng)的所有頁面,均算作一個UV(Unique Visitor用戶訪問)。最近臭名昭著的12306的日PV量最高峰在10億左右,而UV量卻遠(yuǎn)小于淘寶網(wǎng)十余倍,這其中的原因我相信大家都會知道。

因為同一時刻訪問淘寶的人數(shù)過于巨大,所以即便是生成淘寶首頁頁面的服務(wù)器,也不可能僅有一臺。僅用于生成淘寶官網(wǎng)首頁的服務(wù)器就可能有成百上千臺,那么你的一次訪問時生成頁面給你看的任務(wù)便會被分配給其中一臺服務(wù)器完成。這個過程要保證公正、公平、平均(暨這成百上千臺服務(wù)器每臺負(fù)擔(dān)的用戶數(shù)要差不多),這一很復(fù)雜的過程是由幾個系統(tǒng)配合完成,其中最關(guān)鍵的便是LVS(Linux Virtual Server),世界上最流行的負(fù)載均衡系統(tǒng)之一,正是由目前在淘寶網(wǎng)供職的章文嵩博士開發(fā)的。

經(jīng)過一系列復(fù)雜的邏輯運算和數(shù)據(jù)處理,用于這次給你看的淘寶網(wǎng)首頁的HTML內(nèi)容便生成成功了。對web前端稍微有點常識的童鞋都應(yīng)該知道,下一步瀏覽器會去加載頁面中用到的css、js、圖片、腳本和資源文件。但是可能相對較少的同學(xué)才會知道,你的瀏覽器在同一個域名下并發(fā)加載的資源數(shù)量是有限制的,例如IE6-7是兩個,IE8是6個,Chrome各版本不大一樣,一般是4-6個。我剛剛看了一下,我訪問淘寶網(wǎng)首頁需要加載126個資源,那么如此小的并發(fā)連接數(shù)自然會加載很久。所以前端開發(fā)人員往往會將上述這些資源文件分布在好多個域名下,變相的繞過瀏覽器的這個限制,同時也為下文的CDN工作做準(zhǔn)備。

據(jù)不可靠消息,在雙十一當(dāng)天高峰,淘寶的訪問流量最巔峰達到871GB/S。這個數(shù)字意味著需要178萬個4Mb帶寬的家庭寬帶才能負(fù)擔(dān)的起,也完全有能力拖垮一個中小城市的全部互聯(lián)網(wǎng)帶寬。那么顯然,這些訪問流量不可能集中在一起。并且大家都知道,不同地區(qū)不同網(wǎng)絡(luò)(電信、聯(lián)通等)之間互訪會非常緩慢,但是你卻發(fā)現(xiàn)很少發(fā)現(xiàn)淘寶網(wǎng)訪問緩慢。這便是CDN(Content Delivery Network),即內(nèi)容分發(fā)網(wǎng)絡(luò)的作用。淘寶在全國各地建立了數(shù)十上百個CDN節(jié)點,利用一些手段保證你訪問的(這里主要指js、css、圖片等)地方是離你最近的CDN節(jié)點,這樣便保證了大流量分散在各地訪問的加速節(jié)點上。

這便出現(xiàn)了一個問題,那就是假若一個賣家發(fā)布了一個新的寶貝,上傳了幾張新的寶貝圖片,那么淘寶網(wǎng)如何保證全國各地的CDN節(jié)點中都會同步的存在這幾張圖 片供用戶使用呢?這里邊就涉及到了大量的內(nèi)容分發(fā)與同步的相關(guān)技術(shù)。淘寶開發(fā)了分布式文件系統(tǒng)TFS(Taobao File System)來處理這類問題。

好了,這時你終于加載完了淘寶首頁,那么你習(xí)慣性的在首頁搜索框中輸入了'毛衣'二字并敲回車,這時你又產(chǎn)生了一個PV,然后,淘寶網(wǎng)的主搜索系統(tǒng)便開始為你服務(wù)了。它首先對你輸入的內(nèi)容基于一個分詞庫進行分詞操作。眾所周知,英文是以詞為單位的,詞和詞之間是靠空格隔開,而中文是以字為單位,句子中所有的字連起來才能描述一個意思。例如,英文句子I am a student,用中文則為:“我是一個學(xué)生”。計算機可以很簡單通過空格知道student是一個單詞,但是不能很容易明白“學(xué)”、“生”兩個字合起來才表示一個詞。把中文的漢字序列切分成有意義的詞,就是中文分詞,有些人也稱為切詞。我是一個學(xué)生,分詞的結(jié)果是:我 是 一個學(xué)生。

進行分詞之后,還需要根據(jù)你輸入的搜索詞進行你的購物意圖分析。用戶進行搜索時常常有如下幾類意圖:

  • 瀏覽型:沒有明確的購物對象和意圖,邊看邊買,用戶比較隨意和感性。Query例如:”2010年10大香水排行”,”2010年流行毛衣”, “zippo有多少種類?”;

  • 查詢型:有一定的購物意圖,體現(xiàn)在對屬性的要求上。Query例如:”適合老人用的手機”,”500元 手表”;

  • 對比型:已經(jīng)縮小了購物意圖,具體到了某幾個產(chǎn)品。Query例如:”諾基亞E71 E63″,”akg k450 px200″;

  • 確定型:已經(jīng)做了基本決定,重點考察某個對象。Query例如:”諾基亞N97″,”IBM T60″。通過對你的購物意圖的分析,主搜索會呈現(xiàn)出完全不同的結(jié)果來。

之后的數(shù)個步驟后,主搜索系統(tǒng)便根據(jù)上述以及更多復(fù)雜的條件列出了搜索結(jié)果,這一切是由一千多臺搜索服務(wù)器完成。然后你開始逐一點擊瀏覽搜索出的寶貝。你開始查看寶貝詳情頁面。經(jīng)常網(wǎng)購的親們會發(fā)現(xiàn),當(dāng)你買過了一個寶貝之后,即便是商家多次修改了寶貝詳情頁,你仍然能夠通過‘已買到的寶貝’查看當(dāng)時的快照。這是為了防止商家對在商品詳情中承諾過的東西賴賬不認(rèn)。那么顯然,對于每年數(shù)十上百億比交易的商品詳情快照進行保存和快速調(diào)用不是一個簡單的事情。這 其中又涉及到數(shù)套系統(tǒng)的共同協(xié)作,其中較為重要的是Tair,淘寶自行研發(fā)的分布式KV存儲方案。

然后無論你是否真正進行了交易,你的這些訪問行為便忠實的被系統(tǒng)記錄下來,用于后續(xù)的業(yè)務(wù)邏輯和數(shù)據(jù)分析。這些記錄中訪問日志記錄便是最重要的記錄之一, 但是前邊我們得知,這些訪問是分布在各個地區(qū)很多不同的服務(wù)器上的,并且由于用戶眾多,這些日志記錄都非常龐大,達到TB級別非常正常。那么為了快速及時 傳輸同步這些日志數(shù)據(jù),淘寶研發(fā)了TimeTunnel,用于進行實時的數(shù)據(jù)傳輸,交給后端系統(tǒng)進行計算報表等操作。

你的瀏覽數(shù)據(jù)、交易數(shù)據(jù)以及其它很多很多的數(shù)據(jù)記錄均會被保留下來。

使得淘寶存儲的歷史數(shù)據(jù)輕而易舉的便達到了十?dāng)?shù)甚至更多個PB(1PB=1024TB=1048576GB)。如此巨大的數(shù)據(jù)量經(jīng)過淘寶系統(tǒng)1:120的極限壓縮存儲在淘寶的數(shù)據(jù)倉庫中。并且通過一個叫做云梯的,由2000多臺服務(wù)器組成的超大規(guī)模數(shù)據(jù)系統(tǒng)不斷的進行分析和挖掘。

從這些數(shù)據(jù)中淘寶能夠知道小到你是誰,你喜歡什么,你的孩子幾歲了,你是否在談戀愛,喜歡玩魔獸世界的人喜歡什么樣的飲料等,大到各行各業(yè)的零售情況、各類商品的興衰消亡等等海量的信息。

說了這么多,其實也只是敘述了淘寶上正在運行的成千上萬個系統(tǒng)中的寥寥幾個。即便是你僅僅訪問一次淘寶的首頁,所涉及到的技術(shù)和系統(tǒng)規(guī)模都是你完全無法想 象的,是淘寶2000多名頂級的工程師們的心血結(jié)晶,其中甚至包括長江學(xué)者、國家科學(xué)技術(shù)最高獎得主等眾多大牛。同樣,百度、騰訊等的業(yè)務(wù)系統(tǒng)也絕不比淘寶簡單。你需要知道的是,你每天使用的互聯(lián)網(wǎng)產(chǎn)品,看似簡單易用,背后卻凝聚著難以想象的智慧與勞動。


    

免責(zé)聲明:本文內(nèi)容由21ic獲得授權(quán)后發(fā)布,版權(quán)歸原作者所有,本平臺僅提供信息存儲服務(wù)。文章僅代表作者個人觀點,不代表本平臺立場,如有問題,請聯(lián)系我們,謝謝!

本站聲明: 本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除( 郵箱:macysun@21ic.com )。
換一批
延伸閱讀

Facebook 母公司 Meta 發(fā)布 2025 財年第三季度未經(jīng)審計財報。報告顯示,公司當(dāng)期凈利潤僅 27.09 億美元,較去年同期的 156.88 億美元大幅下滑 83%,每股攤薄收益 1.05 美元,核心盈利指標(biāo)...

關(guān)鍵字: Meta 稅務(wù) Facebook

7 月 7 日,OpenAI 向投資者披露的一組數(shù)據(jù)震驚行業(yè):去年股權(quán)激勵支出飆升至 44 億美元,占同期營收的 119%。這一數(shù)字不僅遠(yuǎn)超谷歌、Facebook 等科技巨頭上市前的水平,更暴露出 AI 行業(yè)人才戰(zhàn)爭的白...

關(guān)鍵字: OpenAI AI 谷歌 Facebook Meta

Facebook是使用最廣泛的社交媒體應(yīng)用程序之一,它不僅用于社交網(wǎng)絡(luò),還用于消息傳遞,視頻通話,語音通話,市場等。Facebook的這些功能在構(gòu)建任何基于物聯(lián)網(wǎng)的項目時都非常有用。就像在這里,我們將使用Facebook...

關(guān)鍵字: ESP8266 Facebook 機器人 物聯(lián)網(wǎng)

業(yè)內(nèi)消息,據(jù)阿里巴巴內(nèi)部人士透露,1688 近期啟動全面入淘,先期開設(shè)三家店鋪,后續(xù)這些店鋪將整合成一個類似天貓超市的頻道,并在淘寶推出 1688 嚴(yán)選貼牌的源頭廠貨。這意味著,1688 將攜帶百萬源頭廠商直接入駐淘寶。

關(guān)鍵字: 阿里巴巴 1688 淘寶

近日,社交媒體巨頭Meta(Facebook)創(chuàng)始人馬克?扎克伯格將其價值3億美金的超級游艇開到了美國,這艘游艇名為“Project 1010”,目前位于佛羅里達州勞德代爾的埃弗格萊斯港,此舉恰逢其40歲生日之前,引發(fā)外...

關(guān)鍵字: 扎克伯格 Meta Facebook

業(yè)內(nèi)消息,本周億航智能設(shè)備(廣州)有限公司在淘寶上架了生產(chǎn)的EH216-S無人駕駛載人航空器,售價239萬元/架,庫存僅一件。值得一提的是,EH216-S在淘寶一度處于商品被拍下但無人付款的情況,其他消費者也無法下單,該...

關(guān)鍵字: 淘寶 無人駕駛航空器 H216-S 億航

業(yè)內(nèi)消息,近日蘇寧易購集團股份有限公司發(fā)布公告稱,該公司股東淘寶(中國)軟件有限公司擬將其持有的公司18.61億股股份(占公司總股本的19.99%),全部轉(zhuǎn)讓給杭州灝月企業(yè)管理有限公司,每股轉(zhuǎn)讓價格為1.53元,轉(zhuǎn)讓價款...

關(guān)鍵字: 淘寶 實體 零售

最新消息,淘寶與華為官宣簽署鴻蒙合作,將基于 HarmonyOS NEXT啟動鴻蒙原生應(yīng)用開發(fā),以增強電商領(lǐng)域的鴻蒙生態(tài),并打造全場景購物體驗。目前,鴻蒙生態(tài)已進入第二階段,有200+伙伴加速鴻蒙化,覆蓋多個領(lǐng)域,鴻蒙原...

關(guān)鍵字: 華為 淘寶 HarmonyOS 鴻蒙原生應(yīng)用

業(yè)內(nèi)消息,昨天阿里巴巴宣布,阿里巴巴集團CEO、淘天集團董事長吳泳銘兼任淘天集團CEO,淘天集團原CEO戴珊將協(xié)助籌建阿里巴巴集團資產(chǎn)管理公司,調(diào)整即日生效。阿里巴巴集團董事會主席蔡崇信通過全員信宣布了這項任命。

關(guān)鍵字: 淘寶 天貓 阿里巴巴

Facebook是一家全球知名的社交媒體公司,近年來也在智能音箱領(lǐng)域有所布局。Facebook的智能音箱產(chǎn)品主要包括 Portal 和 Portal Plus,以下是具體介紹:

關(guān)鍵字: Facebook 智能音箱 Portal
關(guān)閉