日本黄色一级经典视频|伊人久久精品视频|亚洲黄色色周成人视频九九九|av免费网址黄色小短片|黄色Av无码亚洲成年人|亚洲1区2区3区无码|真人黄片免费观看|无码一级小说欧美日免费三级|日韩中文字幕91在线看|精品久久久无码中文字幕边打电话

當(dāng)前位置:首頁(yè) > > 架構(gòu)師社區(qū)
[導(dǎo)讀]當(dāng)業(yè)務(wù)規(guī)模達(dá)到一定規(guī)模之后,像淘寶日訂單量在5000萬(wàn)單以上,美團(tuán)3000萬(wàn)單以上。數(shù)據(jù)庫(kù)面對(duì)海量的數(shù)據(jù)壓力,分庫(kù)分表就是必須進(jìn)行的操作了。而分庫(kù)分表之后一些常規(guī)的查詢可能都會(huì)產(chǎn)生問(wèn)題,最常見(jiàn)的就是比如分頁(yè)查詢的問(wèn)題。一般我們把分表的字段稱作shardingkey,比如訂單表按照用戶ID作為shardingkey,那么如果查詢條件中不帶用戶ID查詢?cè)趺醋龇猪?yè)?又比如更多的多維度的查詢都沒(méi)有shardingkey又怎么查詢?

當(dāng)業(yè)務(wù)規(guī)模達(dá)到一定規(guī)模之后,像淘寶日訂單量在5000萬(wàn)單以上,美團(tuán)3000萬(wàn)單以上。數(shù)據(jù)庫(kù)面對(duì)海量的數(shù)據(jù)壓力,分庫(kù)分表就是必須進(jìn)行的操作了。而分庫(kù)分表之后一些常規(guī)的查詢可能都會(huì)產(chǎn)生問(wèn)題,最常見(jiàn)的就是比如分頁(yè)查詢的問(wèn)題。一般我們把分表的字段稱作shardingkey,比如訂單表按照用戶ID作為shardingkey,那么如果查詢條件中不帶用戶ID查詢?cè)趺醋龇猪?yè)?又比如更多的多維度的查詢都沒(méi)有shardingkey又怎么查詢?

唯一主鍵

一般我們數(shù)據(jù)庫(kù)的主鍵都是自增的,那么分表之后主鍵沖突的問(wèn)題就是一個(gè)無(wú)法避免的問(wèn)題,最簡(jiǎn)單的辦法就是以一個(gè)唯一的業(yè)務(wù)字段作為唯一的主鍵,比如訂單表的訂單號(hào)肯定是全局唯一的。

常見(jiàn)的分布式生成唯一ID的方式很多,最常見(jiàn)的雪花算法Snowflake、滴滴Tinyid、美團(tuán)Leaf。以雪花算法舉例來(lái)說(shuō),一毫秒可以生成4194304多個(gè)ID。

第一位不使用,默認(rèn)都是0,41位時(shí)間戳精確到毫秒,可以容納69年的時(shí)間,10位工作機(jī)器ID高5位是數(shù)據(jù)中心ID,低5位是節(jié)點(diǎn)ID,12位序列號(hào)每個(gè)節(jié)點(diǎn)每毫秒累加,累計(jì)可以達(dá)到2^12 4096個(gè)ID。

百億級(jí)數(shù)據(jù)分表后怎么分頁(yè)查詢?

分表

第一步,分表后要怎么保證訂單號(hào)的唯一搞定了,現(xiàn)在考慮下分表的問(wèn)題。首先根據(jù)自身的業(yè)務(wù)量和增量來(lái)考慮分表的大小。

舉個(gè)例子,現(xiàn)在我們?nèi)諉瘟渴?0萬(wàn)單,預(yù)估一年后可以達(dá)到日100萬(wàn)單,根據(jù)業(yè)務(wù)屬性,一般我們就支持查詢半年內(nèi)的訂單,超過(guò)半年的訂單需要做歸檔處理。

那么以日訂單100萬(wàn)半年的數(shù)量級(jí)來(lái)看,不分表的話我們訂單量將達(dá)到100萬(wàn)X180=1.8億,以這個(gè)數(shù)據(jù)量級(jí)部分表的話肯定單表是扛不住的,就算你能扛RT的時(shí)間你也根本無(wú)法接受吧。根據(jù)經(jīng)驗(yàn)單表幾百萬(wàn)的數(shù)量對(duì)于數(shù)據(jù)庫(kù)是沒(méi)什么壓力的,那么只要分256張表就足夠了,1.8億/256≈70萬(wàn),如果為了保險(xiǎn)起見(jiàn),也可以分到512張表。那么考慮一下,如果業(yè)務(wù)量再增長(zhǎng)10倍達(dá)到1000萬(wàn)單每天,分表1024就是比較合適的選擇。

通過(guò)分表加上超過(guò)半年的數(shù)據(jù)歸檔之后,單表70萬(wàn)的數(shù)據(jù)就足以應(yīng)對(duì)大部分場(chǎng)景了。接下來(lái)對(duì)訂單號(hào)hash,然后對(duì)256取模的就可以落到具體的哪張表了。

百億級(jí)數(shù)據(jù)分表后怎么分頁(yè)查詢?

那么,因?yàn)槲ㄒ恢麈I都是以訂單號(hào)作為依據(jù),以前你寫的那些根據(jù)主鍵ID做查詢的就不能用了,這就涉及到了歷史一些查詢功能的修改。不過(guò)這都不是事兒對(duì)吧,都改成以訂單號(hào)來(lái)查就行了。這都不是問(wèn)題,問(wèn)題在我們的標(biāo)題說(shuō)的點(diǎn)上。

C端查詢

說(shuō)了半天,總算到了正題了,那么分表之后查詢和分頁(yè)查詢的問(wèn)題怎么解決?

首先說(shuō)帶shardingkey的查詢,比如就通過(guò)訂單號(hào)查詢,不管你分頁(yè)還是怎么樣都是能直接定位到具體的表來(lái)查詢的,顯然查詢是不會(huì)有什么問(wèn)題的。

如果不是shardingkey的話,上面舉例說(shuō)的以訂單號(hào)作為shardingkey的話,像APP、小程序這種一般都是通過(guò)用戶ID查詢,那這時(shí)候我們通過(guò)訂單號(hào)做的sharding怎么辦?很多公司訂單表直接用用戶ID做shardingkey,那么很簡(jiǎn)單,直接查就完了。那么訂單號(hào)怎么辦,一個(gè)很簡(jiǎn)單的辦法就是在訂單號(hào)上帶上用戶ID的屬性。舉個(gè)很簡(jiǎn)單的例子,原本41位的時(shí)間戳你覺(jué)得用不完,用戶ID是10位的,訂單號(hào)的生成規(guī)則帶上用戶ID,落具體表的時(shí)候根據(jù)訂單號(hào)中10位用戶ID hash取模,這樣無(wú)論根據(jù)訂單號(hào)還是用戶ID查詢效果都是一樣的。

當(dāng)然,這種方式只是舉例,具體的訂單號(hào)生成的規(guī)則,多少位,包含哪些因素根據(jù)自己的業(yè)務(wù)和實(shí)現(xiàn)機(jī)制來(lái)決定。

百億級(jí)數(shù)據(jù)分表后怎么分頁(yè)查詢?

好,那么無(wú)論你是訂單號(hào)還是用戶ID作為shardingkey,按照以上的兩種方式都可以解決問(wèn)題了。那么還有一個(gè)問(wèn)題就是如果既不是訂單號(hào)又不是用戶ID查詢?cè)趺崔k?最直觀的例子就是來(lái)自商戶端或者后臺(tái)的查詢,商戶端都是以商戶或者說(shuō)賣家的ID作為查詢條件來(lái)查的,后臺(tái)的查詢條件可能就更復(fù)雜了,像我碰到的有些后臺(tái)查詢條件能有幾十個(gè),這怎么查???別急,接下來(lái)分開說(shuō)B端和后臺(tái)的復(fù)雜查詢。

現(xiàn)實(shí)中真正的流量大頭都是來(lái)自于用戶端C端,所以本質(zhì)上解決了用戶端的問(wèn)題,這個(gè)問(wèn)題就解了大半,剩下來(lái)自商戶賣家端B端、后臺(tái)支持運(yùn)營(yíng)業(yè)務(wù)的查詢流量并不會(huì)很大,這個(gè)問(wèn)題就好解。

其他端查詢

針對(duì)B端的非shardingkey的查詢有兩個(gè)辦法解決。

雙寫,雙寫就是下單的數(shù)據(jù)落兩份,C端和B端的各自保存一份,C端用你可以用單號(hào)、用戶ID做shardingkey都行,B端就用商家賣家的ID作為shardingkey就好了。有些同學(xué)會(huì)說(shuō)了,你雙寫不影響性能嗎?因?yàn)閷?duì)于B端來(lái)說(shuō)輕微的延遲是可以接受的,所以可以采取異步的方式去落B端訂單。你想想你去淘寶買個(gè)東西下單了,賣家稍微延遲個(gè)一兩秒收到這個(gè)訂單的消息有什么關(guān)系嗎?你點(diǎn)個(gè)外賣商戶晚一兩秒收到這個(gè)訂單有什么太大影響嗎?

百億級(jí)數(shù)據(jù)分表后怎么分頁(yè)查詢?

這是一個(gè)解決方案,另外一個(gè)方案就是走離線數(shù)倉(cāng)或者ES查詢,訂單數(shù)據(jù)落庫(kù)之后,不管你通過(guò)binlog還是MQ消息的都形式,把數(shù)據(jù)同步到數(shù)倉(cāng)或者ES,他們支持的數(shù)量級(jí)對(duì)于這種查詢條件來(lái)說(shuō)就很簡(jiǎn)單了。同樣這種方式肯定是稍微有延遲的,但是這種可控范圍的延遲是可以接受的。

百億級(jí)數(shù)據(jù)分表后怎么分頁(yè)查詢?

而針對(duì)管理后臺(tái)的查詢,比如運(yùn)營(yíng)、業(yè)務(wù)、產(chǎn)品需要看數(shù)據(jù),他們天然需要復(fù)雜的查詢條件,同樣走ES或者數(shù)倉(cāng)都可以做得到。如果不用這個(gè)方案,又要不帶shardingkey的分頁(yè)查詢,兄弟,這就只能掃全表查詢聚合數(shù)據(jù),然后手動(dòng)做分頁(yè)了,但是這樣查出來(lái)的結(jié)果是有限制的。

比如你256個(gè)片,查詢的時(shí)候循環(huán)掃描所有的分片,每個(gè)片取20條數(shù)據(jù),最后聚合數(shù)據(jù)手工分頁(yè),那必然是不可能查到全量的數(shù)據(jù)的。

總結(jié)

分庫(kù)分表后的查詢問(wèn)題,對(duì)于有經(jīng)驗(yàn)的同學(xué)來(lái)說(shuō)其實(shí)這個(gè)問(wèn)題都知道,但是我相信其實(shí)大部分同學(xué)做的業(yè)務(wù)可能都沒(méi)來(lái)到這個(gè)數(shù)量級(jí),分庫(kù)分表可能都停留在概念階段,面試被問(wèn)到后就手足無(wú)措了,因?yàn)闆](méi)有經(jīng)驗(yàn)不知道怎么辦。

分庫(kù)分表首先是基于現(xiàn)有的業(yè)務(wù)量和未來(lái)的增量做出判斷,比如拼多多這種日單量5000萬(wàn)的,半年數(shù)據(jù)得有百億級(jí)別了,那都得分到4096張表了對(duì)吧,但是實(shí)際的操作是一樣的,對(duì)于你們的業(yè)務(wù)分4096那就沒(méi)有必要了,根據(jù)業(yè)務(wù)做出合理的選擇。

對(duì)于基于shardingkey的查詢我們可以很簡(jiǎn)單的解決,對(duì)于非shardingkey的查詢可以通過(guò)落雙份數(shù)據(jù)和數(shù)倉(cāng)、ES的方案來(lái)解決,當(dāng)然,如果分表后數(shù)據(jù)量很小的話,建好索引,掃全表查詢其實(shí)也不是什么問(wèn)題。

- END -

特別推薦一個(gè)分享架構(gòu)+算法的優(yōu)質(zhì)內(nèi)容,還沒(méi)關(guān)注的小伙伴,可以長(zhǎng)按關(guān)注一下:

百億級(jí)數(shù)據(jù)分表后怎么分頁(yè)查詢?

百億級(jí)數(shù)據(jù)分表后怎么分頁(yè)查詢?

百億級(jí)數(shù)據(jù)分表后怎么分頁(yè)查詢?

長(zhǎng)按訂閱更多精彩▼

百億級(jí)數(shù)據(jù)分表后怎么分頁(yè)查詢?

如有收獲,點(diǎn)個(gè)在看,誠(chéng)摯感謝

免責(zé)聲明:本文內(nèi)容由21ic獲得授權(quán)后發(fā)布,版權(quán)歸原作者所有,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。文章僅代表作者個(gè)人觀點(diǎn),不代表本平臺(tái)立場(chǎng),如有問(wèn)題,請(qǐng)聯(lián)系我們,謝謝!

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除( 郵箱:macysun@21ic.com )。
換一批
延伸閱讀

全球嵌入式技術(shù)領(lǐng)域的年度盛會(huì)2026嵌入式世界展(Embedded World 2026,簡(jiǎn)稱EW26)于3月10日至12日在德國(guó)紐倫堡成功舉辦。作為物聯(lián)網(wǎng)和邊緣AI領(lǐng)域的領(lǐng)先企業(yè),Silicon Labs(亦稱“芯科科...

關(guān)鍵字: 物聯(lián)網(wǎng) 邊緣AI 嵌入式

3月10日至12日,2026年嵌入式世界展(Embedded World 2026,簡(jiǎn)稱EW26)在德國(guó)紐倫堡展覽中心成功舉辦。作為領(lǐng)先的邊緣AI與智能音頻等媒體處理技術(shù)和芯片解決方案提供商,XMOS以沉浸式演示與技術(shù)交...

關(guān)鍵字: 邊緣AI 智能音頻 嵌入式

在嵌入式系統(tǒng)開發(fā)中,SoC(System on Chip)的多樣性始終是橫亙?cè)陂_發(fā)者面前的難題。以某工業(yè)物聯(lián)網(wǎng)網(wǎng)關(guān)項(xiàng)目為例,其需同時(shí)支持NXP i.MX8M、Rockchip RK3566和Allwinner H616三...

關(guān)鍵字: Platform Driver模型 嵌入式

在高性能網(wǎng)絡(luò)編程領(lǐng)域,事件驅(qū)動(dòng)模型以其高效的I/O多路復(fù)用能力成為主流范式。不同于傳統(tǒng)的多線程/多進(jìn)程阻塞模型,事件驅(qū)動(dòng)通過(guò)單一線程監(jiān)聽(tīng)多個(gè)文件描述符的狀態(tài)變化,以非阻塞方式處理I/O事件,顯著減少了上下文切換開銷和資源...

關(guān)鍵字: 事件驅(qū)動(dòng) C語(yǔ)言

在非易失性存儲(chǔ)器領(lǐng)域,EEPROM(電可擦除可編程只讀存儲(chǔ)器)曾長(zhǎng)期占據(jù)主流地位,廣泛應(yīng)用于各類電子設(shè)備的參數(shù)存儲(chǔ)、日志記錄等場(chǎng)景。但隨著工業(yè)控制、汽車電子、醫(yī)療設(shè)備等領(lǐng)域?qū)Υ鎯?chǔ)性能提出更高要求,F(xiàn)RAM(鐵電隨機(jī)存取存...

關(guān)鍵字: 存儲(chǔ)器 可編程 嵌入式

康佳特將aReady.COM擴(kuò)展至Arm架構(gòu)模塊,基于恩智浦i.MX 95處理器打造應(yīng)用就緒的軟硬件構(gòu)建模塊,集成操作系統(tǒng)、系統(tǒng)整合與IoT連接能力,賦能高價(jià)值應(yīng)用快速落地

關(guān)鍵字: 處理器 IoT 嵌入式

3月12日,2026年中國(guó)家電及消費(fèi)電子博覽會(huì)(以下簡(jiǎn)稱:AWE 2026)在上海盛大開幕。展會(huì)現(xiàn)場(chǎng),場(chǎng)景化、系統(tǒng)化、一體化的家電解決方案成為行業(yè)焦點(diǎn),消費(fèi)者對(duì)家電的關(guān)注也已從基礎(chǔ)的尺寸匹配,延伸至對(duì)“空間秩序感”和“視...

關(guān)鍵字: 消費(fèi)電子 蒸烤箱 嵌入式

超高效NPU IP在資源受限設(shè)備中推進(jìn)邊緣AI,因而獲得認(rèn)可

關(guān)鍵字: 人工智能 嵌入式 NPU

上海2026年3月12日 /美通社/ -- 3月12日,2026中國(guó)家電及消費(fèi)電子博覽會(huì)(AWE 2026)在上海新國(guó)際博覽中心和東方樞紐國(guó)際商務(wù)合作區(qū)展區(qū)正式啟幕。本屆展會(huì)以"AI科技?慧享未來(lái)"為...

關(guān)鍵字: 西門子 博世 嵌入式 洗碗機(jī)
關(guān)閉