日本黄色一级经典视频|伊人久久精品视频|亚洲黄色色周成人视频九九九|av免费网址黄色小短片|黄色Av无码亚洲成年人|亚洲1区2区3区无码|真人黄片免费观看|无码一级小说欧美日免费三级|日韩中文字幕91在线看|精品久久久无码中文字幕边打电话

當前位置:首頁 > > 架構(gòu)師社區(qū)
[導讀]當我們發(fā)現(xiàn)SQL執(zhí)行很慢的時候,自然而然想到的就是加索引。

前言

當我們發(fā)現(xiàn)SQL執(zhí)行很慢的時候,自然而然想到的就是加索引。對于范圍查詢,索引的底層結(jié)構(gòu)就是B+樹。今天我們一起來學習一下B+樹哈~

  • 樹簡介、樹種類
  • B-樹、B+樹簡介
  • B+樹插入
  • B+樹查找
  • B+樹刪除
  • B+樹經(jīng)典面試題

樹的簡介

樹的簡介

樹跟數(shù)組、鏈表、堆棧一樣,是一種數(shù)據(jù)結(jié)構(gòu)。它由有限個節(jié)點,組成具有層次關系的集合。因為它看起來像一棵樹,所以得其名。一顆普通的樹如下:

MySQL索引底層:B+樹詳解

樹是包含n(n為整數(shù),大于0)個結(jié)點, n-1條邊的有窮集,它有以下特點:

  • 每個結(jié)點或者無子結(jié)點或者只有有限個子結(jié)點;
  • 有一個特殊的結(jié)點,它沒有父結(jié)點,稱為根結(jié)點;
  • 每一個非根節(jié)點有且只有一個父節(jié)點;
  • 樹里面沒有環(huán)路

一些有關于樹的概念:

  • 結(jié)點的度:一個結(jié)點含有的子結(jié)點個數(shù)稱為該結(jié)點的度;
  • 樹的度:一棵樹中,最大結(jié)點的度稱為樹的度;
  • 父結(jié)點:若一個結(jié)點含有子結(jié)點,則這個結(jié)點稱為其子結(jié)點的父結(jié)點;
  • 深度:對于任意結(jié)點n,n的深度為從根到n的唯一路徑長,根結(jié)點的深度為0;
  • 高度:對于任意結(jié)點n,n的高度為從n到一片樹葉的最長路徑長,所有樹葉的高度為0;

樹的種類

MySQL索引底層:B+樹詳解

按照有序性,可以分為有序樹和無序樹:

  • 無序樹:樹中任意節(jié)點的子結(jié)點之間沒有順序關系
  • 有序樹:樹中任意節(jié)點的子結(jié)點之間有順序關系

按照節(jié)點包含子樹個數(shù),可以分為B樹和二叉樹,二叉樹可以分為以下幾種:

  • 二叉樹:每個節(jié)點最多含有兩個子樹的樹稱為二叉樹;
  • 二叉查找樹:首先它是一顆二叉樹,若左子樹不空,則左子樹上所有結(jié)點的值均小于它的根結(jié)點的值;若右子樹不空,則右子樹上所有結(jié)點的值均大于它的根結(jié)點的值;左、右子樹也分別為二叉排序樹;
  • 滿二叉樹:葉節(jié)點除外的所有節(jié)點均含有兩個子樹的樹被稱為滿二叉樹;
  • 完全二叉樹:如果一顆二叉樹除去最后一層節(jié)點為滿二叉樹,且最后一層的結(jié)點依次從左到右分布
  • 霍夫曼樹:帶權路徑最短的二叉樹。
  • 紅黑樹:紅黑樹是一顆特殊的二叉查找樹,每個節(jié)點都是黑色或者紅色,根節(jié)點、葉子節(jié)點是黑色。如果一個節(jié)點是紅色的,則它的子節(jié)點必須是黑色的。
  • 平衡二叉樹(AVL):一 棵空樹或它的左右兩個子樹的高度差的絕對值不超過1,并且左右兩個子樹都是一棵平衡二叉樹

B-樹、B+樹簡介

B-樹 簡介

B-樹,也稱為B樹,是一種平衡的多叉樹(可以對比一下平衡二叉查找樹),它比較適用于對外查找??聪逻@幾個概念哈:

  • 階數(shù):一個節(jié)點最多有多少個孩子節(jié)點。(一般用字母m表示)
  • 關鍵字:節(jié)點上的數(shù)值就是關鍵字
  • 度:一個節(jié)點擁有的子節(jié)點的數(shù)量。

一顆m階的B-樹,有以下特征:

  • 根結(jié)點至少有兩個子女;
  • 每個非根節(jié)點所包含的關鍵字個數(shù) j 滿足:?m/2? - 1 <= j <= m - 1.(??表示向上取整)
  • 有k個關鍵字(關鍵字按遞增次序排列)的非葉結(jié)點恰好有k+1個孩子。
  • 所有的葉子結(jié)點都位于同一層。

一棵簡單的B-樹如下:

MySQL索引底層:B+樹詳解

B+ 樹簡介

B+樹是B-樹的變體,也是一顆多路搜索樹。一棵m階的B+樹主要有這些特點:

  • 每個結(jié)點至多有m個子女;
  • 非根節(jié)點關鍵值個數(shù)范圍:?m/2? - 1 <= k <= m-1
  • 相鄰葉子節(jié)點是通過指針連起來的,并且是關鍵字大小排序的。

一顆3階的B+樹如下:

MySQL索引底層:B+樹詳解

B+樹和B-樹的主要區(qū)別如下:

  • B-樹內(nèi)部節(jié)點是保存數(shù)據(jù)的;而B+樹內(nèi)部節(jié)點是不保存數(shù)據(jù)的,只作索引作用,它的葉子節(jié)點才保存數(shù)據(jù)。
  • B+樹相鄰的葉子節(jié)點之間是通過鏈表指針連起來的,B-樹卻不是。
  • 查找過程中,B-樹在找到具體的數(shù)值以后就結(jié)束,而B+樹則需要通過索引找到葉子結(jié)點中的數(shù)據(jù)才結(jié)束
  • B-樹中任何一個關鍵字出現(xiàn)且只出現(xiàn)在一個結(jié)點中,而B+樹可以出現(xiàn)多次。

B+樹的插入

B+樹插入要記住這幾個步驟:

  • 1.B+樹插入都是在葉子結(jié)點進行的,就是插入前,需要先找到要插入的葉子結(jié)點。
  • 2.如果被插入關鍵字的葉子節(jié)點,當前含有的關鍵字數(shù)量是小于階數(shù)m,則直接插入。
  • 3.如果插入關鍵字后,葉子節(jié)點當前含有的關鍵字數(shù)目等于階數(shù)m,則插,該節(jié)點開始 「分裂」為兩個新的節(jié)點,一個節(jié)點包含?m/2? 個關鍵字,另外一個關鍵字包含?m/2?個關鍵值。(?m/2?表示向下取整,?m/2?表示向上取整,如?3/2?=2)。
  • 4.分裂后,需要將第?m/2?的關鍵字上移到父結(jié)點。如果這時候父結(jié)點中包含的關鍵字個數(shù)小于m,則插入操作完成。
  • 5.分裂后,需要將?m/2?的關鍵字上移到父結(jié)點。如果父結(jié)點中包含的關鍵字個數(shù)等于m,則繼續(xù)分裂父結(jié)點。

以一顆4階的B+樹為例子吧,4階的話,關鍵值最多3(m-1)個。假設插入以下數(shù)據(jù)43,48,36,32,37,49,28.

  1. 在空樹中插入43

MySQL索引底層:B+樹詳解

這時候根結(jié)點就一個關鍵值,此時它是根結(jié)點也是葉子結(jié)點。

  1. 依次插入48,36

MySQL索引底層:B+樹詳解

這時候跟節(jié)點擁有3個關鍵字,已經(jīng)滿了

  1. 繼續(xù)插入 32,發(fā)現(xiàn)當前節(jié)點關鍵字已經(jīng)不小于階數(shù)4了,于是分裂 第?4/2?=2(下標0,1,2)個,也即43上移到父節(jié)點。

MySQL索引底層:B+樹詳解

  1. 繼續(xù)插入37,49,前節(jié)點關鍵字都是還沒滿的,直接插入,如下:

MySQL索引底層:B+樹詳解

  1. 最后插入28,發(fā)現(xiàn)當前節(jié)點關鍵字也是不小于階數(shù)4了,于是分裂,于是分裂, 第 ?4/2?=2個,也就是36上移到父節(jié)點,因父子節(jié)點只有2個關鍵值,還是小于4的,所以不用繼續(xù)分裂,插入完成

    MySQL索引底層:B+樹詳解

B+樹的查找

因為B+樹的數(shù)據(jù)都是在葉子節(jié)點上的,內(nèi)部節(jié)點只是指針索引的作用,因此,查找過程需要搜索到葉子節(jié)點上。還是以這顆B+樹為例吧:

MySQL索引底層:B+樹詳解

B+ 樹單值查詢

假設我們要查的值為32.

第一次磁盤 I/O,查找磁盤塊1,即根節(jié)點(36,43),因為32小于36,因此訪問根節(jié)點的左邊第一個孩子節(jié)點

MySQL索引底層:B+樹詳解

第二次磁盤 I/O, 查找磁盤塊2,即根節(jié)點的第一個孩子節(jié)點,獲得區(qū)間(28,32),遍歷即可得32.

MySQL索引底層:B+樹詳解

動態(tài)圖如下:

MySQL索引底層:B+樹詳解

B+ 樹范圍查詢

假設我們要查找區(qū)間 [32,40]區(qū)間的值.

第一步先訪問根節(jié)點,發(fā)現(xiàn)區(qū)間的左端點32小于36,則訪問根節(jié)點的第一個左子樹(28,32);

MySQL索引底層:B+樹詳解

第二步訪問節(jié)點(28,32),找到32,于是開始遍歷鏈表,把[32,40]區(qū)間值找出來,這也是B+樹比B-樹高效的地方。

MySQL索引底層:B+樹詳解

B+樹的刪除

B+樹刪除關鍵字,分這幾種情況

  • 找到包含關鍵值的結(jié)點,如果關鍵字個數(shù)大于?m/2?-1,直接刪除即可;
  • 找到包含關鍵值的結(jié)點,如果關鍵字個數(shù)大于?m/2?-1,并且關鍵值是當前節(jié)點的最大(?。┲?,并且該關鍵值存在父子節(jié)點中,那么刪除該關鍵字,同時需要相應調(diào)整父節(jié)點的值。
  • 找到包含關鍵值的結(jié)點,如果刪除該關鍵字后,關鍵字個數(shù)小于?m/2?,并且其兄弟結(jié)點有多余的關鍵字,則從其兄弟結(jié)點借用關鍵字
  • 找到包含關鍵值的結(jié)點,如果刪除該關鍵字后,關鍵字個數(shù)小于?m/2?,并且其兄弟結(jié)點沒有多余的關鍵字,則與兄弟結(jié)點合并。

如果關鍵字個數(shù)大于?m/2?,直接刪除即可;

假設當前有這么一顆5階的B+樹

MySQL索引底層:B+樹詳解

如果刪除22,因為關鍵字個數(shù)為3 > ?5/2?-1=2, 直接刪除(??表示向上取整的意思)

MySQL索引底層:B+樹詳解

如果關鍵字個數(shù)大于?m/2?-1,并且刪除的關鍵字存在于父子節(jié)點中,那么需要相應調(diào)整父子節(jié)點的值

MySQL索引底層:B+樹詳解

如果刪除20,因為關鍵字個數(shù)為3 > ?5/2?-1=2,并且20是當前節(jié)點的邊界值,且存在父子節(jié)點中,所以刪除后,其父子節(jié)點也要響應調(diào)整。

MySQL索引底層:B+樹詳解

如果刪除該關鍵字后,關鍵字個數(shù)小于?m/2?-1,兄弟節(jié)點可以借用

以下這顆5階的B+樹,

MySQL索引底層:B+樹詳解

如果刪除15,刪除關鍵字的結(jié)點只剩1個關鍵字,小于?5/2?-1=2,不滿足B+樹特點,但是其兄弟節(jié)點擁有3個元素(7,8,9),可以借用9過來,如圖:

MySQL索引底層:B+樹詳解

在刪除關鍵字后,如果導致其結(jié)點中關鍵字個數(shù)不足,并且兄弟結(jié)點沒有得借用的話,需要合并兄弟結(jié)點

以下這顆5階的B+樹:

MySQL索引底層:B+樹詳解

如果刪除關鍵字7,刪除關鍵字的結(jié)點只剩1個關鍵字,小于?5/2?-1=2,不滿足B+樹特點,并且兄弟結(jié)點沒法借用,因此發(fā)生合并,如下:

MySQL索引底層:B+樹詳解

主要流程醬紫:

  • 因為7被刪掉后,只剩一個8的關鍵字,不滿足B+樹特點(?m/2?-1<=關鍵字<=m-1)。
  • 并且沒有兄弟結(jié)點關鍵字借用,因此8與前面的兄弟結(jié)點結(jié)合。
  • 被刪關鍵字結(jié)點的父節(jié)點,7索引也被刪掉了,只剩一個9,并且其右兄弟結(jié)點(18,20)只有兩個關鍵字,也是沒得借,因此在此合并。
  • 被刪關鍵字結(jié)點的父子節(jié)點,也和其兄弟結(jié)點合并后,只剩一個子樹分支,因此根節(jié)點(16)也下移了。

所以刪除關鍵字7后的結(jié)果如下:

MySQL索引底層:B+樹詳解

B+樹經(jīng)典面試題

  • InnoDB一棵B+樹可以存放多少行數(shù)據(jù)?
  • 為什么索引結(jié)構(gòu)默認使用B+樹,而不是hash,二叉樹,紅黑樹,B-樹?
  • B-樹和B+樹的區(qū)別

InnoDB一棵B+樹可以存放多少行數(shù)據(jù)?

這個問題的簡單回答是:約2千萬行。

  • 在計算機中,磁盤存儲數(shù)據(jù)最小單元是扇區(qū),一個扇區(qū)的大小是512字節(jié)。
  • 文件系統(tǒng)中,最小單位是塊,一個塊大小就是4k;
  • InnoDB存儲引擎最小儲存單元是頁,一頁大小就是16k。
MySQL索引底層:B+樹詳解

因為B+樹葉子存的是數(shù)據(jù),內(nèi)部節(jié)點存的是鍵值+指針。索引組織表通過非葉子節(jié)點的二分查找法以及指針確定數(shù)據(jù)在哪個頁中,進而再去數(shù)據(jù)頁中找到需要的數(shù)據(jù);

MySQL索引底層:B+樹詳解

假設B+樹的高度為2的話,即有一個根結(jié)點和若干個葉子結(jié)點。這棵B+樹的存放總記錄數(shù)為=根結(jié)點指針數(shù)*單個葉子節(jié)點記錄行數(shù)。

  • 如果一行記錄的數(shù)據(jù)大小為1k,那么單個葉子節(jié)點可以存的記錄數(shù) =16k/1k =16.
  • 非葉子節(jié)點內(nèi)存放多少指針呢?我們假設主鍵ID為bigint類型,長度為8字節(jié),而指針大小在InnoDB源碼中設置為6字節(jié),所以就是8+6=14字節(jié),16k/14B =16*1024B/14B = 1170

因此,一棵高度為2的B+樹,能存放1170 * 16=18720條這樣的數(shù)據(jù)記錄。同理一棵高度為3的B+樹,能存放1170 *1170 *16 =21902400,也就是說,可以存放兩千萬左右的記錄。B+樹高度一般為1-3層,已經(jīng)滿足千萬級別的數(shù)據(jù)存儲。

為什么索引結(jié)構(gòu)默認使用B+樹,而不是B-Tree,Hash哈希,二叉樹,紅黑樹?

簡單版回答如下:

  • Hash哈希,只適合等值查詢,不適合范圍查詢。
  • 一般二叉樹,可能會特殊化為一個鏈表,相當于全表掃描。
  • 紅黑樹,是一種特化的平衡二叉樹,MySQL 數(shù)據(jù)量很大的時候,索引的體積也會很大,內(nèi)存放不下的而從磁盤讀取,樹的層次太高的話,讀取磁盤的次數(shù)就多了。
  • B-Tree,葉子節(jié)點和非葉子節(jié)點都保存數(shù)據(jù),相同的數(shù)據(jù)量,B+樹更矮壯,也是就說,相同的數(shù)據(jù)量,B+樹數(shù)據(jù)結(jié)構(gòu),查詢磁盤的次數(shù)會更少。

B-樹和B+樹的區(qū)別

  • B-樹內(nèi)部節(jié)點是保存數(shù)據(jù)的;而B+樹內(nèi)部節(jié)點是不保存數(shù)據(jù)的,只作索引作用,它的葉子節(jié)點才保存數(shù)據(jù)。
  • B+樹相鄰的葉子節(jié)點之間是通過鏈表指針連起來的,B-樹卻不是。
  • 查找過程中,B-樹在找到具體的數(shù)值以后就結(jié)束,而B+樹則需要通過索引找到葉子結(jié)點中的數(shù)據(jù)才結(jié)束
  • B-樹中任何一個關鍵字出現(xiàn)且只出現(xiàn)在一個結(jié)點中,而B+樹可以出現(xiàn)多次。

參考與感謝

  • B+樹看這一篇就夠了 [1]
  • B樹和B+樹的插入、刪除圖文詳解 [2]
  • InnoDB一棵B+樹可以存放多少行數(shù)據(jù)? [3]

Reference

[1]

B+樹看這一篇就夠了: https://zhuanlan.zhihu.com/p/149287061

[2]

B樹和B+樹的插入、刪除圖文詳解: https://www.cnblogs.com/nullzx/p/8729425.html

[3]

InnoDB一棵B+樹可以存放多少行數(shù)據(jù)?: https://www.cnblogs.com/leefreeman/p/8315844.html


免責聲明:本文內(nèi)容由21ic獲得授權后發(fā)布,版權歸原作者所有,本平臺僅提供信息存儲服務。文章僅代表作者個人觀點,不代表本平臺立場,如有問題,請聯(lián)系我們,謝謝!

本站聲明: 本文章由作者或相關機構(gòu)授權發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

LED驅(qū)動電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。

關鍵字: 驅(qū)動電源

在工業(yè)自動化蓬勃發(fā)展的當下,工業(yè)電機作為核心動力設備,其驅(qū)動電源的性能直接關系到整個系統(tǒng)的穩(wěn)定性和可靠性。其中,反電動勢抑制與過流保護是驅(qū)動電源設計中至關重要的兩個環(huán)節(jié),集成化方案的設計成為提升電機驅(qū)動性能的關鍵。

關鍵字: 工業(yè)電機 驅(qū)動電源

LED 驅(qū)動電源作為 LED 照明系統(tǒng)的 “心臟”,其穩(wěn)定性直接決定了整個照明設備的使用壽命。然而,在實際應用中,LED 驅(qū)動電源易損壞的問題卻十分常見,不僅增加了維護成本,還影響了用戶體驗。要解決這一問題,需從設計、生...

關鍵字: 驅(qū)動電源 照明系統(tǒng) 散熱

根據(jù)LED驅(qū)動電源的公式,電感內(nèi)電流波動大小和電感值成反比,輸出紋波和輸出電容值成反比。所以加大電感值和輸出電容值可以減小紋波。

關鍵字: LED 設計 驅(qū)動電源

電動汽車(EV)作為新能源汽車的重要代表,正逐漸成為全球汽車產(chǎn)業(yè)的重要發(fā)展方向。電動汽車的核心技術之一是電機驅(qū)動控制系統(tǒng),而絕緣柵雙極型晶體管(IGBT)作為電機驅(qū)動系統(tǒng)中的關鍵元件,其性能直接影響到電動汽車的動力性能和...

關鍵字: 電動汽車 新能源 驅(qū)動電源

在現(xiàn)代城市建設中,街道及停車場照明作為基礎設施的重要組成部分,其質(zhì)量和效率直接關系到城市的公共安全、居民生活質(zhì)量和能源利用效率。隨著科技的進步,高亮度白光發(fā)光二極管(LED)因其獨特的優(yōu)勢逐漸取代傳統(tǒng)光源,成為大功率區(qū)域...

關鍵字: 發(fā)光二極管 驅(qū)動電源 LED

LED通用照明設計工程師會遇到許多挑戰(zhàn),如功率密度、功率因數(shù)校正(PFC)、空間受限和可靠性等。

關鍵字: LED 驅(qū)動電源 功率因數(shù)校正

在LED照明技術日益普及的今天,LED驅(qū)動電源的電磁干擾(EMI)問題成為了一個不可忽視的挑戰(zhàn)。電磁干擾不僅會影響LED燈具的正常工作,還可能對周圍電子設備造成不利影響,甚至引發(fā)系統(tǒng)故障。因此,采取有效的硬件措施來解決L...

關鍵字: LED照明技術 電磁干擾 驅(qū)動電源

開關電源具有效率高的特性,而且開關電源的變壓器體積比串聯(lián)穩(wěn)壓型電源的要小得多,電源電路比較整潔,整機重量也有所下降,所以,現(xiàn)在的LED驅(qū)動電源

關鍵字: LED 驅(qū)動電源 開關電源

LED驅(qū)動電源是把電源供應轉(zhuǎn)換為特定的電壓電流以驅(qū)動LED發(fā)光的電壓轉(zhuǎn)換器,通常情況下:LED驅(qū)動電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。

關鍵字: LED 隧道燈 驅(qū)動電源
關閉