Kafka 是主流的消息流系統(tǒng),其中的概念還是比較多的,下面通過(guò)圖示的方式來(lái)梳理一下 Kafka 的核心概念,以便在我們的頭腦中有一個(gè)清晰的認(rèn)識(shí)。
基礎(chǔ)
Kafka 是一套流處理系統(tǒng),可以讓后端服務(wù)輕松的相互溝通,是微服務(wù)架構(gòu)中常用的組件。

生產(chǎn)者消費(fèi)者
生產(chǎn)者服務(wù) Producer 向 Kafka 發(fā)送消息,消費(fèi)者服務(wù) Consumer 監(jiān)聽(tīng) Kafka 接收消息。

一個(gè)服務(wù)可以同時(shí)為生產(chǎn)者和消費(fèi)者。

Topics 主題
Topic 是生產(chǎn)者發(fā)送消息的目標(biāo)地址,是消費(fèi)者的監(jiān)聽(tīng)目標(biāo)。

一個(gè)服務(wù)可以監(jiān)聽(tīng)、發(fā)送多個(gè) Topics。

Kafka 中有一個(gè)【consumer-group(消費(fèi)者組)】的概念。這是一組服務(wù),扮演一個(gè)消費(fèi)者。

如果是消費(fèi)者組接收消息,Kafka 會(huì)把一條消息路由到組中的某一個(gè)服務(wù)。

這樣有助于消息的負(fù)載均衡,也方便擴(kuò)展消費(fèi)者。Topic 扮演一個(gè)消息的隊(duì)列。首先,一條消息發(fā)送了。

然后,這條消息被記錄和存儲(chǔ)在這個(gè)隊(duì)列中,不允許被修改。

接下來(lái),消息會(huì)被發(fā)送給此 Topic 的消費(fèi)者。但是,這條消息并不會(huì)被刪除,會(huì)繼續(xù)保留在隊(duì)列中。

繼續(xù)發(fā)送消息。

像之前一樣,這條消息會(huì)發(fā)送給消費(fèi)者、不允許被改動(dòng)、一直呆在隊(duì)列中。(消息在隊(duì)列中能呆多久,可以修改 Kafka 的配置)


Partitions 分區(qū)
上面 Topic 的描述中,把 Topic 看做了一個(gè)隊(duì)列,實(shí)際上,一個(gè) Topic 是由多個(gè)隊(duì)列組成的,被稱為【Partition(分區(qū))】。這樣可以便于 Topic 的擴(kuò)展。

生產(chǎn)者發(fā)送消息的時(shí)候,這條消息會(huì)被路由到此 Topic 中的某一個(gè) Partition。

消費(fèi)者監(jiān)聽(tīng)的是所有分區(qū)。

生產(chǎn)者發(fā)送消息時(shí),默認(rèn)是面向 Topic 的,由 Topic 決定放在哪個(gè) Partition,默認(rèn)使用輪詢策略。

也可以配置 Topic,讓同類型的消息都在同一個(gè) Partition。例如,處理用戶消息,可以讓某一個(gè)用戶所有消息都在一個(gè) Partition。例如,用戶1發(fā)送了3條消息:A、B、C,默認(rèn)情況下,這3條消息是在不同的 Partition 中(如 P1、P2、P3)。在配置之后,可以確保用戶1的所有消息都發(fā)到同一個(gè)分區(qū)中(如 P1)。

這個(gè)功能有什么用呢?這是為了提供消息的【有序性】。消息在不同的 Partition 是不能保證有序的,只有一個(gè) Partition 內(nèi)的消息是有序的。


架構(gòu)
Kafka 是集群架構(gòu)的,ZooKeeper是重要組件。

ZooKeeper 管理者所有的 Topic 和 Partition。Topic 和 Partition 存儲(chǔ)在 Node 物理節(jié)點(diǎn)中,ZooKeeper負(fù)責(zé)維護(hù)這些 Node。

例如,有2個(gè) Topic,各自有2個(gè) Partition。

這是邏輯上的形式,但在 Kafka 集群中的實(shí)際存儲(chǔ)可能是這樣的:

Topic A 的 Partition #1 有3份,分布在各個(gè) Node 上。這樣可以增加 Kafka 的可靠性和系統(tǒng)彈性。3個(gè) Partition #1 中,ZooKeeper 會(huì)指定一個(gè) Leader,負(fù)責(zé)接收生產(chǎn)者發(fā)來(lái)的消息。

其他2個(gè) Partition #1 會(huì)作為 Follower,Leader 接收到的消息會(huì)復(fù)制給 Follower。

這樣,每個(gè) Partition 都含有了全量消息數(shù)據(jù)。

即使某個(gè) Node 節(jié)點(diǎn)出現(xiàn)了故障,也不用擔(dān)心消息的損壞。Topic A 和 Topic B 的所有 Partition 分布可能就是這樣的:

感謝閱讀,希望對(duì)你有所幫助 :) 翻譯整理自:https://timothystepro.medium.com/visualizing-kafka-20bc384803e7譯文:https://blog.csdn.net/duysh/article/details/116355977
本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。