国产操人视频av天天碰,俄罗斯欧美日韩在线2区。,欧美刺激a毛片淫色国产

[導(dǎo)讀]分布式系統(tǒng)抽象討論編程語言時，我們使用通用術(shù)語并用函數(shù)、運(yùn)算符、類、變量和指針來定義我們的程序。通用的詞匯可以幫助我們避免每次都為了描述某些東西而發(fā)明新詞。我們的定義越精確、越?jīng)]有歧異，聽眾也就越容易理解。在開始學(xué)習(xí)算法之前，我們首先要了

分布式系統(tǒng)抽象

討論編程語言時，我們使用通用術(shù)語并用函數(shù)、運(yùn)算符、類、變量和指針來定義我們的程序。通用的詞匯可以幫助我們避免每次都為了描述某些東西而發(fā)明新詞。我們的定義越精確、越?jīng)]有歧異，聽眾也就越容易理解。

在開始學(xué)習(xí)算法之前，我們首先要了解分布式系統(tǒng)中的詞匯：這些定義你會經(jīng)常在演講、書籍和論文中遇到。

鏈路

網(wǎng)絡(luò)是不可靠的：消息會丟失、延遲或被打亂。記住這一點之后，我們來嘗試構(gòu)建幾種通信協(xié)議。我們從最不可靠的協(xié)議開始，確定它們可能處于的狀態(tài)，然后找出可以為協(xié)議增加的東西使它提供更好的保證。

公平損失鏈路

我們可以從兩個進(jìn)程開始，它們之間以鏈路相連。進(jìn)程可以相互發(fā)送消息，如圖2所示。任何通信介質(zhì)都是不完美的，消息可能丟失或延遲。

看看我們能得到什么樣的保證。消息M被發(fā)送之后（從發(fā)送方的角度來看），它可能處于以下狀態(tài)之一：

還未送達(dá)進(jìn)程B（但會在某個時間點送達(dá)）
在途中丟失且不可恢復(fù)
成功送達(dá)遠(yuǎn)程進(jìn)程

分布式系統(tǒng)中只有兩個難題

圖8-2：最簡單的不可靠通信形式

注意，發(fā)送方?jīng)]有任何方法確定消息是否已經(jīng)送達(dá)。在分布式系統(tǒng)的術(shù)語中，這種鏈路稱為公平損失（fair-loss）。這種鏈路具有以下屬性：

公平損失

如果發(fā)送方和接收方都是正確的，且發(fā)送方無限多次重復(fù)發(fā)送，則消息最終會被送達(dá)注3。

有限重復(fù)

發(fā)送的消息不會被送達(dá)無限次。

不會無中生有

鏈路不會自己生成消息。換句話說，它不會傳遞一個從未發(fā)送過的消息。

公平損失鏈路是一種很有用的抽象，它是構(gòu)建具有更強(qiáng)保證的通信協(xié)議的基石。我們可以假設(shè)該鏈路不會在通信雙方之間系統(tǒng)性地丟棄消息，也不會創(chuàng)建新消息。但與此同時，我們也不能完全依靠它。這可能讓你想起了用戶數(shù)據(jù)報協(xié)議（UDP），UDP允許我們從一個進(jìn)程發(fā)送消息到另一個進(jìn)程，但在協(xié)議層面上不提供可靠的傳輸語義。

消息確認(rèn)

為了改善這一情況、更清晰地獲得消息狀態(tài)，我們可以引入確認(rèn)（acknowledgment）機(jī)制：接收方通知發(fā)送方消息已送達(dá)。為此，我們需要雙向通信信道，并增加一些措施以區(qū)分不同的消息，例如序列號—單調(diào)遞增的唯一消息標(biāo)識符。

每個消息只要有唯一標(biāo)識符就足夠了。序列號只是唯一標(biāo)識符的一種特殊情況，即使用計數(shù)器來獲取標(biāo)識符，從而實現(xiàn)唯一性。當(dāng)使用哈希算法來唯一地標(biāo)識消息時，我們應(yīng)當(dāng)考慮可能的沖突，并確保能消除歧義。

現(xiàn)在，進(jìn)程A可以發(fā)送消息M(n)，其中n是單調(diào)遞增的消息計數(shù)器。B收到消息后立即向A發(fā)送確認(rèn)ACK(n)。圖8-3展示了這種通信形式。

分布式系統(tǒng)中只有兩個難題

圖3：發(fā)現(xiàn)消息并確認(rèn)

確認(rèn)消息，就像原始消息一樣，也有可能在途中丟失。消息可能處于的狀態(tài)數(shù)會稍有變化。在A收到確認(rèn)之前，該消息仍處于我們前面提到的三種狀態(tài)之一，但是，一旦A收到確認(rèn)，就可以確信該消息已送達(dá)B。

消息重傳

增加確認(rèn)機(jī)制仍不足以保證通信協(xié)議完全可靠：發(fā)送的消息仍可能會丟失，遠(yuǎn)程進(jìn)程也可能在確認(rèn)之前發(fā)生故障。為了解決該問題并提供送達(dá)保證，我們可以嘗試重傳（retransmit）。重傳是指發(fā)送方重試可能失敗的操作。我們之所以說可能失敗，是因為發(fā)送方并不能真的知道有沒有失敗，因為我們要討論的鏈路不使用確認(rèn)機(jī)制。

進(jìn)程A發(fā)送消息M之后，它將等到超時T被觸發(fā)，然后嘗試再次發(fā)送同一條消息。假設(shè)進(jìn)程之間的鏈路完好無損，進(jìn)程間的網(wǎng)絡(luò)分區(qū)不會無限持續(xù)下去，并且并非所有數(shù)據(jù)包都丟失，我們可以認(rèn)為，從發(fā)送方的角度看，消息要么尚未送達(dá)進(jìn)程B，要么已經(jīng)成功送達(dá)。由于A一直在嘗試發(fā)送消息，可以認(rèn)為傳輸過程中不會發(fā)生不可恢復(fù)的消息丟失。

在分布式系統(tǒng)的術(shù)語中，這種抽象稱為頑固鏈路（stubborn link）。之所以稱為頑固，是因為發(fā)件人會無限期地反復(fù)發(fā)送消息，但是，由于這種抽象非常不切實際，因此我們需要將重試與確認(rèn)結(jié)合起來。

重傳的問題

每當(dāng)我們發(fā)送消息時，在收到遠(yuǎn)程進(jìn)程的確認(rèn)之前，我們無從得知消息的狀態(tài)：可能已被處理，可能馬上就要處理，也可能已經(jīng)丟失，甚至可能在收到消息之前遠(yuǎn)程進(jìn)程就崩潰了—上述的任意狀態(tài)都是可能的。我們可以重試操作、再次發(fā)送消息，但這可能導(dǎo)致消息重復(fù)。只有當(dāng)我們要執(zhí)行的操作是冪等時，處理重復(fù)消息才是安全的。

冪等（idempotent）的操作可以執(zhí)行多次而產(chǎn)生相同的結(jié)果，且不會產(chǎn)生其他副作用。例如，服務(wù)器關(guān)機(jī)操作可以是冪等的，第一次調(diào)用將發(fā)起關(guān)機(jī)，而所有后續(xù)調(diào)用都不會產(chǎn)生任何其他影響。

如果每個操作都是冪等的，那我們可以少考慮一些傳遞語義，更多地依賴重傳來實現(xiàn)容錯，并以完全反應(yīng)式的方式構(gòu)建系統(tǒng)：為某些信號觸發(fā)相應(yīng)的操作，而不會引起預(yù)期之外的副作用。但是，操作不一定是冪等的，簡單地假設(shè)它們冪等可能會導(dǎo)致集群范圍的副作用。例如，向客戶的信用卡收費(fèi)不是冪等操作，絕對不可以重復(fù)收費(fèi)多次。

在存在部分故障和網(wǎng)絡(luò)分區(qū)的情況下，冪等性尤其重要，因為我們無法總是確定遠(yuǎn)程操作的確切狀態(tài)—是成功還是失敗，還是會馬上被執(zhí)行—我們只能等待更長的時間。保證每個操作都是冪等的是不切實際的，因此我們需要在不改變實際操作語義的情況下，提供與冪等性等價的保證。為此，我們可以使用去重來避免多次處理消息。

消息順序

不可靠的網(wǎng)絡(luò)給我們帶來了兩個問題：一是消息可能會亂序到達(dá)；二是由于重傳某些消息可能會多次送達(dá)。我們已經(jīng)引入了序列號，利用這些消息標(biāo)識符我們可以在接收方確保先進(jìn)先出（FIFO）的順序。由于每條消息都有一個序列號，因此接收方可以跟蹤下列信息：

nconsecutive表示最大連續(xù)序列號：所有小于或等于該序列號的消息都已經(jīng)收到，這些消息可以按順序放到正確的位置上。
nprocessed表示最大已處理序列號：所有小于或等于該序列號的消息都已經(jīng)按照原來的順序被處理。此序列號可以用于去重。

如果收到的消息序列號不連續(xù)，接收方會將其放入重新排序緩沖區(qū)。例如，它在接收到序列號為3的消息后收到消息5，那我們就知道4還是缺失的，因此我們將5放在一旁，直到4到來，然后就能構(gòu)造出原本的消息順序。由于通信構(gòu)建在公平損失鏈路之上，可以認(rèn)為nconsecutive和nmax_seen之間的消息最終一定會送達(dá)。

接收方可以安全地丟棄收到的序列號小于等于nconsecutive的消息，因為這些消息確定已經(jīng)送達(dá)了。

去重的工作原理是檢查帶有序列號n的消息是否已被處理（已被傳給網(wǎng)絡(luò)棧的更上層），丟棄已處理的消息。

在分布式系統(tǒng)的術(shù)語中，這種類型的鏈路稱為完美鏈路，它提供以下保證[CACHIN11]：

可靠傳遞

正確的進(jìn)程A發(fā)送一次到正確的進(jìn)程B的每個消息最終都會被傳遞。

沒有重復(fù)

消息不會被傳送多次。

不會無中生有

與其他種類的鏈路一樣，它只能傳遞實際由發(fā)送者發(fā)送過的消息。

這可能會讓你想起TCP注4協(xié)議（但是，TCP僅在單個會話內(nèi)保證可靠傳遞）。當(dāng)然，上述模型僅僅是一種用于說明原理的簡化表示。TCP中處理消息確認(rèn)的模型更為復(fù)雜，它按組進(jìn)行確認(rèn)以減少協(xié)議層面的開銷。另外，TCP具有選擇性確認(rèn)、流控、擁塞控制、錯誤檢測等很多其他功能，這些不在我們的討論范圍之內(nèi)。

嚴(yán)格一次傳遞

分布式系統(tǒng)中只有兩個難題：1）保證消息順序；2）嚴(yán)格一次傳遞。

—Mathias Verraes

關(guān)于是否可以做到嚴(yán)格一次傳遞（exactly-once delivery）這個問題已經(jīng)有很多討論。這里，語義和精確的措辭非常重要。由于鏈路故障可能導(dǎo)致傳遞消息的第一次嘗試無法成功，因此大多數(shù)實際的系統(tǒng)都采用至少一次傳遞（at-least-once delivery），它確保了發(fā)送方將重試直到收到確認(rèn)為止，否則就認(rèn)為對方?jīng)]有收到該消息。還有一種傳遞語義是最多一次（at-most-once）：發(fā)送方僅僅發(fā)送消息而不期待得到任何確認(rèn)。

TCP協(xié)議的原理是將消息分成數(shù)據(jù)包，一個一個傳輸，然后在接收端將它們拼接到一起。TCP可能會嘗試重傳某些數(shù)據(jù)包，并且可能有不止一次的傳輸會成功。由于TCP用序列號標(biāo)記每個數(shù)據(jù)包，即使某些數(shù)據(jù)包被發(fā)送多次，它也可以對其進(jìn)行去重，確保接收方只會看到并處理一次該消息。在TCP中，此保證僅對單個會話有效：如果消息被確認(rèn)并處理，但是發(fā)送方在收到確認(rèn)消息前連接就中斷了，則應(yīng)用程序并不知道此傳遞成功，取決于其邏輯，它可能會嘗試再次發(fā)送消息。

這意味著嚴(yán)格一次處理是個有趣的問題，因為重復(fù)的傳送（或數(shù)據(jù)包傳輸）沒有副作用，僅僅是鏈路盡力而為的產(chǎn)物。舉個例子，如果數(shù)據(jù)庫節(jié)點僅接收到記錄但還沒將它持久化。在這種情況下傳遞已經(jīng)完成了，但除非該記錄可以被查到（換句話說，除非消息被傳遞并且處理了），否則這次傳遞毫無用處。

為了確保嚴(yán)格一次傳遞，各節(jié)點需要一個共同知識[HALPERN90]：每個節(jié)點都知道某件事，每個節(jié)點都知道其他所有節(jié)點也都知道這件事。用簡化的術(shù)語來說，節(jié)點必須在記錄狀態(tài)上達(dá)成共識：兩個節(jié)點都認(rèn)為該記錄已經(jīng)或者還未被持久化。正如本章之后會說的，這在理論上是不可能的，但在實踐中，我們?nèi)酝ㄟ^放寬協(xié)調(diào)的要求來使用這一概念。

各種關(guān)于是否是嚴(yán)格一次發(fā)送的誤解，大多是因為從不同協(xié)議和抽象層次上考慮該問題，以及對“傳遞”的不同定義。要想建立可靠的鏈路，不可能不重復(fù)傳送某些消息。但是，我們可以通過僅處理每個消息一次并忽略重復(fù)消息，使得從發(fā)送方的角度來看是嚴(yán)格一次發(fā)送。

現(xiàn)在，在建立了實現(xiàn)可靠通信的方法之后，我們可以繼續(xù)前進(jìn)，探尋實現(xiàn)分布式系統(tǒng)中進(jìn)程間一致性和共識的方法。

4 兩將軍問題

一個被廣泛稱為兩將軍問題的思想實驗，是對分布式系統(tǒng)一致性的最著名的描述之一。

這個思想實驗表明，如果鏈路可能發(fā)生故障并且通信是異步的，則不可能在通信的雙方之間達(dá)成共識。盡管TCP具有完美鏈路的性質(zhì)，但是務(wù)必記住：完美鏈路盡管被稱為完美鏈路，并不能保證完美的傳遞。它們也不能保證參與方一直活著，而只關(guān)心傳輸本身。

想象現(xiàn)在有兩支軍隊，分別由兩位將軍領(lǐng)導(dǎo)，準(zhǔn)備進(jìn)攻一座要塞城市。兩支軍隊分別位于城市的兩側(cè)，只有在同時進(jìn)攻的情況下才能獲勝。

兩位將軍通過信使進(jìn)行通信。他們已經(jīng)制定了攻擊計劃，現(xiàn)在唯一需要達(dá)成共識的就是是否執(zhí)行計劃。該問題的變體包括：其中一位將軍的級別較高，但需要確保攻擊是有協(xié)調(diào)的；或者兩位將軍需要就確切時間達(dá)成共識。這些細(xì)節(jié)不會改變問題的定義：將軍們需要達(dá)成一項共識。

將軍們只需要對“他們都會發(fā)起進(jìn)攻”這一事實達(dá)成共識。否則，攻擊將無法成功。將軍A發(fā)出一條消息MSG(N)，表明如果對方也同意的話，就在指定的時間發(fā)起進(jìn)攻。

將軍A送出信使之后，他不知道信使是否已經(jīng)到達(dá)：信使可能會被抓而無法傳達(dá)消息。當(dāng)將軍B收到消息時，他必須發(fā)送確認(rèn)ACK(MSG(N))。圖8-4展示了一條消息由一方發(fā)送并由另一方確認(rèn)。

分布式系統(tǒng)中只有兩個難題

圖4：兩將軍問題示意圖

傳遞確認(rèn)消息的信使也可能會被抓而無法傳達(dá)消息。B無從得知信使是否已成功送達(dá)確認(rèn)消息。

為了確認(rèn)這一點，B必須等待ACK(ACK(MSG(N)))，一個二階的確認(rèn)，用于確認(rèn)A收到了確認(rèn)。

無論將軍們互相發(fā)送多少確認(rèn)，他們始終距離安全地發(fā)起攻擊還差一個ACK。將軍們注定要懷疑最后一個確認(rèn)消息是否已送達(dá)目的地。

注意我們沒有做任何時序上的假設(shè)：將軍間的通信是完全異步的。并沒有一個上限約束將軍必須在多長時間內(nèi)做出回應(yīng)。

5 FLP不可能定理

Fisher、Lynch和Paterson在論文中描述了一個著名的問題：FLP不可能問題[FISCHER85]（FLP是作者姓氏的首字母），論文討論了一種共識形式：各進(jìn)程啟動時有一個初始值，并嘗試就新值達(dá)成共識。算法完成后，所有正常進(jìn)程上的新值必須相同。

如果網(wǎng)絡(luò)完全可靠，很容易對特定值達(dá)成共識。但實際上，系統(tǒng)容易出現(xiàn)各式各樣的故障，例如消息丟失、重復(fù)、網(wǎng)絡(luò)分區(qū)，以及進(jìn)程緩慢或崩潰。

共識協(xié)議描述了這樣一個系統(tǒng)：給定初始狀態(tài)的多個進(jìn)程，它將所有進(jìn)程帶入決定狀態(tài)。一個正確的共識協(xié)議必須具備以下三個屬性：

一致性

協(xié)議達(dá)成的決定必須是一致的：每個進(jìn)程都做出了決定且所有進(jìn)程決定的值是相同的。否則我們就尚未達(dá)成共識。

有效性

達(dá)成共識的值必須由某一個參與者提出，這意味著系統(tǒng)本身不能“提出”值。這也意味著這個值不是無關(guān)緊要（trivial）的：進(jìn)程不能總是決定某個預(yù)定義的默認(rèn)值。

終止性

只有當(dāng)所有進(jìn)程都達(dá)到?jīng)Q定狀態(tài)時，協(xié)議才算完成。

文獻(xiàn)[FISCHER85]假定處理過程是完全異步的，進(jìn)程之間沒有共享的時間概念。這樣的系統(tǒng)中的算法不能基于超時，并且一個進(jìn)程無法確定另一個進(jìn)程是崩潰了還是僅僅運(yùn)行太慢。論文表明，在這些假設(shè)下，不存在任何協(xié)議能保證在有限時間內(nèi)達(dá)成共識。完全異步的共識算法甚至無法容忍一個遠(yuǎn)程進(jìn)程無通知地突然崩潰。

如果我們不給進(jìn)程完成算法步驟設(shè)定一個時間上限，那么就無法可靠地檢測出進(jìn)程故障，也不存在確定性的共識算法。

但是，F(xiàn)LP不可能定理并不意味著我們要收拾東西回家（由于達(dá)成共識是不可能的）。它僅僅意味著我們不能總是在有限的時間內(nèi)在一個異步系統(tǒng)中達(dá)成共識。實踐中，系統(tǒng)至少會表現(xiàn)出一定程度的同步性，而要想解決共識問題還需要一個更完善的模型。

6 系統(tǒng)同步性

從FLP不可能定理中可以看出時序假設(shè)是分布式系統(tǒng)的關(guān)鍵特征之一。在異步系統(tǒng)中，我們不知道進(jìn)程運(yùn)行的相對速度，也不能保證在有限時間內(nèi)或以特定順序傳遞消息。進(jìn)程可能要花無限長的時間來響應(yīng)，而且無法總是可靠地檢測到進(jìn)程故障。

對異步系統(tǒng)的主要批評在于上述假設(shè)不切實際：進(jìn)程不可能具有任意不同的處理速度，鏈路傳遞消息的時間也不會無限長。依賴時間能夠簡化推理，并提供時間上限的保證。

在異步模型中不一定能解決共識問題[FISCHER85]。而且，不一定能設(shè)計出高效的異步算法。對于某些任務(wù)，切實可行的解決方案很可能需要依賴時間[ARJOMANDI83]。

我們可以放寬一些假設(shè)，認(rèn)為系統(tǒng)是同步的。為此我們引入了時間的概念。在同步模型下對系統(tǒng)進(jìn)行推理要容易得多。它假定各進(jìn)程的處理速度相近、傳輸延遲是有限的，并且消息傳遞不會花任意長的時間。

同步系統(tǒng)也可以表示為同步的進(jìn)程本地時鐘：兩個進(jìn)程本地時間源之間的時間差存在上限[CACHIN11]。

在同步模型中設(shè)計系統(tǒng)可以使用超時機(jī)制。我們可以構(gòu)建更復(fù)雜的抽象，例如領(lǐng)導(dǎo)者選舉、共識、故障檢測以及基于它們的其他抽象。這使得最佳情況的場景更加健壯，但是如果時序假設(shè)不成立則可能導(dǎo)致故障。例如：Raft共識算法（參見14.4節(jié)）中，可能最終有多個進(jìn)程認(rèn)為它們是領(lǐng)導(dǎo)者，為了解決該問題，我們強(qiáng)制滯后的進(jìn)程接受其他進(jìn)程成為領(lǐng)導(dǎo)者；故障檢測算法（參見第9章）可能會錯誤地將活動進(jìn)程標(biāo)記為故障，反之亦然。設(shè)計系統(tǒng)時，我們必須考慮這些可能性。

異步和同步模型的性質(zhì)可以組合使用，我們可以將系統(tǒng)視為部分同步的。部分同步的系統(tǒng)具有同步系統(tǒng)的某些屬性，但是消息傳遞、時鐘漂移和相對處理速度的邊界范圍可能并不精確，并且僅在大多數(shù)時候成立[DWORK88]。

同步是分布式系統(tǒng)的基本屬性：它對性能、擴(kuò)展性和一般可解性有影響，并且有許多對系統(tǒng)正常工作來說是必要的因素。本書中討論的一些算法就工作在同步系統(tǒng)的假設(shè)下。

7 故障模型

我們一直在提到故障這個詞，但到目前為止，它還是一個十分寬泛的概念，可能包含多種含義。就像我們可以做出不同的時序假設(shè)那樣，我們也可以假設(shè)存在不同種類的故障。故障模型準(zhǔn)確地描述了分布式系統(tǒng)中的進(jìn)程可能以怎樣的方式崩潰，并基于這些假設(shè)來開發(fā)算法。例如，我們可以假設(shè)進(jìn)程可能崩潰并且永遠(yuǎn)無法恢復(fù)，或者可以預(yù)期它將在一段時間后恢復(fù)，或者它可能會失控并且產(chǎn)生錯誤的值。

分布式系統(tǒng)中，進(jìn)程互相依賴以共同執(zhí)行算法，因此故障可能導(dǎo)致整個系統(tǒng)的執(zhí)行錯誤。

我們將討論分布式系統(tǒng)中現(xiàn)有的多種故障模型，例如崩潰、遺漏和任意故障。這個列表并非面面俱到，但它涵蓋了在實際中的大多數(shù)重要場景。

7.1 崩潰故障

通常，我們期望進(jìn)程正確執(zhí)行算法的所有步驟。最簡單的崩潰方式是進(jìn)程停止執(zhí)行接下來的算法步驟，并且不再發(fā)送任何消息給其他進(jìn)程。換句話說，該進(jìn)程崩潰了。大多數(shù)情況下，我們使用崩潰–停止（crash-stop）進(jìn)程抽象的假設(shè)，它規(guī)定一旦進(jìn)程崩潰就會保持這種狀態(tài)。

該模型不假定該進(jìn)程無法恢復(fù)，也不阻攔或試圖阻止恢復(fù)。這僅僅意味著該算法的正確性或活動性不依賴于恢復(fù)過程。實際上，并沒有什么東西會去阻止進(jìn)程恢復(fù)、追上系統(tǒng)狀態(tài)以及參與下一次的算法執(zhí)行。

失敗的進(jìn)程無法再繼續(xù)參與當(dāng)前這一輪的協(xié)作。為恢復(fù)的進(jìn)程分配一個新的、不同的ID不會使模型等價于崩潰–恢復(fù)模型（之后會討論），因為大多數(shù)算法使用預(yù)定義的進(jìn)程列表，并且依據(jù)最多可容忍的故障數(shù)明確定義了故障的語義[CACHIN11]。

崩潰–恢復(fù)（crash-recovery）是另一種的進(jìn)程抽象。在這個抽象中，進(jìn)程停止執(zhí)行算法步驟，但會在稍后恢復(fù)并嘗試執(zhí)行剩下的步驟。要想讓恢復(fù)成為可能，需要在系統(tǒng)中引入持久狀態(tài)以及恢復(fù)協(xié)議[SKEEN83]。允許崩潰–恢復(fù)的算法需要考慮所有可能的恢復(fù)狀態(tài)，因為恢復(fù)的進(jìn)程會嘗試從最后一個已知的步驟開始繼續(xù)執(zhí)行。

想利用恢復(fù)的算法必須同時考慮狀態(tài)和進(jìn)程ID。在這種情況下，崩潰恢復(fù)也可以看作是遺漏故障的一種特殊情況，因為從另一個進(jìn)程的角度看，不可達(dá)的進(jìn)程與崩潰再恢復(fù)的進(jìn)程沒什么區(qū)別。

7.2 遺漏故障

另一個故障模式是遺漏故障（omission fault）。該模型假設(shè)故障進(jìn)程跳過了某些算法步驟，或者無法執(zhí)行這些步驟，或者執(zhí)行過程對其他參與者不可見，或者無法與其他參與者通信。遺漏故障中包含了由于網(wǎng)絡(luò)鏈路故障、交換機(jī)故障或網(wǎng)絡(luò)擁塞而導(dǎo)致的網(wǎng)絡(luò)分區(qū)。網(wǎng)絡(luò)分區(qū)可以表示為單個進(jìn)程或進(jìn)程組之間的消息遺漏。進(jìn)程崩潰可以模擬為遺漏所有該進(jìn)程收發(fā)的消息。

如果進(jìn)程的運(yùn)行速度慢于其他參與者，發(fā)送響應(yīng)比預(yù)期遲得多，那么對于系統(tǒng)的其余部分來說，這個節(jié)點看起來丟三落四的。慢節(jié)點沒有完全停止，而是發(fā)送結(jié)果太慢，常常與其他節(jié)點不同步。

如果本應(yīng)執(zhí)行某些步驟的算法跳過了這些步驟或者執(zhí)行結(jié)果不可見時，就發(fā)生了遺漏故障。例如，消息在送往接收方的途中丟失，而發(fā)送方就像消息發(fā)送成功時那樣，沒有再次發(fā)送而是繼續(xù)運(yùn)行，即使消息已經(jīng)不可恢復(fù)地丟失了。遺漏故障也可能是由間歇性停頓、網(wǎng)絡(luò)過載、隊列滿等引起的。

7.3 任意故障

最難以解決的故障種類是任意故障或拜占庭故障（Byzantine fault）：進(jìn)程繼續(xù)執(zhí)行算法步驟，但是以與違背算法的方式（例如，共識算法中的進(jìn)程決定一個從未由任何參與者提出過的值）。

此類故障可能是由于軟件bug或運(yùn)行不同版本算法的進(jìn)程，在這種情況下，故障很容易被發(fā)現(xiàn)和理解。如果我們無法控制所有進(jìn)程，并且其中一個進(jìn)程有意地誤導(dǎo)其他進(jìn)程，則發(fā)現(xiàn)和理解故障會變得非常困難。

你可能在航空航天工業(yè)中聽說過拜占庭式的容錯：飛機(jī)和航天器的系統(tǒng)不會直接使用子部件傳來的值，而是會對結(jié)果進(jìn)行交叉驗證。另一個廣泛的應(yīng)用是加密貨幣[GILAD17]，那里沒有中央權(quán)威，節(jié)點被多方控制，并且敵對的參與者有強(qiáng)烈的動機(jī)通過提供錯誤響應(yīng)來欺騙系統(tǒng)。

7.4 故障處理

我們可以通過構(gòu)成進(jìn)程組、在算法中引入冗余來掩蓋故障：即使其中一個進(jìn)程發(fā)生故障，用戶也不會注意到[CHRISTIAN91]。

故障可能會帶來一些性能損失：正常的執(zhí)行依賴于進(jìn)程可響應(yīng)，而且系統(tǒng)必須回退到較慢的執(zhí)行路徑來處理故障和糾正錯誤。故障往往可以通過一些方式來避免，例如：代碼審查、廣泛的測試、引入超時重試機(jī)制確保消息送達(dá)，以及確保各算法步驟在本地按順序執(zhí)行。

我們這里介紹的大多數(shù)算法都基于崩潰-故障模型，并通過引入冗余來解決故障。這些假設(shè)幫助我們創(chuàng)造性能更好、更易于理解和實現(xiàn)的算法。

8 小結(jié)

我們討論了一些分布式系統(tǒng)的術(shù)語，并介紹了一些基本概念。我們討論了分布式系統(tǒng)的固有困難和復(fù)雜性，這是由于系統(tǒng)組件不可靠性導(dǎo)致的：鏈路可能無法傳遞消息、進(jìn)程可能崩潰、網(wǎng)絡(luò)可能發(fā)生分區(qū)。

這些術(shù)語應(yīng)該足夠讓我們繼續(xù)討論。本書的剩余部分將討論分布式系統(tǒng)中常見的解決方案：我們將先回想下哪些地方可能會出問題，然后看看有哪些可用的選項。

更多閱讀

如果你想了解更多本章中提到的概念，可以參考以下來源：

分布式系統(tǒng)抽象、故障模型和時序假設(shè)
Lynch, Nancy A. 1996. Distributed Algorithms. San Francisco: Morgan Kaufmann.
Tanenbaum, Andrew S. and Maarten van Steen. 2006. Distributed Systems: Principles and Paradigms (2nd Ed). Boston: Pearson.
Cachin, Christian, Rachid Guerraoui, and Lus Rodrigues. 2011. Introduction to Reliable and Secure Distributed Programming (2nd Ed.). New York: Springer.

本文選自《數(shù)據(jù)庫系統(tǒng)內(nèi)幕》一書

特別推薦一個分享架構(gòu)+算法的優(yōu)質(zhì)內(nèi)容，還沒關(guān)注的小伙伴，可以長按關(guān)注一下：

分布式系統(tǒng)中只有兩個難題

長按訂閱更多精彩▼

分布式系統(tǒng)中只有兩個難題

如有收獲，點個在看，誠摯感謝

免責(zé)聲明：本文內(nèi)容由21ic獲得授權(quán)后發(fā)布，版權(quán)歸原作者所有，本平臺僅提供信息存儲服務(wù)。文章僅代表作者個人觀點，不代表本平臺立場，如有問題，請聯(lián)系我們，謝謝！

分布式系統(tǒng)中只有兩個難題

與傳統(tǒng)的驅(qū)動方式相比，共陰恒流驅(qū)動在能效有哪些優(yōu)勢

工業(yè)電機(jī)驅(qū)動電源設(shè)計：反電動勢抑制與過流保護(hù)的集成方案

如何解決 LED 驅(qū)動電源的易損壞問題

LED設(shè)計中LED驅(qū)動電源的公式

EV主驅(qū)IGBT隔離驅(qū)動電源方案選擇問題探討

合理的驅(qū)動電源方案成為大功率區(qū)域照明的主流選擇

AC-DC電源轉(zhuǎn)換拓?fù)浣Y(jié)構(gòu)設(shè)計

針對于LED照明驅(qū)動電源技術(shù)中的電磁干擾其中的三大硬件問題措施

LED驅(qū)動電源的核心部分“開關(guān)管”和“變換器”設(shè)計技巧

最全LED驅(qū)動電源及散熱設(shè)計方案介紹

常用的LED驅(qū)動電源有哪些？工作原理是什么？

LED驅(qū)動電源的類型可分為有哪些？

解散全部員工！深圳又一電子大廠宣布停產(chǎn)結(jié)業(yè)

崧盛股份：大功率LED驅(qū)動電源行業(yè)門檻高，新進(jìn)入者面臨三大壁壘

關(guān)于LED驅(qū)動電源的分類以及特點解析，你了解嗎？

你知道常見的LED驅(qū)動電源種類以及它們有哪些特點嗎？

關(guān)于LED驅(qū)動電源特點以及在設(shè)計時需要注意的關(guān)鍵點

多路 LED 驅(qū)動電源技術(shù)的開發(fā)與可靠性研究分析

值得大家學(xué)習(xí)的LED驅(qū)動電源的特點以及工作原理概述

Cree宣布徹底告別LED和照明行業(yè)