本文是《C 并發(fā)編程》一文的姊妹篇。將著重介紹C 11標(biāo)準(zhǔn)引入的內(nèi)存模型。
前言
在《C 并發(fā)編程》一文中,我們已經(jīng)介紹了C 11到C 17在并發(fā)編程方面的新增API。借助那篇文章中的知識(shí),你應(yīng)該已經(jīng)可以開(kāi)發(fā)一個(gè)完善的C 并發(fā)系統(tǒng)。這對(duì)絕大部分人來(lái)說(shuō),是足夠的了。但在一些情況下,我們可能還需要走得更遠(yuǎn)。回顧一下,上文中提到的知識(shí)是以互斥體為中心的。為了避免競(jìng)爭(zhēng)條件,是保證任何時(shí)候只有一個(gè)線程可以進(jìn)入臨界區(qū)。這就存在兩個(gè)問(wèn)題:- 可能會(huì)出現(xiàn)死鎖
- 并發(fā)的效率不夠
關(guān)于C 內(nèi)存模型
2004年,Java 5.0引入了適用于多線程環(huán)境的內(nèi)存模型[2]:JSR-133[3]。但C 直到2011標(biāo)準(zhǔn)才引入了內(nèi)存模型。Java內(nèi)存模型在很大程度上影響了C 內(nèi)存模型,但后者走得更遠(yuǎn)。因?yàn)樗试S開(kāi)發(fā)者打破順序一致性(Sequential Consistency,我們會(huì)在下文中講解),以獲得更好的控制。之所以這么做是因?yàn)镃 是一門(mén)系統(tǒng)編程語(yǔ)言,它的設(shè)計(jì)意圖之一就是:不需要另外一個(gè)更底層的語(yǔ)言,而是直接提供給開(kāi)發(fā)者以”接近機(jī)器“的方式編程。即便大多數(shù)程序員不用在意內(nèi)存模型,但是當(dāng)你以“接近機(jī)器”的方式工作時(shí),了解這些原理就很重要了。內(nèi)存模型是多線程環(huán)境能夠可靠工作的基礎(chǔ),因?yàn)閮?nèi)存模型需要對(duì)多線程環(huán)境的運(yùn)作細(xì)節(jié)進(jìn)行完備的定義。簡(jiǎn)單來(lái)講,可以認(rèn)為內(nèi)存模型是一種契約。它定義一套操作手法以及這些操作手法背后的詳細(xì)含義。開(kāi)發(fā)者利用這套操作完成數(shù)據(jù)的同步以避免競(jìng)爭(zhēng)條件,而系統(tǒng)(包括:編譯器,操作系統(tǒng)和處理器)保證執(zhí)行的邏輯符合內(nèi)存模型對(duì)于相關(guān)操作的定義 – 即實(shí)現(xiàn)契約。內(nèi)存模型主要包含了下面三個(gè)部分:- 元子操作:顧名思義,這類(lèi)操作一旦執(zhí)行就不會(huì)被打斷,你無(wú)法看到它的中間狀態(tài),它要么是執(zhí)行完成,要么沒(méi)有執(zhí)行。
- 操作的局部順序:一系列的操作不能被亂序。
- 操作的可見(jiàn)性:定義了對(duì)于共享變量的操作如何對(duì)其他線程可見(jiàn)。
為什么需要內(nèi)存模型?
在C 11標(biāo)準(zhǔn)出來(lái)之前,C 環(huán)境沒(méi)有多線程的概念。編譯器和處理器認(rèn)為系統(tǒng)中只有一個(gè)執(zhí)行流。引入了多線程之后,情況就會(huì)變得非常復(fù)雜。這是因?yàn)椋含F(xiàn)代計(jì)算機(jī)系統(tǒng)為了加快執(zhí)行效率,自動(dòng)的包含了很多的優(yōu)化。這些優(yōu)化雖然保證了在單線程環(huán)境下不破壞原來(lái)的邏輯。但是一旦到了多線程之后,情況就不一樣了。事實(shí)上,開(kāi)發(fā)者編寫(xiě)的代碼和最終運(yùn)行的程序往往會(huì)存在較大的差異,而運(yùn)行結(jié)果與開(kāi)發(fā)者預(yù)想一致,只是一種“假象”罷了。之所以會(huì)產(chǎn)生差異,原因主要來(lái)自下面三個(gè)方面:- 編譯器優(yōu)化
- CPU out-of-order執(zhí)行
- CPU Cache不一致性
Memory Reorder
以下面這段偽代碼為例:X?=?0,?Y?=?0;
Thread?1:?
X?=?1;?//?①
r1?=?Y;?//?②
Thread?2:?
Y?=?1;
r2?=?X;
你可能會(huì)覺(jué)得,在這個(gè)程序執(zhí)行完成之后,r1和r2怎么都不可能同時(shí)為0。但事實(shí)并非如此[4]。這是因?yàn)椤癕emory Reorder”的存在,“Memory Reorder”包含了編譯器和處理器兩種類(lèi)型的亂序。編譯器優(yōu)化
以gcc為例,該編譯器提供了-o參數(shù)來(lái)控制非常多的優(yōu)化選項(xiàng)[6]。以下面這段代碼為例:int?A,?B;
void?foo()
{
????A?=?B? ?1;
????B?=?0;
}
在編譯優(yōu)化后,可能會(huì)變成下面這樣:int?A,?B;
void?foo()
{
????int?temp?=?B;
????B?=?0;
????A?=?temp? ?1;
}
請(qǐng)注意,編譯器只要保證:在單線程環(huán)境下,執(zhí)行的結(jié)果和原先一樣就可以了。所以,這樣做是可以的。對(duì)于編譯器來(lái)說(shuō),它知道的是:當(dāng)前線程中,數(shù)據(jù)的讀寫(xiě)以及數(shù)據(jù)之間的依賴(lài)關(guān)系。但是,編譯器并不知道哪些數(shù)據(jù)是在線程間共享,而且是有可能會(huì)被修改的。這就需要開(kāi)發(fā)者在軟件層面做好控制。對(duì)于編譯器的亂序優(yōu)化來(lái)說(shuō),開(kāi)發(fā)者并非完全不能控制。編譯器會(huì)提供稱(chēng)之為內(nèi)存柵欄(Memory Barrier)[7]的工具給開(kāi)發(fā)者,讓開(kāi)發(fā)者告訴編譯器:這部分代碼編譯的時(shí)候不能亂序。gcc的內(nèi)存柵欄寫(xiě)法如下:int?A,?B;
void?foo()
{
????A?=?B? ?1;
????asm?volatile(""?:::?"memory");
????B?=?0;
}
Out-of-order執(zhí)行
不僅僅是編譯器,處理器也可能會(huì)亂序執(zhí)行指令。下面是維基上給出的一張表格,列出了不同類(lèi)型的CPU可能會(huì)執(zhí)行的亂序類(lèi)別。- Weak vs. Strong Memory Models[9]
- This Is Why They Call It a Weakly-Ordered CPU[10]
- A Tutorial Introduction to the ARM and POWER Relaxed Memory Models[11]
- x86-TSO: A Rigorous and Usable Programmer’s Model for x86 Multiprocessors[12]
fence指令:lfence?(asm),?void?_mm_lfence(void)
sfence?(asm),?void?_mm_sfence(void)
mfence?(asm),?void?_mm_mfence(void)
由此提醒我們:如果我們只以單線程的思維來(lái)開(kāi)發(fā)并發(fā)系統(tǒng),一旦引入了Memory Reorder之后就可能會(huì)發(fā)生問(wèn)題。例如:以上面的A,B兩個(gè)變量為例,在編譯器將其亂序后,雖然對(duì)于當(dāng)前線程是沒(méi)問(wèn)題的。但是如果在此時(shí)剛好有另外一個(gè)線程使用這兩個(gè)變量,并且依賴(lài)于它們的更新順序,那么就會(huì)出現(xiàn)問(wèn)題。Cache Coherency
事情還不只這么簡(jiǎn)單?,F(xiàn)代的主流CPU幾乎都會(huì)包含多個(gè)核以及多級(jí)Cache,下圖是我的MacBook Pro上的CPU Cache信息。對(duì)象和內(nèi)存位置
C 內(nèi)存模型中的基本存儲(chǔ)單位是字節(jié)。一個(gè)字節(jié)至少足夠大,能夠包含基本執(zhí)行字符集的任何成員以及Unicode UTF-8編碼形式的八位代碼單元,并且由連續(xù)的位序列組成。C 中所有數(shù)據(jù)都是由對(duì)象組成的。這里的對(duì)象包括了簡(jiǎn)單基本類(lèi)型(如int和double),也包括了指針類(lèi)型(如my_class*)。當(dāng)然,也包括各種class定義的類(lèi)的對(duì)象。無(wú)論是什么類(lèi)型,一個(gè)對(duì)象均包含了一個(gè)或多個(gè)內(nèi)存位置。每個(gè)內(nèi)存位置一定是下面兩種情況中的一種:- 標(biāo)量類(lèi)型(Scalar Type)的對(duì)象,標(biāo)量類(lèi)型包括下面幾種:
- 數(shù)字類(lèi)型:整數(shù)或者浮點(diǎn)數(shù)
T *指針類(lèi)型- 枚舉類(lèi)型
- 指向成員的指針
nullptr_t- 相鄰位域(Bit field)[13]的最大序列
位域
位域聲明具有以“位”為單位的明確大小的類(lèi)數(shù)據(jù)成員。相鄰的位域成員可以打包成共享和跨過(guò)各個(gè)字節(jié)。例如這樣:struct?S?{
?//?三位的無(wú)符號(hào)位域,
?//?允許值為?0...7
?unsigned?int?b?:?3;
};
位域的值必須大于等于0。值0比較特殊,它僅允許使用在無(wú)名位域上。并且它具有特殊含義:它指定類(lèi)定義中的下個(gè)位域?qū)⑹加诜峙鋯卧倪吔纭?/p>由此,請(qǐng)看一下下面的例子:struct?S?{
????char?a;?????????//?內(nèi)存位置?#1
????int??b?:?5;?????//?內(nèi)存位置?#2
????int??c?:?11,????//?內(nèi)存位置?#2?(接續(xù),相鄰位域占用同一個(gè)內(nèi)存位置)
???????????:?0,?????//?無(wú)名位域,分隔了下一個(gè)位域
?????????d?:?8;?????//?內(nèi)存位置?#3?(由于存在0值無(wú)名位域,這里是一個(gè)新的內(nèi)存位置)
????struct?{
????????int?ee?:?8;?//?內(nèi)存位置?#4
????}?e;
}?obj;
可以看到,這個(gè)結(jié)構(gòu)包含了4個(gè)內(nèi)存位置。之所以介紹內(nèi)存位置,是因?yàn)檫@與內(nèi)存模型密切相關(guān)。如果多個(gè)線程各自訪問(wèn)的是不同的內(nèi)存位置,那么就不會(huì)有什么問(wèn)題。但是,如果它們同時(shí)訪問(wèn)了相同的內(nèi)存位置,那就要小心了。**當(dāng)多個(gè)線程訪問(wèn)同一個(gè)內(nèi)存位置,并且其中只要有一個(gè)線程包含了寫(xiě)操作,如果這些訪問(wèn)沒(méi)有一致的修改順序,那么結(jié)果就是未定義的。**也就是說(shuō):可能會(huì)發(fā)生bug。修改順序
我們已經(jīng)知道,C 中的數(shù)據(jù)都是由對(duì)象組成。一個(gè)對(duì)象包含了若干個(gè)內(nèi)存位置。每個(gè)對(duì)象從初始化開(kāi)始,直到最終銷(xiāo)毀,在其生命周期的范圍內(nèi),對(duì)它進(jìn)行的訪問(wèn)必須有一個(gè)確定的修改順序,這個(gè)順序包含了所有線程的訪問(wèn)操作。雖然程序的每一次運(yùn)行,這個(gè)順序可能是不一樣的(例如:CPU資源的變化,調(diào)度器的影響),但是針對(duì)其中具體的某一次來(lái)說(shuō),必須有一個(gè)“一致的順序”,這個(gè)順序要被所有的線程認(rèn)可,并且可見(jiàn)。例如:一旦某個(gè)線程修改了一個(gè)數(shù)據(jù),這個(gè)操作必須要讓所有線程知道,在修改操作之后,所有線程都應(yīng)該得到修改后的值。從數(shù)據(jù)類(lèi)型的角度來(lái)說(shuō),有兩種情況:- 對(duì)于原子類(lèi)型(見(jiàn)下文):由編譯器保證數(shù)據(jù)的同步。
- 對(duì)于非原子類(lèi)型:由開(kāi)發(fā)者保證。
關(guān)系術(shù)語(yǔ)
下面先來(lái)介紹C 內(nèi)存模型中的幾個(gè)關(guān)系術(shù)語(yǔ)。sequenced-before
sequenced-before是一種單線程上的關(guān)系,這是一個(gè)非對(duì)稱(chēng),可傳遞的成對(duì)關(guān)系。對(duì)于兩個(gè)操作A和B,如果A sequenced-before B,則A的執(zhí)行應(yīng)當(dāng)在B的前面,并且A執(zhí)行后的結(jié)果B也能看到,它引入了一個(gè)局部有序性。同一個(gè)線程中的多個(gè)語(yǔ)句之間就是sequenced-before關(guān)系,例如:int?i?=?7;?//?①
i ;???????//?②
這里的 ① sequenced-before ② 。但是同一個(gè)語(yǔ)句中的多個(gè)子表達(dá)式上沒(méi)有這個(gè)關(guān)系的。特別極端的,對(duì)于下面這個(gè)語(yǔ)句:i?=?i ? ?i;
由于等號(hào)右邊的兩個(gè)子表達(dá)式無(wú)法確定先后關(guān)系,因此這個(gè)語(yǔ)句的行為是未定義的。這意味著,你永遠(yuǎn)不應(yīng)該寫(xiě)這樣的代碼。happens-before
happens-before關(guān)系是sequenced-before關(guān)系的擴(kuò)展,因?yàn)樗€包含了不同線程之間的關(guān)系。如果A happens-before B,則A的內(nèi)存狀態(tài)將在B操作執(zhí)行之前就可見(jiàn),這就為線程間的數(shù)據(jù)訪問(wèn)提供了保證。同樣的,這是一個(gè)非對(duì)稱(chēng),可傳遞的關(guān)系。如果A happens-before B,B happens-before C。則可推導(dǎo)出A happens-before C。synchronizes-with
synchronizes-with描述的是一種狀態(tài)傳播(propagate)關(guān)系。如果A synchronizes-with B,則就是保證操作A的狀態(tài)在操作B執(zhí)行之前是可見(jiàn)的。下文中我們將看到,原子操作的acquire-release具有synchronized-with關(guān)系。除此之外,對(duì)于鎖和互斥體的釋放和獲取可以達(dá)成synchronized-with關(guān)系,還有線程執(zhí)行完成和join操作也能達(dá)成synchronized-with關(guān)系。最后,借助 synchronizes-with 可以達(dá)成 happens-before 關(guān)系。原子類(lèi)型與原子操作
要理解內(nèi)存模型,首先需要掌握C 11提供的原子類(lèi)型(atomic types)和原子操作(atomic operation)。原子類(lèi)型不是一個(gè)類(lèi),而是一系列類(lèi),它們都位于頭文件中。原子類(lèi)型中包含了原子操作。但也有一些原子類(lèi)型之外的原子操作。下面是基本類(lèi)型對(duì)應(yīng)的原子類(lèi)型。第一列是類(lèi)型的別名(為了方便使用),第二列是類(lèi)型的原始定義。關(guān)于volatile和原子類(lèi)型:Java和C 都有volatile關(guān)鍵字。但同樣的關(guān)鍵字在不同的語(yǔ)言中有著不同的含義。Java中的volatile和C 的原子類(lèi)型是類(lèi)似的含義。而C 中的volatile是禁止編譯器對(duì)這個(gè)變量進(jìn)行優(yōu)化。
| 類(lèi)型別名 | 類(lèi)型定義 |
|---|---|
| atomic_bool | std::atomic |
| atomic_char | std::atomic |
| atomic_schar | std::atomic |
| atomic_uchar | std::atomic |
| atomic_int | std::atomic |
| atomic_uint | std::atomic |
| atomic_short | std::atomic |
| atomic_ushort | std::atomic |
| atomic_long | std::atomic |
| atomic_ulong | std::atomic |
| atomic_llong | std::atomic |
| atomic_ullong | std::atomic |
| atomic_char16_t | std::atomic |
| atomic_char32_t | std::atomic |
| atomic_wchar_t | std::atomic |
atomic用#代替)。| 函數(shù) | #_flag | #_bool | 指針類(lèi)型 | 整形類(lèi)型 | 說(shuō)明 |
|---|---|---|---|---|---|
| test_and_set | Y | 將flag設(shè)為true并返回原先的值 | |||
| clear | Y | 將flag設(shè)為false | |||
| is_lock_free | Y | Y | Y | 檢查原子變量是否免鎖 | |
| load | Y | Y | Y | 返回原子變量的值 | |
| store | Y | Y | Y | 通過(guò)一個(gè)非原子變量的值設(shè)置原子變量的值 | |
| exchange | Y | Y | Y | 用新的值替換,并返回原先的值 | |
| compare_exchange_weak compare_exchange_strong | Y | Y | Y | 比較和改變值 | |
| fetch_add, = | Y | Y | 增加值 | ||
| fetch_sub, -= | Y | Y | 減少值 | ||
| , -- | Y | Y | 自增和自減 | ||
| fetch_or, |= | Y | 求或并賦值 | |||
| fetch_and,
本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專(zhuān)欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀
LED驅(qū)動(dòng)電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。 關(guān)鍵字: 驅(qū)動(dòng)電源在工業(yè)自動(dòng)化蓬勃發(fā)展的當(dāng)下,工業(yè)電機(jī)作為核心動(dòng)力設(shè)備,其驅(qū)動(dòng)電源的性能直接關(guān)系到整個(gè)系統(tǒng)的穩(wěn)定性和可靠性。其中,反電動(dòng)勢(shì)抑制與過(guò)流保護(hù)是驅(qū)動(dòng)電源設(shè)計(jì)中至關(guān)重要的兩個(gè)環(huán)節(jié),集成化方案的設(shè)計(jì)成為提升電機(jī)驅(qū)動(dòng)性能的關(guān)鍵。 關(guān)鍵字: 工業(yè)電機(jī) 驅(qū)動(dòng)電源LED 驅(qū)動(dòng)電源作為 LED 照明系統(tǒng)的 “心臟”,其穩(wěn)定性直接決定了整個(gè)照明設(shè)備的使用壽命。然而,在實(shí)際應(yīng)用中,LED 驅(qū)動(dòng)電源易損壞的問(wèn)題卻十分常見(jiàn),不僅增加了維護(hù)成本,還影響了用戶(hù)體驗(yàn)。要解決這一問(wèn)題,需從設(shè)計(jì)、生... 關(guān)鍵字: 驅(qū)動(dòng)電源 照明系統(tǒng) 散熱根據(jù)LED驅(qū)動(dòng)電源的公式,電感內(nèi)電流波動(dòng)大小和電感值成反比,輸出紋波和輸出電容值成反比。所以加大電感值和輸出電容值可以減小紋波。 關(guān)鍵字: LED 設(shè)計(jì) 驅(qū)動(dòng)電源電動(dòng)汽車(chē)(EV)作為新能源汽車(chē)的重要代表,正逐漸成為全球汽車(chē)產(chǎn)業(yè)的重要發(fā)展方向。電動(dòng)汽車(chē)的核心技術(shù)之一是電機(jī)驅(qū)動(dòng)控制系統(tǒng),而絕緣柵雙極型晶體管(IGBT)作為電機(jī)驅(qū)動(dòng)系統(tǒng)中的關(guān)鍵元件,其性能直接影響到電動(dòng)汽車(chē)的動(dòng)力性能和... 關(guān)鍵字: 電動(dòng)汽車(chē) 新能源 驅(qū)動(dòng)電源在現(xiàn)代城市建設(shè)中,街道及停車(chē)場(chǎng)照明作為基礎(chǔ)設(shè)施的重要組成部分,其質(zhì)量和效率直接關(guān)系到城市的公共安全、居民生活質(zhì)量和能源利用效率。隨著科技的進(jìn)步,高亮度白光發(fā)光二極管(LED)因其獨(dú)特的優(yōu)勢(shì)逐漸取代傳統(tǒng)光源,成為大功率區(qū)域... 關(guān)鍵字: 發(fā)光二極管 驅(qū)動(dòng)電源 LEDLED通用照明設(shè)計(jì)工程師會(huì)遇到許多挑戰(zhàn),如功率密度、功率因數(shù)校正(PFC)、空間受限和可靠性等。 關(guān)鍵字: LED 驅(qū)動(dòng)電源 功率因數(shù)校正在LED照明技術(shù)日益普及的今天,LED驅(qū)動(dòng)電源的電磁干擾(EMI)問(wèn)題成為了一個(gè)不可忽視的挑戰(zhàn)。電磁干擾不僅會(huì)影響LED燈具的正常工作,還可能對(duì)周?chē)娮釉O(shè)備造成不利影響,甚至引發(fā)系統(tǒng)故障。因此,采取有效的硬件措施來(lái)解決L... 關(guān)鍵字: LED照明技術(shù) 電磁干擾 驅(qū)動(dòng)電源開(kāi)關(guān)電源具有效率高的特性,而且開(kāi)關(guān)電源的變壓器體積比串聯(lián)穩(wěn)壓型電源的要小得多,電源電路比較整潔,整機(jī)重量也有所下降,所以,現(xiàn)在的LED驅(qū)動(dòng)電源 關(guān)鍵字: LED 驅(qū)動(dòng)電源 開(kāi)關(guān)電源LED驅(qū)動(dòng)電源是把電源供應(yīng)轉(zhuǎn)換為特定的電壓電流以驅(qū)動(dòng)LED發(fā)光的電壓轉(zhuǎn)換器,通常情況下:LED驅(qū)動(dòng)電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。 關(guān)鍵字: LED 隧道燈 驅(qū)動(dòng)電源 |





