日本黄色一级经典视频|伊人久久精品视频|亚洲黄色色周成人视频九九九|av免费网址黄色小短片|黄色Av无码亚洲成年人|亚洲1区2区3区无码|真人黄片免费观看|无码一级小说欧美日免费三级|日韩中文字幕91在线看|精品久久久无码中文字幕边打电话

當前位置:首頁 > 嵌入式 > Linux閱碼場
[導讀]編者按:筆者遇到一個非常典型的問題,應用在X86正常運行,在AArch64上JVM就會崩潰。這個典型的JVM內部問題。筆者通過分析最終定位到是由于JVM中模板解釋器代碼存在bug導致在弱內存模型的平臺上Crash。在分析過程中,涉及到非常多的JVM內部知識,比如對象頭、GC復制算...

編者按:筆者遇到一個非常典型的問題,應用在 X86 正常運行,在 AArch64 上 JVM 就會崩潰。這個典型的 JVM 內部問題。筆者通過分析最終定位到是由于 JVM 中模板解釋器代碼存在 bug 導致在弱內存模型的平臺上 Crash。在分析過程中,涉及到非常多的 JVM 內部知識,比如對象頭、GC 復制算法操作、CAS 操作、字節(jié)碼執(zhí)行、內存序等,希望對讀者有所幫助。本文介紹了一般分析 JVM crash 的方法,并且深入介紹了為什么在 aarch64 平臺上引起這樣的問題,最后還給出了修改方法并推送到上游社區(qū)中。**對于使用非畢昇 JDK 的其他 JDK 只有在 jdk8u292、jdk11.0.9、jdk15以后的版本才得到修復,讀者使用時需要注意版本選擇避免這類問題發(fā)生。

背景知識

java 程序在發(fā)生 crash 時,會生成 hs_err_pid.log 文件,以及 core 文件(需要操作系統(tǒng)開啟相關設置),其中 hs_err 文件以文本格式記錄了 crash 發(fā)生位置的小范圍精確現(xiàn)場信息(調用棧、寄存器、線程棧、致命信號、指令上下文等)、jvm 各組件狀態(tài)信息(java 堆、jit 事件、gc 事件)、系統(tǒng)層面信息(環(huán)境變量、入?yún)?、內存使用信息、系統(tǒng)版本)等,精簡記錄了關鍵信息。而 core 文件是程序崩潰時進程的二進制快照,完整記錄了崩潰現(xiàn)場信息,可以使用 gdb 工具來打開 core 文件,恢復出一個崩潰現(xiàn)場,方便分析。

約束

文中描述的問題適用于 jdk8u292 之前的版本。

現(xiàn)象

某業(yè)務線隔十天半個月總會報過來 crash 問題,crash 位置比較統(tǒng)一,都是在某處執(zhí)行 young gc 的上下文中,crash 的直接原因是 java 對象的頭被寫壞了,比如這樣:

而正常的對象頭由 markoop 和 metadata 兩部分組成,前者存放該對象的 hash 值、年齡、鎖信息等,后者存放該對象所屬的 Klass 指針。這里關注的是 markoop,64 位機器上它的具體布局如下:

每種布局中每個字段的詳細含義可以在 jdk 源碼 jdk8u/hotspot/src/share/vm/oops/markOop.hpp 中找到,這里簡單給出結論就是 gc 階段一個正常對象頭中的 markoop 不可能是全 0,而是比如這樣:

此外,crash 時間上也有個特點:基本每次都發(fā)生在程序剛啟動時的幾秒內。

分析

發(fā)生 crash 的 java 對象有個一致的特點,就是總位于 eden 區(qū),我們仔細分析了 crash 位置的 gc 過程邏輯,特別是會在 gc 期間修改對象頭的相關源碼更是重點關注對象,因為那塊代碼為了追求性能,使用了無鎖編程:

補充介紹一下 CAS(Compare And Swap),CAS 的完整意思是比較并替換,并且確保整個操作原子性。CAS 需要 3 個操作數(shù):內存地址 dst,比較值 cmp,要更新的目標值 value。當且僅當內存地址 dst 上的值跟比較值 cmp 相等時,將內存地址 dst 上的值改寫為 value,否則就什么都不做,其在 aarch64 上的匯編實現(xiàn)類似如下:

然而我們經(jīng)過反復推敲,這塊 gc 邏輯似乎無懈可擊,而且位于 eden 區(qū)也意味著沒有被 gc 搬移過的可能性,這個問題在很長時間里陷入了停滯……

直到某一天又收到了一個類似的 crash,這個問題才迎來了轉機。在這個 crash 里,也是 java 對象的頭被寫壞了,但特殊的地方在于,頭上的錯誤值是 0x2000,憑著職業(yè)敏感,我們猜測這個特殊的錯誤值是否來自這個 java 對象本身呢?這個對象的 Java 名字叫 DynamicByteBuffer,來自某個基礎組件。反編譯得到了問題類 DynamicByteBuffer 的代碼:

再結合 core 信息中其他正常 DynamicByteBuffer 對象的布局,確定了這個特殊的 0x2000 值原本應該位于 segmentSize 字段上,而且從代碼中注意到這個 segmentSize 字段是 final 屬性,意味著其值只可能在實例構造函數(shù)中被設置,使用 jdk 自帶的命令 javap 進行反匯編,得到對應的字節(jié)碼如下:

putfield 這條字節(jié)碼的作用是給 java 對象的一個字段賦值,在紅框中的語義就是給 DynamicByteBuffer 對象的 segmentSize 字段賦值。

分析到這里,我們做一下小結,crash 的第一現(xiàn)場并非在 gc 上下文中,而是得往前追溯,發(fā)生在這個 java 對象被初始化期間,這期間在初始化它的 segmentSize 字段時,因為某種原因,0x2000 被寫到了對象頭上。

接下來繼續(xù)分析, JDK 在發(fā)生 crash 時會自動生成的 hs_err 日志,其中有記錄最近發(fā)生的編譯事件 “Compilation events (250 events)”,從中沒有發(fā)現(xiàn) DynamicByteBuffer 構造函數(shù)相關的編譯事件,所以可以推斷 crash 時 DynamicByteBuffer 這個類的構造函數(shù)尚未被編譯過(由于 crash 發(fā)生在程序啟動那幾秒,JIT 往往需要預熱后才會介入,所以可以假設記錄的比較完整),這意味著,它的構造函數(shù)只會通過模板解釋器去執(zhí)行,更具體地說,是去執(zhí)行模板解釋器中的 putfield 指令來把 0x2000 寫到 segmentSize 字段位置。

具體怎么寫其實很簡單,就是先拿到 segmentSize 字段的偏移量,根據(jù)偏移量定位到寫的位置,然后寫入。然而 JVM 的模板解釋器在實現(xiàn)這個 putfield 指令時,額外增加了一條快速實現(xiàn)路徑,在 runtime 期間會自動(具體的時間點是 “完整” 執(zhí)行完第一次 putfield 指令后)從慢速路徑切到快速路徑上,這個切換操作的實現(xiàn)全程沒有加鎖,同步完全依賴 barrier,由于整個過程比較復雜,這里首先給一個比較容易理解的并行流程圖:

注:圖中 bcp 指的是 bytecode pointer,就是讀字節(jié)碼。

上圖表示接近同一時間點前后,兩條并行流分別構建一個 DynamicByteBuffer 類型的對象過程中,各自完成 segmentSize 字段賦值的過程,用 Java 代碼簡單示意如下:

其中第一條執(zhí)行流走的慢速路徑,第二條走的快速路徑,可以留意到,紅色標識的是幾次公共內存的訪存操作,barrier 就分布在這些位置前后(標在下圖中)。

接下來再給一個更加精確一點的指令流模型:

簡單介紹一下這個設計模型:

  1. 線程從記錄了指令的內存地址 bcp(bytecode pointer) 上取出指令,然后跳轉到該指令地址上執(zhí)行,當取出的指令是 bcp1(比如 putfeild 指令的慢速路徑)時就是圖中左邊的指令流;
  2. 左邊的指令流就是計算出字段的 offset 并 str 到指定內存地址,然后插入 barrier,最后將 bcp2 指令(比如 putfeild 指令的快速路徑)覆寫到步驟 1 中的內存地址 addr 上;
  3. 后續(xù)線程繼續(xù)執(zhí)行步驟 1 時,由于取出的指令變成了 bcp2,就改為跳轉到圖中右邊的指令流;
  4. 右邊的指令流就是直接取出步驟 2 中已經(jīng)存到指定內存地址中的 offset。
回顧整個設計模型,左邊的指令流通過一個等效于完整 dmb 的 barrier 來保證 str offset 和 str bcp2 這兩條 str 指令的執(zhí)行順序并且全局可見;而右邊的指令流中,ldr bcp 和 ldr offset 這兩條 ldr 指令之間沒有任何 barrier,設計者可能認為一個無條件跳轉指令可以為兩條 ldr 指令建立依賴,從而保證執(zhí)行順序,然而從實測結果來看是不成立的。

這里先來簡單補充介紹一下內存順序模型的概念,現(xiàn)代 CPU 為了提高執(zhí)行效率,在指令的執(zhí)行順序上擁有很大的自主權,對每個獨立的 CPU 來說,只要確保語義不變,實際如何執(zhí)行都有可能,這種方式對于單個 CPU 來說沒有問題,當放到多個 CPU 共享數(shù)據(jù)的時候,這種亂序執(zhí)行的行為就會引發(fā)每個 CPU 看到數(shù)據(jù)的順序不一致問題,導致跨 CPU 的程序邏輯亂套了。這就需要對讀、寫內存指令進行約束,來規(guī)范每個 CPU 看到的內存生效行為,由此提出了內存順序模型的概念:

其中 ARM 采用的是一種弱內存模型,這種模型默認對讀、寫指令沒有任何約束,需要由程序員自己通過插入 barrier 來手動保證。

再回到這個問題上,測試方式是在 ldr offset 指令后額外加了檢測指令:

就是檢查 offset 值是否為 0,如果為 0 則直接強制 crash(設計上保證了 java 對象的任何實例字段的 offset 不可能是 0)。

經(jīng)過長時間測試,程序果然在這個位置觸發(fā)了 crash!這說明上面提到的兩條 ldr 指令不存在依賴關系,或者說這種依賴關系類似 ARMv8 手冊中描述的條件依賴,并不能保證執(zhí)行順序。ldr offset 指令先于 ldr bcp 執(zhí)行,使得讀到一個非法的 offset 值 0。更說明了,這才是這個案例的第一案發(fā)現(xiàn)場!

找到了問題的根因后,解決方法也就順利出爐了,那就是在兩條 ldr 指令之間插入 barrier 來確保這兩條 ldr 指令不發(fā)生亂序。實測證明,這種修復方案非常有效,這類 crash 現(xiàn)象消失。

詳細的修復 patch 見 https://hg.openjdk.java.net/jdk/jdk/rev/b9529fcbbd33 。目前已經(jīng) backport 到 jdk8u292、jdk11.0.9、jdk15。

總結

Java 虛擬機 (JVM) 為了追求性能,大量使用了無鎖編程進行設計,而且這么多年以來 JDK(特別是 JDK8)主要都是面向 X86 平臺開發(fā)的,如今才慢慢的開始支持 aarch64 平臺,所以 aarch64 弱內存序問題是我們面臨的一個比較嚴峻的挑戰(zhàn)。

后記

如果遇到相關技術問題(包括不限于畢昇 JDK),可以進入畢昇 JDK 社區(qū)查找相關資源(點擊原文進入官網(wǎng)),包括二進制下載、代碼倉庫、使用教學、安裝、學習資料等。畢昇 JDK 社區(qū)每雙周周二舉行技術例會,同時有一個技術交流群討論 GCC、LLVM、JDK 和 V8 等相關編譯技術,感興趣的同學可以添加如下微信小助手,回復 Compiler 入群。

rc="https://img.21ic.com/weixin/tr/2021-08/10/821kojnm147.png">



本站聲明: 本文章由作者或相關機構授權發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內容真實性等。需要轉載請聯(lián)系該專欄作者,如若文章內容侵犯您的權益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

LED驅動電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。

關鍵字: 驅動電源

在工業(yè)自動化蓬勃發(fā)展的當下,工業(yè)電機作為核心動力設備,其驅動電源的性能直接關系到整個系統(tǒng)的穩(wěn)定性和可靠性。其中,反電動勢抑制與過流保護是驅動電源設計中至關重要的兩個環(huán)節(jié),集成化方案的設計成為提升電機驅動性能的關鍵。

關鍵字: 工業(yè)電機 驅動電源

LED 驅動電源作為 LED 照明系統(tǒng)的 “心臟”,其穩(wěn)定性直接決定了整個照明設備的使用壽命。然而,在實際應用中,LED 驅動電源易損壞的問題卻十分常見,不僅增加了維護成本,還影響了用戶體驗。要解決這一問題,需從設計、生...

關鍵字: 驅動電源 照明系統(tǒng) 散熱

根據(jù)LED驅動電源的公式,電感內電流波動大小和電感值成反比,輸出紋波和輸出電容值成反比。所以加大電感值和輸出電容值可以減小紋波。

關鍵字: LED 設計 驅動電源

電動汽車(EV)作為新能源汽車的重要代表,正逐漸成為全球汽車產業(yè)的重要發(fā)展方向。電動汽車的核心技術之一是電機驅動控制系統(tǒng),而絕緣柵雙極型晶體管(IGBT)作為電機驅動系統(tǒng)中的關鍵元件,其性能直接影響到電動汽車的動力性能和...

關鍵字: 電動汽車 新能源 驅動電源

在現(xiàn)代城市建設中,街道及停車場照明作為基礎設施的重要組成部分,其質量和效率直接關系到城市的公共安全、居民生活質量和能源利用效率。隨著科技的進步,高亮度白光發(fā)光二極管(LED)因其獨特的優(yōu)勢逐漸取代傳統(tǒng)光源,成為大功率區(qū)域...

關鍵字: 發(fā)光二極管 驅動電源 LED

LED通用照明設計工程師會遇到許多挑戰(zhàn),如功率密度、功率因數(shù)校正(PFC)、空間受限和可靠性等。

關鍵字: LED 驅動電源 功率因數(shù)校正

在LED照明技術日益普及的今天,LED驅動電源的電磁干擾(EMI)問題成為了一個不可忽視的挑戰(zhàn)。電磁干擾不僅會影響LED燈具的正常工作,還可能對周圍電子設備造成不利影響,甚至引發(fā)系統(tǒng)故障。因此,采取有效的硬件措施來解決L...

關鍵字: LED照明技術 電磁干擾 驅動電源

開關電源具有效率高的特性,而且開關電源的變壓器體積比串聯(lián)穩(wěn)壓型電源的要小得多,電源電路比較整潔,整機重量也有所下降,所以,現(xiàn)在的LED驅動電源

關鍵字: LED 驅動電源 開關電源

LED驅動電源是把電源供應轉換為特定的電壓電流以驅動LED發(fā)光的電壓轉換器,通常情況下:LED驅動電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。

關鍵字: LED 隧道燈 驅動電源
關閉