軟件定義汽車 ( SDV ) 是指汽車設計的一種新范式,其中車輛的功能和特性主要由軟件而不是傳統(tǒng)的硬件組件定義和控制。
在 SDV 中,軟件更新可以動態(tài)改變和增強車輛功能,從而形成更加靈活、適應性更強的汽車生態(tài)系統(tǒng)。
軟件定義汽車中的 MLOP
MLOps(機器學習操作)涵蓋旨在簡化和自動化生產(chǎn)環(huán)境中機器學習模型整個生命周期的管理和部署的實踐、工具和方法。
與 SDV 的相關性
SDV 嚴重依賴 ML 模型來執(zhí)行關鍵功能,例如自動駕駛、預測性維護、用戶個性化等。
這些模型的有效管理不僅重要,而且對于維持 SDV 的車輛性能、安全性和可靠性至關重要。
MLOPs 平臺、不同方法以及如何實現(xiàn)?
我們將研究 ML 平臺的范圍、構建平臺的方法以及如何使用討論的方法之一來構建平臺。
MLOPs 平臺
一個整體的軟件平臺,可提高運輸、監(jiān)控和管理 ML 模型生命周期的生產(chǎn)力和可擴展性,從而促進 SDV 內的功能。
集中式與分散式
MLOP 平臺可以集中化,在一個中心位置管理所有有助于促進功能的 ML 模型。
它還可以由各個功能團隊進行分離和構建,并縮小管理范圍,僅管理與該功能相關的模型。
我們將深入研究用于管理 ML 模型的集中式 ML 平臺以及構建該平臺所需的條件。
為 SDV 構建整體 ML 平臺需要什么
我們需要考慮以下組件來構建一個集中式 ML 平臺,有效管理有助于 SDV 內的功能的 ML 模型。
數(shù)據(jù)工程
組織傾向于在企業(yè)級建立團隊來幫助管理訓練和開發(fā)機器學習模型的數(shù)據(jù)需求。
ML 平臺應具有完善的實用程序來跟蹤訓練 ML 模型所需的數(shù)據(jù)沿襲,例如數(shù)據(jù)提取、數(shù)據(jù)轉換和用于訓練當前模型的最終數(shù)據(jù)集。良好跟蹤的數(shù)據(jù)沿襲可以幫助使用該平臺的功能團隊深入了解用于訓練模型的數(shù)據(jù)點,從而改進模型以有效地幫助該功能。
通常的做法是采用 API 優(yōu)先的方法將企業(yè)級數(shù)據(jù)管理團隊集成到平臺中。
模型開發(fā)
盡管平臺無法控制模型的開發(fā)方式,因為功能團隊將負責協(xié)調該方面,但平臺的最佳利益是向功能團隊提供標準化的方法/模板,以收集以下筆記本源跟蹤、訓練集 id、驗證集 id、測試集 id、預處理 id、后處理 id、模型 id 和生成的模型版本作為實驗、設備類型和模型創(chuàng)建 id 的一部分。
該平臺還可以標準化模型開發(fā)時所需的工件,以便稍后在模型部署期間使用。
從模型開發(fā)的角度收集上述所有信息在模型管理/監(jiān)控階段非常有用。
模型驗證/治理
一旦模型開發(fā)完畢、測試完畢并準備部署到車輛上,MLOPs 平臺應該提供一個接口來驗證它,然后才能通過部署所需的框架/實用程序發(fā)布它。
在將模型部署到車輛之前,適當?shù)幕趯徟ぷ髁鞯闹卫砟P蛯τ趯彶樵撃P椭陵P重要。
如果模型在部署前經(jīng)過治理流程,這對 ML 平臺來說非常有利。它還為組織內部處理模型建立了標準。
模型部署
這是平臺的核心;這是輪胎與道路接觸的地方。所有上述步驟構建并設置了平臺,使其處于一個非凡的位置,可以輕松處理模型。
前面步驟中采用的標準化技術將對所有模型進行水平設置,并有助于減少差異性,同時開發(fā)服務將模型納入平臺并使用各種實用程序和框架將它們部署到車輛上以部署軟件。
該平臺應能夠提取、跟蹤和管理已上傳的部署模型,并輕松與車輛部署實用程序和框架集成。同樣,在這種情況下,API 優(yōu)先方法是首選方法。
模范 OP
一旦模型上傳部署,就可以在對其執(zhí)行操作時應用幾件事。
如果部分上傳導致平臺無法處理模型,平臺應該能夠檢測到它們并進行相應的處理。
如果模型上傳后未能通過驗證/治理過程,平臺應該能夠處理這個問題。
模型已上傳并準備部署。在這種情況下,平臺應該能夠評估模型在車輛中運行所需的軟件,并根據(jù)軟件準備情況、版本兼容性和其他此類因素做出相應的決策。
如果模型通過了上述所有標準并被部署,則平臺應該能夠將其移動到已處理的模型特征,以從模型的部署和未來操作中收集更多見解。
模型監(jiān)控
當 ML 模型部署到車輛上時,應該特別強調模型監(jiān)控,因為這對于它們的正常運行非常重要。
該平臺應開發(fā)實用程序,幫助計算使用 ML 平臺部署的每個模型的數(shù)據(jù)/概念漂移??梢酝ㄟ^開發(fā)一個框架來計算漂移,該框架使用匯總的車輛報告并定期將其與與模型相關的閾值分數(shù)進行比較。
如果不滿足閾值標準,則會向模型/特征所有者發(fā)送通知。
重新訓練/回滾/雜項功能
模型 OP 和監(jiān)控有助于為功能團隊提供儀表板和視圖,以便他們可以就模型再訓練、模型回滾以及與在車輛內操作模型相關的其他幾個功能做出決策。
該平臺應該能夠處理可能發(fā)生的各種情況,例如,維護平臺中的版本數(shù)量,以便能夠在需要時輕松獲取適當?shù)陌姹?如果新部署的版本出現(xiàn)意外的性能損失,則回滾到以前執(zhí)行的模型版本;影子部署關鍵功能的較新版本;將模型部署到預定義的車輛子集而不是整個車隊。
集中式 MLOP 平臺對 SDV 的優(yōu)勢
從上述方法可以看出,MLOPs平臺通過標準化將模型部署到車輛軟件所需的MLOPs功能,有助于加快價值實現(xiàn)時間,從而提高整體效率。
以下是此方法的優(yōu)點的概述
· 幫助構建可重復使用的工作流程/管道
· 提高功能/產(chǎn)品團隊之間的一致性和生產(chǎn)力
· 為與 ML 模型相關的所有 ML 相關功能/操作提供一個中心位置。
· 降低車輛集成障礙和所需的專業(yè)知識。
構建一個用于管理與軟件定義汽車相關的 ML 模型的尖端 ML 平臺還有許多其他優(yōu)勢。
本文有助于啟動有關 SDV 的思考過程以及模型管理如何對其成功至關重要。





