睡眠階段分類:加速度計(jì)+呼吸頻率的深度學(xué)習(xí)模型(LSTMCNN)實(shí)戰(zhàn)
在快節(jié)奏的現(xiàn)代生活中,睡眠質(zhì)量成為影響健康的關(guān)鍵因素。然而,傳統(tǒng)多導(dǎo)睡眠監(jiān)測(PSG)需在專業(yè)實(shí)驗(yàn)室佩戴數(shù)十個(gè)電極,既昂貴又不便。隨著可穿戴設(shè)備的普及,利用加速度計(jì)與呼吸頻率數(shù)據(jù)實(shí)現(xiàn)睡眠階段分類的深度學(xué)習(xí)模型應(yīng)運(yùn)而生。本文將揭秘一種融合LSTM與CNN的混合模型(LSTMCNN),如何通過智能手表等設(shè)備的數(shù)據(jù),精準(zhǔn)識別清醒、淺睡、深睡與快速眼動(dòng)(REM)四大睡眠階段。
一、睡眠科學(xué):從生理信號到階段劃分
睡眠并非均勻狀態(tài),而是由多個(gè)周期交替的階段組成。國際睡眠醫(yī)學(xué)學(xué)會將睡眠分為:
清醒期(Wake):身體活躍,腦電波頻率高;
淺睡期(N1/N2):肌肉放松,心率變緩,腦電波頻率降低;
深睡期(N3):代謝率降至最低,腦電波以δ波為主,修復(fù)身體機(jī)能;
快速眼動(dòng)期(REM):眼球快速運(yùn)動(dòng),腦電波接近清醒狀態(tài),夢境多發(fā)。
傳統(tǒng)PSG通過腦電圖(EEG)、眼電圖(EOG)與肌電圖(EMG)實(shí)現(xiàn)精準(zhǔn)分類,但可穿戴設(shè)備僅能采集加速度計(jì)(反映體動(dòng))與呼吸頻率(通過胸腹運(yùn)動(dòng)或血氧波動(dòng)估算)等間接信號。如何從這些“碎片化”數(shù)據(jù)中提取睡眠特征,成為模型設(shè)計(jì)的核心挑戰(zhàn)。
二、數(shù)據(jù)采集:可穿戴設(shè)備的“睡眠日記”
實(shí)戰(zhàn)的第一步是構(gòu)建高質(zhì)量數(shù)據(jù)集。我們使用某品牌智能手表,連續(xù)30天采集20名受試者的夜間數(shù)據(jù):
加速度計(jì):以25Hz頻率記錄三軸加速度,捕捉翻身、肢體微動(dòng)等動(dòng)作;
呼吸頻率:通過手表內(nèi)置的PPG傳感器監(jiān)測血氧波動(dòng),結(jié)合胸腹運(yùn)動(dòng)算法估算呼吸節(jié)律;
同步標(biāo)簽:受試者同時(shí)佩戴PSG設(shè)備,以EEG信號為“金標(biāo)準(zhǔn)”標(biāo)注睡眠階段。
數(shù)據(jù)預(yù)處理是關(guān)鍵環(huán)節(jié):
去噪:采用巴特沃斯濾波器去除加速度計(jì)的高頻噪聲,保留0.5-5Hz的運(yùn)動(dòng)信號;
分段:將連續(xù)數(shù)據(jù)按30秒窗口劃分(睡眠階段最小單位),生成28,800個(gè)樣本;
標(biāo)準(zhǔn)化:對加速度計(jì)幅值與呼吸頻率進(jìn)行Z-score標(biāo)準(zhǔn)化,消除個(gè)體差異。
三、模型架構(gòu):LSTM與CNN的“時(shí)空融合”
LSTMCNN模型的創(chuàng)新之處在于同時(shí)捕捉時(shí)間序列的長期依賴與局部特征:
1. CNN分支:提取局部運(yùn)動(dòng)模式
加速度計(jì)數(shù)據(jù)被重塑為1×30×3的張量(1通道,30秒窗口,3軸),輸入3層一維CNN:
第一層:16個(gè)3×1卷積核,捕捉3秒內(nèi)的肢體動(dòng)作模式;
第二層:32個(gè)5×1卷積核,識別5秒內(nèi)的運(yùn)動(dòng)趨勢(如翻身持續(xù)時(shí)長);
第三層:64個(gè)7×1卷積核,整合7秒內(nèi)的上下文信息。
每層后接BatchNorm與ReLU激活,最后通過全局平均池化(GAP)生成128維特征向量。
2. LSTM分支:建模呼吸節(jié)律的時(shí)序演變
呼吸頻率數(shù)據(jù)作為1×30×1的張量輸入雙層LSTM:
第一層:64個(gè)隱藏單元,捕捉呼吸頻率的短期波動(dòng)(如呼吸暫停事件);
第二層:32個(gè)隱藏單元,建模整夜呼吸節(jié)律的長期變化(如REM期呼吸變淺)。
LSTM輸出通過注意力機(jī)制加權(quán),突出關(guān)鍵時(shí)間點(diǎn)的呼吸特征,最終生成64維特征向量。
3. 特征融合與分類
CNN與LSTM的特征向量拼接后,輸入全連接層(128→64→4),通過Softmax輸出四大睡眠階段的概率分布。模型采用加權(quán)交叉熵?fù)p失函數(shù),對深睡期(N3)與REM期賦予更高權(quán)重,以解決類別不平衡問題。
四、從過擬合到泛化增強(qiáng)
模型在NVIDIA V100 GPU上訓(xùn)練,參數(shù)設(shè)置如下:
優(yōu)化器:Adam(學(xué)習(xí)率0.001,β1=0.9,β2=0.999);
批次大?。?28;
早停機(jī)制:驗(yàn)證集損失連續(xù)5輪不下降時(shí)終止訓(xùn)練。
初始模型在測試集上準(zhǔn)確率僅68%,主要問題在于:
過擬合:CNN對訓(xùn)練數(shù)據(jù)中的特定運(yùn)動(dòng)模式(如某受試者習(xí)慣性蜷腿)過度學(xué)習(xí);
呼吸信號噪聲:部分樣本因手表佩戴松動(dòng)導(dǎo)致呼吸頻率估算誤差達(dá)30%。
針對性優(yōu)化措施:
數(shù)據(jù)增強(qiáng):對加速度計(jì)數(shù)據(jù)添加高斯噪聲(σ=0.05),模擬不同佩戴松緊度;
多模態(tài)注意力:引入可學(xué)習(xí)的權(quán)重,動(dòng)態(tài)調(diào)整CNN與LSTM特征的貢獻(xiàn)度;
呼吸質(zhì)量篩選:剔除呼吸信號信噪比(SNR)低于10dB的樣本。
優(yōu)化后模型在獨(dú)立測試集上達(dá)到84.7%的準(zhǔn)確率,各階段F1分?jǐn)?shù)如下:
Wake:89.2%
N1/N2:81.5%
N3:87.1%
REM:82.3%
五、從實(shí)驗(yàn)室到真實(shí)場景
模型最終部署于智能手表的嵌入式芯片(ARM Cortex-M7),需解決兩大挑戰(zhàn):
計(jì)算資源限制:將CNN卷積核分解為深度可分離卷積,參數(shù)量減少75%;
實(shí)時(shí)性要求:采用滑動(dòng)窗口策略,每10秒輸出一次分類結(jié)果(延遲≤5秒)。
在真實(shí)用戶測試中,模型成功識別出典型睡眠事件:
深睡期:加速度計(jì)幾乎無波動(dòng),呼吸頻率降至12次/分鐘;
REM期:肢體微動(dòng)增加(可能與夢境相關(guān)),呼吸變淺且不規(guī)則;
睡眠中斷:連續(xù)翻身伴隨呼吸頻率驟升,模型準(zhǔn)確標(biāo)記為清醒期。
六、從“分類”到“干預(yù)”
LSTMCNN模型不僅為消費(fèi)級睡眠監(jiān)測提供了技術(shù)基石,更開啟了個(gè)性化睡眠干預(yù)的新可能:
智能鬧鐘:在淺睡期喚醒用戶,減少“睡眠惰性”;
呼吸訓(xùn)練:當(dāng)檢測到深睡期呼吸變淺時(shí),觸發(fā)手表震動(dòng)引導(dǎo)腹式呼吸;
疾病預(yù)警:長期監(jiān)測發(fā)現(xiàn)REM期呼吸暫停頻率升高,提示潛在睡眠呼吸暫停綜合征風(fēng)險(xiǎn)。
從實(shí)驗(yàn)室算法到改變生活的智能工具,LSTMCNN的實(shí)戰(zhàn)歷程印證了深度學(xué)習(xí)在醫(yī)療健康領(lǐng)域的巨大潛力。當(dāng)科技讀懂睡眠的語言,每個(gè)人都能擁有“數(shù)據(jù)驅(qū)動(dòng)”的好夢。





