醫學領域中,臨床治療、預后隨訪、健康體檢及健康管理等產生了大量的縱向數據,比如說中國大型公共數據庫CHARLS。 對縱向數據的分析,軌跡模型諸位都比較熟悉了,多多少少是聽過的,如群組軌跡模型(GBTM)、潛類別增長模型(LCGM)等。 然而,這些傳統統計方法通常只能利用單變量縱向數據的信息進行研究,無法充分利用多變量縱向數據信息。 近年來提出的研究多變量發展軌跡的一種方法:群組多軌跡模型(GBMTM),又稱多變量軌跡模型,通過影響目標結局的多個指標來識別遵循相似軌跡的潛在人群亞組,在處理多變量縱向數據中具有獨特優勢 今天,我們中華流行病學的雜志的一實例帶大家了解一下群組多軌跡模型(GBMTM)這個方法。 ![]() 一起詳細看看! 群組多軌跡模型(GBMTM) 在學習群組多軌跡模型之前,我們先要了解幾個概念。 首先,縱向數據指每一個體在不同觀測時點的測量值集合,其中包含了很多隨時間或年齡變化而變化的變量,如血壓、體重等,此類變量也被稱為時依變量。 時依變量在時間線上依次排列而形成的軌跡被稱為發展軌跡,其能夠動態描述變量隨時間的變化特征。 在醫學領域中,識別和監測時依變量不同的發展軌跡亞組具有重要意義,如可進一步分析軌跡分組的決定因素或不同軌跡組不良健康結局的風險因素等。 傳統的統計分析方法中,有一些能夠對發展軌跡有相似進程的集群亞組進行識別,如建模較為簡單靈活的群組軌跡模型(GBTM)和適用于較復雜數據的潛在類別混合模型等。 但是呢,疾病的發生和發展通常是由復雜的、相互依賴的多個時依變量相互作用的結果。傳統的統計方法一般僅能利用其中關于疾病進展過程的單一變量信息,而無法充分利用多個變量的發展軌跡及其相互作用的信息。 為解決這一問題,Nagin等于2018年對傳統GBTM進行了改進,使其通過對多個感興趣的變量(時依變量)定義軌跡組,即通過同時分析多個變量的聯合軌跡,識別潛在的個體集群,因此被稱為群組多軌跡模型(GBMTM)。 對于GBMTM方法,我們普通的科研學者其實不需要清楚內部的一些算法,學習如何應用即可,接下來用實例做個展示。
GBMTM在縱向數據研究中的實例分析 一、研究設計 實例數據來自于一項基于智能穿戴設備的老年人健康管理研究。
二、主要分析結果 1.GBTM分別對運動量、深睡比和心率進行單變量軌跡分析 按軌跡特征進行分類:
![]() 2.通過GBMTM 識別運動量、深睡比及心率的聯合軌跡分組 基于 GBMTM 擬合軌跡過程中的逐步篩選指標,結果顯示,軌跡組數為 5 的模型其 BIC 值優于軌跡組數為 4 的模型,擬合指標均達到推薦值。 然而,軌跡組數為5的模型中并未發現與軌跡組數為 4 的模型有實質性差異的組。 ![]() 為簡單起見,本研究最終選擇軌跡組數為 4 的聯合軌跡模型,按軌跡特征分別命名為:
其中,組1各項縱向指標的變化趨勢均較為平穩且深睡比最高;組2心率水平最高;組3與組2的差異主要體現在心率水平及變化趨勢不同,組3心率水平低且呈下降趨勢;組4運動量最高。 ![]() 不同軌跡組間的基線運動量、深睡比及心率差異有統計學意義(均P<0.001)。 ![]() 3.采用Cox比例風險回歸模型,評估不同軌跡亞組與高血壓發生風險之間的關聯。 在單變量軌跡分析中,深睡比軌跡組及心率軌跡組與參與者高血壓發生風險間有統計學關聯。 ![]() 在多變量聯合軌跡分析中,在調整混雜因素的模型3中,以組1作為參照,組3和組4的 HR 值(95%CI)分別為1.50(1.17~1.93)和1.32(1.01~1.73),而未發現組 2與參與者高血壓發生風險間有統計學關聯。 ![]()
對多變量縱向數據進行聯合軌跡分析能夠將更多的信息納入到建模過程中,有利于識別到更具有臨床意義或更深入的生物學見解的分組。 那么,為什么要介紹GBMTM呢? 與其他針對多個變量發展軌跡的聚類分析方法相比,GBMTM更適合普通學者,具有以下優勢: ①不同變量的測量時間可以是不同尺度(如年、小時或分鐘); ②能夠同時對多個不同類型的變量進行聚類分組(如連續變量、離散變量和分類變量); ③允許數據含有缺失值; ④允許通過后驗聚類概率量化組內成員的不確定性; ⑤分組結果易于解釋。 研究中識別出潛在的軌跡分組之后,常見的后續分析策略是將確定的軌跡分組與臨床結局或感興趣的暴露相聯系。根據分析目的,軌跡分組既可以作為后續分析中的自變量,也可以作為結果變量。 參考文獻: [1]王孝焱,孫秀彬,紀伊曼,等. 群組多軌跡模型在縱向數據研究中的應用及實例分析[J]. 中華流行病學雜志,2024,45(11):1590-1597.DOI:10.3760/cma.j.cn112338-20240529-00314 [2]Nagin DS, Jones BL, Passos VL, et al. Group-based multitrajectory modeling[J]. Stat Methods Med Res, 2018,27(7):2015-2023. DOI:10.1177/0962280216673085. [3]紀伊曼.老年人心率晝夜節律的縱向函數型數據分析[D].山東大學,2023.DOI:10.27272/d.cnki.gshdu.2023.001444. |
|