混合效應線性模型與單因素方差分析在重復測量數據中的應用比較

時間:2022-03-18 08:02:00

導語:混合效應線性模型與單因素方差分析在重復測量數據中的應用比較一文來源于網友上傳,不代表本站觀點,若需要原創文章可咨詢客服老師,歡迎參考。

混合效應線性模型與單因素方差分析在重復測量數據中的應用比較

【關鍵詞】重復測量;混合效應線性模型;單因素方差分析;

摘要:目的:通過混合效應線性模型與單因素方差分析在重復測量資料中的應用比較,旨在說明兩方法在處理重復測量資料時的應用特點。方法:用混合效應線性模型和單因素方差分析處理重復測量資料并比較。結果:混合效應線性模型和單因素方差分析都是處理重復測量資料的重要統計方法,前者在選擇協方差結構下可對重復測量資料的固定效應和隨機效應參數及協方差矩陣進行參數估計和統計檢驗,后者可對重復測量資料的固定效應做出統計推斷。結論:混合效應線性模型是處理重復測量資料的有力方法,它對資料的協方差結構要求寬松,且結論可靠;單因素方差分析對資料的協方差結構有嚴格的限定。

關鍵詞:重復測量;混合效應線性模型;單因素方差分析;

統計方法特點重復測量數據(repeatedmeasuresdata)是醫學領域中常見的一種數據資料。所謂重復測量是指對同一個觀察對象在不同時間點上進行的多次測量[1]。由于重復測量資料是對同一受試對象的某一觀察指標進行的重復觀察所得的數據,同一受試者的觀察數據間可能存在相關性,一些傳統的統計學方法如t檢驗等就不能充分揭示這一內在特點,有時甚至會導致錯誤的結論。

對重復測量資料的分析方法大致可分為兩類,即單變量統計分析方法和多變量統計分析方法[2]。本研究通過選用多變量統計分析方法中的混合線性效應模型對一例題的分析,并與單因素方差分析進行比較,來說明兩種方法在處理重復測量資料中的應用特點。

1方法簡介

簡單說,混合效應線性模型就是所擬和的模型中既包含固定效應又包含隨機效應,特別是個體內的數據結構的選擇將對各因素的評價產生直接影響[3]。

混合效應線性模型是一般線性模型的擴展,其表達式為:

Y=Xβ+Zγ+ε(1)

X為已知設計矩陣,β為固定效應參數構成的未知向量,ε是未知的隨機誤差向量,其元素不必為同獨立分布了。在式(1)中Y,γ都是正態隨機向量,其均值為0,方差陣分別為G與R,二者之間不相關,因此Y的方差表達式為:

V=ZGZ+R(2)

當R=σ2I,Z=0時,混合線性模型退化為一般線性模型。對G和R必須選擇其協方差結構,常用的結構有無結構(一般為協方差)、自回歸(常用一階)、復合對稱(共同協方差加一對角元)等[4]。選擇協方差矩陣的方法是在相同的結構模型下,選擇幾個不同結構的協方差矩陣,從中選取似然比統計量(-2LogLikelihood)、Akaikes信息量標準(AkaikesInformationCriterion,AIC)及SchwartsBayesian標準(SchwartsBayesianCriterion,BIC)較小的一個,當這些統計量較接近時,則選取含參數個數最少的一個。通常以AIC為主要判斷指標。

2實例分析

下面用一實例比較兩種方法對處理重復測量資料時的特點:某藥有新舊兩種劑型,為了比較這兩種劑型的代謝情況,對16例病人服藥后分別在0、4、8、12小時測得血藥濃度(表1),問該藥新舊劑型的血藥濃度隨時間變化的趨勢是否一致。表1四個時間點某藥新舊劑型血藥濃度1用SAS軟件的MIXED過程對固定效應和隨機效應參數β、γ及協方差矩陣G、R進行估計和統計檢驗。在本例中因變量為血藥濃度,藥物劑型、測量時間為固定效應,受試者為隨機效應,同時選擇合適的協方差結構以便在控制隨機誤差的基礎上分析處理因素(藥物劑型)對反應變量(血藥濃度)的關系。本例指定為常用的無結構協方差(UN)和復合對稱性協方差(CS)。

模型擬合情況見表2。表2模型配合統計量由表2可見,在UN結構下協方差配合的似然比統計量-2LogLikelihood=398.0(表2),對無效模型的似然比檢驗,χ2=134.43,ν=9,P<0.0001,說明模型擬合效果顯著,模型較好地擬和了資料。在CS結構下,似然比統計量-2LogLikelihood=506.4,AIC、AICC、BIC三個值都是UN模型小于CS模型,故本例選用UN結構作模型擬合。

在UN結構下的固定效應參數估計值及假設檢驗結果見表3、4。

由表4可知,在UN結構下,不同處理組之間的差別無統計學意義(P=0.07551),不同測量時間點的血藥濃度及處理組×時間點的交互作用的差別有統計學意義(P<0.0001),且這種交互作用主要體現在新劑型組。

22應用SAS軟件的GLM過程,對表1的資料處理結果見表5。由表5可見,各處理組間時間因素間無差別,服從精確F分布,本例F處理組=0.09,P=0.77可見其處理組主效應與時間因素無關。

主效應F時間點受協方差矩陣類型分布影響,球形檢驗的近似χ2=27.0284,ν=5,對應P=0.0001,不符合球形假定,故須對分子分母的自由度進行校正,用H-F=0.8469作為校正因子,得:

分子的校正自由度為:

ν1=(p-1)=0.8469(4-1)=0.8469×3=2.54073

分母的校正自由度為:

ν2=(p-1)(∑mg=1(ng-1))=0.8469×3(14)=35.569836

查表得F0.05(3,36)=2.87<74.97,P<0.0001,可認為不同時間點的血藥濃度是不同的。

交互效應F處理組*F時間點也涉及時間點這一重復測量因子,故也要對其分子分母的自由度進行校正:

分子的校正自由度為:

ν1=(m-1)(p-1)=0.8469(2-1)(3-1)=1.69382

分母自由度校正同上,ν236

F0.05(2,36)=3.26<46.90,P<0.0001,可認為不同組在不同時間點的血藥濃度是不同的。表3固定效應的參數估計與比較表5單因素方差分析結果

3討論

由兩種方法對同一資料的處理可見,兩種方法的結論一致,但混合效應線性模型既考慮了觀察對象在不同觀察時點間的內在聯系,又考慮了觀察值間的內部相關性,結論更為可靠。

單因素方差分析和混合效應線性模型都可用來處理重復測量資料,單因素方差分析是應用最小二乘法進行配合的一般線性模型,此模型對協方差矩陣有著極端的假定,如果協方差陣的球形性得不到滿足,就必須進行多元方差分析或對F統計量進行校正,獲得校正概率;混合效應線性模型是基于似然函數法的原理,它對協方差矩陣的要求比單因素方差分析寬松,它允許資料存在某種相關性及協方差矩陣的多樣性,無須對自由度進行校正,能較好的適合重復資料的特點。

單因素方差分析很難估計參數,混合效應線性模型可以在所選擇的協方差結構下,估計固定效應及隨機效應參數,還可以估計隨機參數及隨機誤差的協方差陣G和R,所以應用范圍廣,即使常規分析模型,亦可作為其特例來應用[6]。

在配合混合效應線性模型時要根據研究目的和資料特點選擇一種模型,然后在此模型下選擇合適的協方差結構,只有選擇合適的協方差結構對固定效應參數的估計和推論才有意義。

參考文獻

1余松林,主編.重復測量資料分析方法與SAS程序第一版北京:科學出版社,2004,1.

2陳長生,徐勇勇,曹秀堂.醫學研究中重復測量數據的統計分析方法.中國衛生統計,1996,13(6):55.

3胡良平如何比較重復測量結果中華預防醫學雜志,2003,37(4):294

4周天樞,洪榮濤,陳崇幗,等.用混合線性效應模型處理復合測量數據的方法分析腦血管病死亡率中國衛生統計,2001,10(5):287.

5方積乾,主編醫學統計學與電腦實驗第二版上海:上??茖W技術出版社,2002,401.

6周天樞,洪榮濤,陳崇幗,等.用混合線性效應模型處理復合測量數據的方法分析腦血管病死亡率中國衛生統計,2001,10(5):288.