본문 바로가기
의학통계/통계분석

Longitudinal Data Analysis

by boogler 2022. 6. 20.
반응형

Longitudinal Data Analysis

 

우리가 매년 건강검진을 하게 되면, 임상데이터가 시간의 순서대로 반복적으로 쌓이게 되는데 이것을 longitudinal data로 보시면 됩니다. Longitudinal data 의 개념부터 GEE, Random Coefficient Analysis 분석방법까지 알아보겠습니다.


1. Longitudinal Data 란 무엇인가?

Longitudinal Data 는 시간적인 순서(temporal order)를 가진 특별한 종류의 clusterd data로 볼 수 있습니다.

 

그러면 먼저 데이터의 종류에 대해 알아 보면,

 

- Cross-sectional Data : 하나의 대상에 대해 한번 측정된 데이터

- Clustered Data : 대상자는 서로 iid (independent and identically distribution)이 아니고, 서로 correlated 되어                                Cluster를 이루는 데이터

- Longitudinal Data : 동일한 대상자에 대해 시간의 흐름에 따라 반복적으로 측정한 데이터

 

가 있는데 동일한 대상자에 대한 시간에 따른 데이터를 longitudial 로 보면 된다.

 

Statistical study에서 Prospective cohort study를 longitudinal study로 볼 수 있으며, 보통 우리가 말하는 것은 Obervational longitudinal data를 의미한다. (i.e. Y(outcome)이 하나임).

Experimental longitudinal data는 적어도 Y값이 2개 이상 측정되어(pre-test vs. post-test) 그 분석방법은 Observational에 비해 난이도가 높다.

Study Design 종류

2. Longitudinal Data Anaysis의 목표

관심있는 하나의 response 변수에 대해 시간에 따른 변화를 연구할 수 있으며, 이는 Cross-sectional 연구에서는 할 수 없는 Longitudianl analysis의 최대 장점이다.

Outcome(=Y)가 Continuous or dichotomous 모두 GEE(Generalized Estimating Equation) 과 Random Coefficient analysis 를 이용해 분석한다.

3. Longitudinal Data Anaysis의 방법

- Within-subject effect : Time effect

- Between-subject effect : Group effect  로 이해하면 된다.

 

1) GEE (Generalized Estimating Equation)

 

Within-subject correlation (=하나의 대상자의 반복측정된 측정치 사이의 correlation이 각 대상자별로 다름)을 적절하게 잘 선택해야 하는 어려움이 있다.

 

< 여러가지 Correlation Structures >

1) independent structures

2) exchangeable structures

3) m-dependent structures

4) autoregressive structures

5) unstructured structures (=all correlations 가 서로 다름)

 

GEE는 이런 여러종류의 Correlation structure에 robust(=어떤 것이 선택되던지 결과는 동일함)한 것으로 알려져 있지만, 실제로는 어떤 Correlation structure를 사용하는가에 따라 결과가 달라져서 주의해야 한다.

GEE 예제 데이터

GEE에서 wintin-subject correlation structure는 모델식안에서 covariate 처럼 취급된다.

 

2) Random Coefficient Analysis

 

때로는 multilevel analysis 또는 mixed effect analysis 로 알려져 있다. Between-subject 간의 regression coeffcient가 서로 다르다는 기본개념하에서 수행되어 지며 correction of variance 가 필요하다.

 

- Random intercept model ( i.e. 각 subject 마가 regression line의 intercept가 다르다(random)는 가정)

- Random slope model ( i.e. 각 subject 마가 regression line의 slope가 다르다(random)는 가정)

- Random intercept & slope 혼합 model

4. GEE와 Random coefficient analysis 의 비교

- GEE는 corelation structure를 통하여 Random Coeffcient analysis는 subject 간 다르다 것을 인정하는 것을 통해서 동일한 subject 내에서의 관측치를 correction 함으로써 logitudinal 분석을 수행하게 됨으로써 둘 다 적합한 방법이다. 

- GEE에서 exchangable correlation은 random intercept model 과 동일한 결과를 얻게 된다.

 

댓글