Longitudinal Data Analysis
우리가 매년 건강검진을 하게 되면, 임상데이터가 시간의 순서대로 반복적으로 쌓이게 되는데 이것을 longitudinal data로 보시면 됩니다. Longitudinal data 의 개념부터 GEE, Random Coefficient Analysis 분석방법까지 알아보겠습니다.
1. Longitudinal Data 란 무엇인가?
Longitudinal Data 는 시간적인 순서(temporal order)를 가진 특별한 종류의 clusterd data로 볼 수 있습니다.
그러면 먼저 데이터의 종류에 대해 알아 보면,
- Cross-sectional Data : 하나의 대상에 대해 한번 측정된 데이터
- Clustered Data : 대상자는 서로 iid (independent and identically distribution)이 아니고, 서로 correlated 되어 Cluster를 이루는 데이터
- Longitudinal Data : 동일한 대상자에 대해 시간의 흐름에 따라 반복적으로 측정한 데이터
가 있는데 동일한 대상자에 대한 시간에 따른 데이터를 longitudial 로 보면 된다.
Statistical study에서 Prospective cohort study를 longitudinal study로 볼 수 있으며, 보통 우리가 말하는 것은 Obervational longitudinal data를 의미한다. (i.e. Y(outcome)이 하나임).
Experimental longitudinal data는 적어도 Y값이 2개 이상 측정되어(pre-test vs. post-test) 그 분석방법은 Observational에 비해 난이도가 높다.
2. Longitudinal Data Anaysis의 목표
관심있는 하나의 response 변수에 대해 시간에 따른 변화를 연구할 수 있으며, 이는 Cross-sectional 연구에서는 할 수 없는 Longitudianl analysis의 최대 장점이다.
Outcome(=Y)가 Continuous or dichotomous 모두 GEE(Generalized Estimating Equation) 과 Random Coefficient analysis 를 이용해 분석한다.
3. Longitudinal Data Anaysis의 방법
- Within-subject effect : Time effect
- Between-subject effect : Group effect 로 이해하면 된다.
1) GEE (Generalized Estimating Equation)
Within-subject correlation (=하나의 대상자의 반복측정된 측정치 사이의 correlation이 각 대상자별로 다름)을 적절하게 잘 선택해야 하는 어려움이 있다.
< 여러가지 Correlation Structures >
1) independent structures
2) exchangeable structures
3) m-dependent structures
4) autoregressive structures
5) unstructured structures (=all correlations 가 서로 다름)
GEE는 이런 여러종류의 Correlation structure에 robust(=어떤 것이 선택되던지 결과는 동일함)한 것으로 알려져 있지만, 실제로는 어떤 Correlation structure를 사용하는가에 따라 결과가 달라져서 주의해야 한다.
GEE에서 wintin-subject correlation structure는 모델식안에서 covariate 처럼 취급된다.
2) Random Coefficient Analysis
때로는 multilevel analysis 또는 mixed effect analysis 로 알려져 있다. Between-subject 간의 regression coeffcient가 서로 다르다는 기본개념하에서 수행되어 지며 correction of variance 가 필요하다.
- Random intercept model ( i.e. 각 subject 마가 regression line의 intercept가 다르다(random)는 가정)
- Random slope model ( i.e. 각 subject 마가 regression line의 slope가 다르다(random)는 가정)
- Random intercept & slope 혼합 model
4. GEE와 Random coefficient analysis 의 비교
- GEE는 corelation structure를 통하여 Random Coeffcient analysis는 subject 간 다르다 것을 인정하는 것을 통해서 동일한 subject 내에서의 관측치를 correction 함으로써 logitudinal 분석을 수행하게 됨으로써 둘 다 적합한 방법이다.
- GEE에서 exchangable correlation은 random intercept model 과 동일한 결과를 얻게 된다.
'의학통계 > 통계분석' 카테고리의 다른 글
선형회귀모형 - Linear Regression (0) | 2022.06.22 |
---|---|
Categorical Data - Chi-sq test & McNemar test (0) | 2022.06.21 |
연관된 두 집단의 비교 - Paired t-test 와 Wilcoxon Signed Rank sum Test (0) | 2022.06.21 |
독립된 3개이상의 집단 비교 - ANOVA 와 Kruskal Wallis Test (0) | 2022.06.21 |
독립된 두 집단간의 비교 - T-TEST 와 Wilcoxon Rank Sum Test (0) | 2022.06.20 |
댓글