독립된 두 집단간의 비교 -T-TEST 와 Wilcoxon Rank Sum Test
독립인 두 집단간의 평균 비교에서, Y(=response variable)이 연속형인 경우 모수적 방법으로는 t-test, 비모수적 방법으로는 Wilcoxon rank sum, Mann-Whitney test 가 있습니다. Normality 를 위배하는 경우 비모수적 방법을 사용하거나 Data transformation (Log 등)을 통해 t-test 를 사용할 수도 있습니다.
1. 독립인 두 집단간의 모수적 비교 (independent two-sample t -test)
- Y(=response) 값이 normal assumption을 만족하는 Continuous 변수이다.
- 두 집단의 분산이 같은지(H0=등분산) 결과를 본 후 검정통계량을 선택한다.
Ex. 남녀 두 그룹의 BMI의 차이가 있는지 테스트해 보려 합니다.
<SAS Code>
libname test "C:\AnalysisCode\Tistory\data";
proc ttest data=test.test_data;
class sex;
var bmi;
run;
<SAS Output>
Ho : Equal variance 이므로 "Equality of Variance" test 의 p-value가 <.0001 이므로, Ho 즉, 등분산 가정을 기각하므로 Unequal (Satterthwaite method)의 p-value=0.6137을 사용합니다.
즉, 남자(sex=1), 여자(sex=2) 의 BMI의 차이는 -0.0591이며 이는 p-value=0.6137로 유의하지 않습니다.
2. 독립인 두 집단간의 비모수적 비교 (Wilcoxon rank sum test)
- Y(=response) 값이 normal assumption을 만족하지 않는 Continuous or Ordinal 변수입니다.
Ex. 남녀 두 그룹의 Triglyceride의 차이가 있는지 테스트해 보겠습니다.
<SAS Code>
- Normality Check
proc univariate data=test.test_data normal;
var tg;
title 'QQ plot of TG';
qqplot tg/ normal(mu=est sigma=est);
run;
- Wilcoxon rank sum test
proc NPAR1WAY data=test.test_data wilcoxon;
title "Nonparametric test to compare Triglyceride between sex";
class sex;
var tg;
run;
<SAS Output>
n수가 n=2520으로 2000이 넘으므로 흔히 정규성 check 에 사용되는 Shapiro-Wilk 결과는 나오지 않았습니다.
n=2000 이상일 경우는 Kolmogorov-Smirnov 결과를 이용하면 됩니다. . p-value 가 <0.01 로 정규성에 위배되며, 또한 Q-Q plot에서 꼬리 부분이 직선에서 많이 멀어져 있음을 확인할 수 있어 TG 변수는 정규성에 위배됨을 재확인 할 수 있습니다.
Wilcoxon rank sum test 결과 중 두 집단(남녀)의 Tg 변수의 차이를 보는 것이므로 Two-sided 검정과 sample size가 2000이상으로 다소 크므로 Normal Approximation을 선택합니다.
즉, p-value <.001 로 남녀 간 유의한 Tg 의 차이가 존재한다고 할 수 있습니다.
- t Approximation은 작은 sample size 인 경우 선택합니다.
- Data 가 아주 작고 skewed 되어 있는 경우 exact wilcox 구문을 사용하고 그 결과를 이용합니다.
'의학통계 > 통계분석' 카테고리의 다른 글
선형회귀모형 - Linear Regression (0) | 2022.06.22 |
---|---|
Categorical Data - Chi-sq test & McNemar test (0) | 2022.06.21 |
연관된 두 집단의 비교 - Paired t-test 와 Wilcoxon Signed Rank sum Test (0) | 2022.06.21 |
독립된 3개이상의 집단 비교 - ANOVA 와 Kruskal Wallis Test (0) | 2022.06.21 |
Longitudinal Data Analysis (0) | 2022.06.20 |
댓글