본문 바로가기
의학통계/통계분석

생존분석 - Kaplan-Meier Method 기초

by boogler 2022. 7. 7.
반응형

생존분석 - Kaplan-Meier Method 기초

 

생존분석에서 Kaplan-Meier Method는 survivor functions 예측에 가장 광범위하게 사용되는 방법입니다. Product-Limit estimator 로도 불리우며 SAS의 LIFETEST procedure를 이용해 구할 수 있습니다.


< SAS Code >

 

Lifetest 예제 데이터

ods graphics on;
proc lifetest data=surv_test method=KM plots=s;
time futime*cens(0);
run;
ods graphics off;

 

* method=KM 은 쓰지 않으셔도 default로 KM estimator를 구해줍니다.

* futime : time 변수

* cens : censored 여부가 있는 변수, ( ) 안의 숫자는 cens 변수의 값으로 censored data를 나타냅니다.

  ( 0 for censored data, 1 for uncensored data )

 

< SAS Output >

KM estimator

Survival

 

- K-M estimator (Product-Limit estimator) 값을 구해줍니다.

  ( ex1. futime=180(days)의 K-M estimator=0.56 으로 180일 이상 생존할 확률은 0.56 입니다.

    ex2. 1-year(365 days) 생존확률=0.44 (220 days와 동일함)

- tied values (동일한 time에 2개 이상의 case가 있는경우)의 경우는 마지막 case만 생존확률을 계산됩니다.

  ( ex. futime 8, 63 days )

- censored 된 데이터는 K-M estimator가 계산되지 않습니다.

  ( ex. futime 365, 852 ~ 2240 으로 * 표시 되어 있는 cases )

 

Failure

 

- ( 1 - KM estimator ) 값이며 특정시간 이전에 사망확률을 의미합니다.

 

Survival Standard Error

 

- K-M estimator의 standard error 값이며 Greenwood's formula 를 이용합니다.

 

Lifetest output

- 25, 50, 75th percentile을 보여주는데 제일 위의 output의 Failure 컬럼의 값을 참고합니다.

   ex) 25th percentile은 63 days, 50th는 210 days 이며

         75th는 0.7이상의 failure probability가 존재하지 않으므로 결과값이 없습니다.

- 즉, median death time=210 days 로 95% CI=(63, 1296) 입니다.

- Mean 값도 output으로 알려주나 survival data에서는 median (50th)값을 흔히 더 많이 사용합니다.

 

plot of KM survival function

 

- plot 위에 + 로 표시된 것이 8개 censored data 입니다.( cens=0 )

- censored data를 표시하고 싶지 않을때는 NOCENSOR option 을 사용합니다.

- ATRISK, CL option을 사용하여 95% CL과 plot 아래쪽에 censored 되지 않은 n수를 표시해줍니다. 

   ( plots=s(NOCENSOR ATRISK CL) )

 

 

- 위 plot의 95% CI의 데이터는 OUTSURV option을 통해 구할 수 있습니다.

 

< SAS Code >

proc lifetest data=surv_test method=KM outsurv=out_surv;
time futime*cens(0);
proc print data=out_surv;
run;

 

outsurv 결과

댓글