Survival (Sağkalım) Analizi


Bugün sizlerle survival - sağkalım analizinin R programlamada nasıl yapılacağına bir göz atacağız. R programlamaya geçmeden önce sağkalım analizi ne işimize yaradığına dair birkaç bilgi verelim.

SURVİAL ( SAĞKALIM ) ANALİZİ

Yaşam analizi genel olarak ölümlerin ya da bir mekanizmanın başarılı olup olmayacağı noktasında tahminleme yapmak için kullanılmaktadır. Hapisten çıkanların tekrar suç işleme oranları, boşanma ve binaların eskime zamanları gibi analizlerde kullanılabilir. Genel olarak “ömür” kavramı üzerinde odaklanmaktadır. Örneğin kanser olan bir hastanın ömür hesaplanmasında yada yeni yapılan bir makine düşünüldüğünde makinenin kullanım ömrü ile ilgili hesaplamalar ve bu hesaplar sonucu tahminler oluşturmaktadır. Bu analiz için aşağıdaki testler kullanılabilir

1-      Yaşam Tablosu

2-      Kaplan – Meier Testi

3-      Longrank testi

4-      Breslow testi

5-      Terane – ware testi

6-      Cox Regreston Testi

Analize Ait Varsayım:

·         Hastaya sağlanan koşulların izleme süresi boyunca değişmemesi

Hipotez ise

H0 = Model uygundur

H1 = Model uygun değildir şeklinde kurulabilir.

R PROGRAMLAMADA SURVIVAL ANALİZİ

ÖRNEK - I

R programlamada sağkalım analizi “survival” isimli bir paketle yapılmaktadır. Bu paket içerisinde kullanacağımız komutlar ise “surv” ve  “surfit” komutlarıdır. Bu komutlardan “surv” elimizdeki veriyi formülleştirmemizi sağlarken “sufit” ise grafik işlemleri için kullanılmaktadır. Elbetteki bu paket içerisinde de kendisine ait bir veri seti bulunmaktadır. Bu verisetinin adı ise “pbc” dir. Bu veriseti siroz hastalığına yakalanan kişilerin sağkalım verisini tutmaktadır. Veri setinde cinsiyet, yaş gibi bilgilerin yanısıra bir çok tıbbi bilgi içermektedir. Biz bu veri setinde “zaman” ve “durum” sütunlarıyla ilgileneceğiz.

Öncelikle “survival” paketini indirelim ve kullanıma hazır hale getirelim.

install.packages("survival")

library("survival")

Daha sonra verisetini incelemek için ilk altı kaydı çağıralım.

head(pbc)

Şimdi veri analizine geçebiliriz. Daha önceden söylediğimiz gibi “time” ve “status” alanlarıyla ilgileniyoruz. Öncelikle “surv” komutunun argümanlarına bir bakalım;

Surv(time, time2, event, type=c('right', 'left', 'interval', 'counting', 'interval2', 'mstate'), origin=0)

“time” argümanları hastayı takipe başladığımız ve takibi bitirdiğimiz zaman aralığını simgeler, “event” argümanı hastanın ölü (0) yada sağ (1) olduğunu açıklar, “type” argümanı sansür türünü belirleyen karakter dizisini simgelemektedir.

Şimdi bir sağkalım nesnesi oluşturalım

survfit(Surv(pbc$time,pbc$status == 2)~1)

ve grafiğe dönüştürelim

plot(survfit(Surv(pbc$time,pbc$status == 2)~1))

ÖRNEK – II

Yine aynı paket içerisinde bulunan bir diğer veri setimiz “lung” üzerinde bazı örnekler uygulayacağız. Bu veri seti karaciğer kanseri olan bazı hastaların bilgilerini tutmaktadır. Yaş durum cinsiyet gibi birçok değişken veri seti içerisinde mevcuttur.

Şimdi bir survival nesnesi oluşturalım ve kullanacağımız değişkenler yine durum ve zaman olsun.

survobj <- with(lung, Surv(time,status))

Kaplan – Meier Testi uygulayalım ve bir grafik içerisinde görelim.

kp <- survfit(survobj~1, data=lung)

plot(kp, xlab="Survival Time in Days",                   ylab="% Surviving", yscale=100,main="Survival Distribution (Overall)")

Kadın ve erkeklerin hayatta kalma dağılımlarını karşılaştıralım ve grafikte görelim.

comp <- survfit(survobj~sex,data=lung)

plot(fit1, xlab="Survival Time in Days",   ylab="% Surviving", yscale=100, col=c("red","blue"),  main="Survival Distributions by Gender")

  legend("topright", title="Gender", c("Male", "Female"),  fill=c("red", "blue"))

Sonuçlar biz erkekler için pek iç açıcı görünmüyor gibi..:) Aynı veri seti üzerinde Longrank testi uygulayalım

survdiff(survobj~sex, data=lung)

 

Survival – SağKalım Analizi ile ilgili anlatılacaklar bu kadar. Soru ve önerilerinizi facebook sayfamızdan verebilirsiniz. Facebook sayfamız  için aşağıdaki beğen butonuna tıklamayı unutmayınız.

KAYNAK

https://cran.r-project.org/web/packages/survival/survival.pdf

http://www.tutorialspoint.com/r/r_survival_analysis.htm

http://www.statmethods.net/advstats/glm.html

 

 

Yazar Kimdir?

Sıtkı Cansu, 19 Ekim 1985 yilinda Konya-Beyşehir'de dogmustur.İlk, orta ve liseyi Beyşehir'de bitirmis olup Konya-Ereğli Selçuk MYO Bilgisayar programcılığı ve Mugla Sıtkı Koçman Üniversitesi İstatistik bölümünden mezun olmustur. Çesitli yerlerde web tasarımcı ve veri tabani yöneticisi olarak çalışan yazar, son üç senedir ingilizce öğretmenliği yapmaktadir. Şu anda yüksek lisansını tamamlamak üzere Mugla Üniversitesinde öğrenim görmektedir.