Contexte
On suppose que l'on dispose de données "tête par tête" sur une période d'observation fixée et l'on souhaite construire un estimateur de la fonction de survie.
Références
Support de cours "L'estimation non paramétrique en présence de données censurées".
Mise en oeuvre
L'utilisation la plus simple est la suivante (après avoir chargé la librairie via library("survival")) :
t=read.table("data.txt",header=TRUE,sep=" ")
w=survfit(Surv(Entree,Sortie,NonCensure,type="counting")~1, data=t, type="kaplan-meier")
Avec par exemple les données disponibles ici on obtient les résultats suivant en utilisant l'instruction summary(w) :
time n.risk n.event survival std.err lower 95% CI upper 95% CI
80.5 7 1 0.857 0.132 0.633 1
80.8 5 1 0.686 0.186 0.403 1
Il est possible de réaliser plusieurs estimations en même temps (par exemple une ventilation par génération) en utilisant la syntaxe suivante :
w=survfit(Surv(AgeEntreeJours,AgeSortieJours,IndicateurNonCensure,type="counting")~generation, data=t, subset=SexeAssure==1, type="kaplan-meier")
|