Retour à l'accueil Page précédente

R et les modèles de durée


Cette page est consacrée à la description de l'utilisation de R dans le cadre de modèles de durée.

Une page de ressources (fichiers et packages) lui est associée.

Kaplan-Meier

Contexte


On suppose que l'on dispose de données "tête par tête" sur une période d'observation fixée et l'on souhaite construire un estimateur de la fonction de survie.

Références

Support de cours "L'estimation non paramétrique en présence de données censurées".

Mise en oeuvre

L'utilisation la plus simple est la suivante (après avoir chargé la librairie via library("survival")) :


t=read.table("data.txt",header=TRUE,sep=" ")
w=survfit(Surv(Entree,Sortie,NonCensure,type="counting")~1, data=t, type="kaplan-meier")

Avec par exemple les données disponibles ici on obtient les résultats suivant en utilisant l'instruction summary(w) :

time n.risk n.event survival std.err lower 95% CI upper 95% CI
80.5 7 1 0.857 0.132 0.633 1
80.8 5 1 0.686 0.186 0.403 1

Il est possible de réaliser plusieurs estimations en même temps (par exemple une ventilation par génération) en utilisant la syntaxe suivante :

w=survfit(Surv(AgeEntreeJours,AgeSortieJours,IndicateurNonCensure,type="counting")~generation, data=t, subset=SexeAssure==1, type="kaplan-meier")

Scripts écrits par Frédéric PLANCHET et Marc JUILLARD © 2007-2009