Apprentissage statistique en tarification non-vie : quel avantage opérationnel ?

Page précédente
Faire suivre ce document

Domaine(s)Mémoire
formation(s)ENSAE () / resp.: / intervenant:
Show details for Informations sur les documentsInformations sur les documents
Hide details for Informations sur les documentsInformations sur les documents

Type de document Mémoires
sociétéSIA Partners
Auteur(s) GUILLOT A.
Numéro
Date de référence 11/02/2015


Résumé

Dans un contexte d’accentuation perpétuelle de la segmentation tarifaire en assurance non-vie, la modélisation des effets non linéaires, des interactions et la sélection des facteurs de risque les plus pertinents sont des enjeux clés pour ce secteur. Afin de répondre à la problématique de la non-linéarité, ce mémoire compare le modèle économétrique classique, à savoir le modèle linéaire généralisé (GLM), avec trois méthodes issues de l’apprentissage statistique : une extension simple mais naturelle du GLM standard, un modèle additif généralisé (GAM), et une forêt aléatoire (random forest). Ces différentes techniques ont été comparées sous l’angle de la parcimonie afin de privilégier l’interprétabilité et l’applicabilité opérationnelle des modèles élaborés. En complément de cette analyse comparative, ce mémoire propose des solutions pour traiter deux difficultés pratiques importantes : l’utilisation d’une méthode de régularisation, le Lasso, pour résoudre les problèmes computationnels liés à la sélection de variables ; l’exploitation de la forêt aléatoire pour la prise en compte automatique des interactions.

Abstract

In a situation of constant emphasis on pricing segmentation in P&C insurance, non linear effects and interactions modelling, and features selection are key issues for this sector. In order to answer the non-linearity question, this memoir compares the classical econometric model, the generalized linear model (GLM), with three statistical learning methods: a simple but natural extension of the GLM, a generalized additive model (GAM), and a random forest. These various techniques have been compared under the light of parsimony, in order to promote interpretability and operational applicability. As a complement of this comparative analysis, this memoir offers solutions to deal with two major practical difficulties: use of a regularisation method, the Lasso, to solve computational problems related to variable selection; exploitation of random forest to automatically take into account interactions.

Mémoire complet

>GUILLOT.pdfGUILLOT.pdf

Lien permament : https://www.ressources-actuarielles.net/C12574E200674F5B/0/871FAA1859C64D73C1257FB60026CE7D