Analyse de coût en Assurance Non-Vie: Modèles Linéaires Généralisés vs Méthodes d'Apprentissage Statistique

Page précédente
Faire suivre ce document

Domaine(s)Mémoire
formation(s)ISFA () / resp.: / intervenant:
Show details for Informations sur les documentsInformations sur les documents
Hide details for Informations sur les documentsInformations sur les documents

Type de document Mémoires
sociétéPwC
Auteur(s) PERRIN C.
Numéro
Date de référence 01/06/2014


Résumé

L'objectif de ce projet est de modéliser le coût d'un contrat d'assurance non-vie, dont les caractéristiques seront décrites au début de ce travail, de deux manières différentes : la première par Modèle Linéaire Généralisé (MLG), la deuxième à l'aide de l'algorithme Classification And Regression Trees (CART), relatif à la théorie de l'Apprentissage Statistique. Au terme de ces deux mises en application, nous serons en mesure de réaliser une comparaison des deux méthodes et d'en résumer les principaux intérêts et inconvénients. Dans un premier temps, nous appliquerons plusieurs retraitements sur la base de données qui sera utilisée pour les deux modélisations. Nous effectuerons également une première analyse univariée afin d'observer l'évolution des coûts selon les variables caractérisant un contrat. Ensuite, nous appliquerons un MLG à nos données, après avoir déterminé les variables explicatives entrant en jeu dans la tarification. Nous confronterons les résultats du MLG à l'analyse univariée, et validerons notre modèle par une étude des résidus. Enfin, nous présenterons une méthode de lissage des résultats. Dans une troisième partie, nous aborderons les notions d'apprentissage statistique et d'arbre de décision binaire. La méthodologie sera ensuite appliquée aux données d'assurance. Nous mettrons notamment en pratique les techniques de validation croisée et d'élagage afin d'obtenir un arbre de décision optimal en termes de qualité et de complexité. Nous validerons également le modèle par une analyse des résidus. Enfin, dans une dernière partie, nous confronterons les estimations aux observations afin d'évaluer la qualité de prédiction, et nous comparerons les résultats MLG et CART entre eux en vue de conclure quant à la stabilité des résultats d'une méthode à l'autre. Cela nous permettra d'évaluer les points forts et les points faibles de chaque méthode. Le MLG étant largement la méthode privilégiée par les assureurs aujourd'hui, nous discuterons d'une éventuelle mise en pratique sur le marché d'une tarification par CART.

Abstract

The goal of this project is modeling the cost of a non-life insurance contract, whose characteristics will be described at the beginning of this work, in two different ways: the first using a Generalised Linear Model (GLM), the second thanks to the Classification And Regression Trees (CART) algorithm, being part of the Machine Learning theory. At the end of these two modelings, we will be able to make a comparison of the two methods and to summarise their main interests and inconveniences. First, we will apply several cleaning processes on the database which will be used for the two modelings. We will also do a first oneway analysis in order to observe the cost evolution in function of the variables defining a contract. Then, we will apply a GLM to our data, once having determined the explanation variables involved in pricing. We will compare the GLM results with the oneway analysis, and validate our model with a residual analysis. Finally, we will present a smoothing method of the results. In a third step, we will introduce to machine learning and binary decision trees concepts. The methodology will then be applied to the insurance data. We will particularly implement the cross validation and pruning techniques in order to get an optimal decision tree in terms of quality and complexity. We will also validate the model with a residual analysis. Finally, in a last part, we will compare the estimates with the observations to evaluate the quality of forecasting, and the GLM and CART results to conclude on the stability of results from one method to another. This will enable us to evaluate strengths and weaknesses of each method. The GLM being largly used by insurers nowadays, we will discuss about a possible application on the market of a CART pricing.

Mémoire complet

>Memoire.pdf



Lien permament : https://www.ressources-actuarielles.net/C12574E200674F5B/0/6306B1213427E2A0C1257C65004EE9D3