Analyse de coût en Assurance Non-Vie: Modèles Linéaires Généralisés vs Méthodes d'Apprentissage Statistique
Page précédente
Faire suivre
ce document
Domaine
(s)
Mémoire
formation(s)
ISFA () / resp.: / intervenant:
Informations sur les documents
Informations sur les documents
Type de document
Mémoires
société
PwC
Auteur(s)
PERRIN C.
Numéro
Date de référence
01/06/2014
Résumé
L'objectif de ce projet est de modéliser le coût d'un contrat d'assurance non-vie, dont les caractéristiques seront décrites au début de ce travail, de deux manières différentes : la première par Modèle Linéaire Généralisé (MLG), la deuxième à l'aide de l'algorithme Classification And Regression Trees (CART), relatif à la théorie de l'Apprentissage Statistique. Au terme de ces deux mises en application, nous serons en mesure de réaliser une comparaison des deux méthodes et d'en résumer les principaux intérêts et inconvénients. Dans un premier temps, nous appliquerons plusieurs retraitements sur la base de données qui sera utilisée pour les deux modélisations. Nous effectuerons également une première analyse univariée afin d'observer l'évolution des coûts selon les variables caractérisant un contrat. Ensuite, nous appliquerons un MLG à nos données, après avoir déterminé les variables explicatives entrant en jeu dans la tarification. Nous confronterons les résultats du MLG à l'analyse univariée, et validerons notre modèle par une étude des résidus. Enfin, nous présenterons une méthode de lissage des résultats. Dans une troisième partie, nous aborderons les notions d'apprentissage statistique et d'arbre de décision binaire. La méthodologie sera ensuite appliquée aux données d'assurance. Nous mettrons notamment en pratique les techniques de validation croisée et d'élagage afin d'obtenir un arbre de décision optimal en termes de qualité et de complexité. Nous validerons également le modèle par une analyse des résidus. Enfin, dans une dernière partie, nous confronterons les estimations aux observations afin d'évaluer la qualité de prédiction, et nous comparerons les résultats MLG et CART entre eux en vue de conclure quant à la stabilité des résultats d'une méthode à l'autre. Cela nous permettra d'évaluer les points forts et les points faibles de chaque méthode. Le MLG étant largement la méthode privilégiée par les assureurs aujourd'hui, nous discuterons d'une éventuelle mise en pratique sur le marché d'une tarification par CART.
Abstract
The goal of this project is modeling the cost of a non-life insurance contract, whose characteristics will be described at the beginning of this work, in two different ways: the first using a Generalised Linear Model (GLM), the second thanks to the Classification And Regression Trees (CART) algorithm, being part of the Machine Learning theory. At the end of these two modelings, we will be able to make a comparison of the two methods and to summarise their main interests and inconveniences. First, we will apply several cleaning processes on the database which will be used for the two modelings. We will also do a first oneway analysis in order to observe the cost evolution in function of the variables defining a contract. Then, we will apply a GLM to our data, once having determined the explanation variables involved in pricing. We will compare the GLM results with the oneway analysis, and validate our model with a residual analysis. Finally, we will present a smoothing method of the results. In a third step, we will introduce to machine learning and binary decision trees concepts. The methodology will then be applied to the insurance data. We will particularly implement the cross validation and pruning techniques in order to get an optimal decision tree in terms of quality and complexity. We will also validate the model with a residual analysis. Finally, in a last part, we will compare the estimates with the observations to evaluate the quality of forecasting, and the GLM and CART results to conclude on the stability of results from one method to another. This will enable us to evaluate strengths and weaknesses of each method. The GLM being largly used by insurers nowadays, we will discuss about a possible application on the market of a CART pricing.
Mémoire complet
>
Memoire.pdf
Lien permament :
https://www.ressources-actuarielles.net/C12574E200674F5B/0/6306B1213427E2A0C1257C65004EE9D3