Les méthodes de Machine Learning peuvent-elles être plus performantes que l’avis d’experts pour classer les véhicules par risque homogène ?

Page précédente
Faire suivre ce document

Domaine(s)Mémoire
formation(s)ISFA () / resp.: / intervenant:
Show details for Informations sur les documentsInformations sur les documents
Hide details for Informations sur les documentsInformations sur les documents

Type de document Mémoires
sociétéAXA
Auteur(s) LAVENU J.
Numéro
Date de référence 10/18/2016


Résumé

Le marché IARD a subi ces dernières années de nombreuses transformations. Les changements réglementaires au travers de la loi Hamon et le développement de comparateur sur internet exacerbent la concurrence entre assureurs. Dans un marché qui devient de plus en plus arbitré par les prix, ces derniers doivent s’adapter en segmentant leur tarif. Pour autant, une segmentation trop fine pourrait remettre en cause le principe de mutualisation des risques et donc la notion même d’assurance. La question étant ainsi de définir le niveau de segmentation le plus adapté. En assurance automobile, les acteurs du marché ont recours à un principe de regroupement de véhicules en risques homogènes nommé véhiculier. Le véhiculier constitue aujourd’hui l’un des fondements de la tarification a priori. Pourtant, sa théorie a été peu développée dans la littérature actuarielle, tout particulièrement pour les véhicules de type "motos", qui constituent le périmètre de ce mémoire. Ceci s’explique en partie par le fait que les véhiculiers sont aujourd’hui souvent construits sur l’avis d’experts pour ce type de véhicules. De manière à anticiper le développement du Big Data, et dans la perspective d’identifier une segmentation au plus juste, sur la base de données que l’expert ne saurait, à lui seul, exploiter, ce mémoire a pour objectif d’élaborer un véhiculier non pas à dire d’experts mais à dire de machines. Dans un premier temps, deux approches pour établir un véhiculier à dire de machines sont développées en s’appuyant sur des travaux initiateurs existants. La première approche consiste à construire un arbre CART à l’appui d’une utilisation singulière de la théorie de la crédibilité. La seconde approche associe un autre algorithme de Machine, le Randon Forest, à un lissage spatial. Ensuite, les données utilisées sont présentées et fiabilisées. A partir de celles-ci des modèles GLM sont construits en extrayant la part du risque liée au véhicule. Enfin, à partir de l’effet véhicule extrait, des véhiculiers à dire de machines issus des deux approches sont construits puis comparés aux véhiculiers à dire d’experts, nous permettant alors de conclure quant au degré d’intervention pertinent des experts dans l’élaboration d’un véhiculier et donc d’une segmentation au plus juste du risque.

Abstract

In the recent years, the P& C market has passed through many changes. The competition between insurance companies is enhanced by regulatory changes (through the Hamon law for instance) and the development of online comparers. In an increasingly price arbitrated market, insurers have to adapt by segmenting their tariff. However, too much segmentation may call into question the principle of pooling risk and therefore the insurance concept. So insurers must determine the most appropriated level of segmentation. Cars and motorcycles insurances create a homogeneous risk pooling by clustering vehicles. This vehicle classification is one of a priori pricing foundations. However, it should be noted that vehicle classifications were poorly developed in the actuarial literature, especially for " motorcycles " type vehicles, which are the main subject of this study. This is partly explained by the fact that vehicle classification is now often built on expert judgement. In order to anticipate the development of the Big Data, and with a purpose to identify accurate segmentation and given big datasets available that the expert opinion can’t operate by his own, this paper aims to develop a vehicle classification not according to an expert opinion but according to machine learning. First, two approaches of vehicle classification by machines are built on previous studies results. The first approach consists on building a CART decision tree with the support of credibility theory. The second approach combines random forest and spatial smoothing. Then, data processing enables the use of a GLM model in order to extract claim costs related vehicle only. Finally, from the effect vehicle extract, vehicle classifications according machines were built with the two methods, then compared with vehicle classifications according to expert opinions. It allows us to conclude on the appropriate level of expert intervention in the development of vehicle classification and, therefore, to define a risk-adapted segmentation.

Mémoire complet

>MemoireIA_LAVENU_20160413.pdf


Lien permament : https://www.ressources-actuarielles.net/C12574E200674F5B/0/61FD1D9D4A936406C1257F940017DD28