Vers une Nouvelle Ère de Pilotage de l’Absentéisme : Exploitation de la DSN, Utilisation du Machine Learning pour la Prédiction et Application sur un portefeuille de Prévoyance collective
Page précédente
Faire suivre
ce document
Domaine
(s)
Mémoire
formation(s)
ISFA () / resp.: / intervenant:
Informations sur les documents
Informations sur les documents
Type de document
Mémoires
société
ALPTIS
Auteur(s)
BEGUE L.
Numéro
Date de référence
04/18/2024
Mémoire confidentiel jusqu'au 18/04/2026
Résumé
Au cours de ces dernières années, l'absentéisme en entreprise n'a cessé de croître pour tous les secteurs d'activité. Cette augmentation pose de nombreux défis pour les entreprises, allant des perturbations organisationnelles à la baisse de la productivité, en passant par des coûts financiers considérables. Si la nécessité de comprendre et d'anticiper les tendances de l'absentéisme était déjà prégnante, l’apparition de la pandémie de COVID-19 a accentué cette exigence. Effectivement, la pandémie mondiale a exacerbé les effets de l'absentéisme, soulignant davantage son importance pour tous l’ensemble des acteurs. Ce mémoire cherche donc à approfondir la compréhension et à prédire les tendances de l'absentéisme, en utilisant comme principal indicateur : le taux d'absentéisme. À partir des données issues de la Déclaration Sociale Nominative, l'étude se concentre sur un portefeuille global comprenant presque 210 000 individus, englobant à la fois des personnes en santé et/ou en prévoyance, sur une période de cinq ans. L'objectif est d'implémenter des techniques avancées de Machine Learning pour étudier l'absentéisme et de comparer les bases de données traditionnelles de prévoyance à celles des récentes bases DSN. L'application des méthodes de Machine Learning offre d'abord une opportunité d'analyser les variables ayant le plus d'impact dans la modélisation du taux d'absentéisme, et d'avancer des premières prédictions sur ce taux. Toutefois, vu la complexité inhérente à l'absentéisme, l'approche adoptée intègre divers algorithmes issus des méthodes de Bagging et de Boosting. Cette diversification méthodologique vise à identifier l'algorithme le plus adapté à cette étude. Le mémoire mettra ensuite l'accent sur la valeur ajoutée de la DSN, qui fournit une information transparente et sans franchise sur les arrêts de travail, contrairement aux bases de prévoyance. Pour cela, l'analyse est ciblée sur un périmètre précis : les individus disposant au moins une couverture prévoyance dans la DSN. L'objectif principal est de comparer minutieusement les données sur l'absentéisme provenant de ces deux bases, dans le but de révéler le biais potentiel existant. L'avènement de la DSN, associée aux progrès récents du Machine Learning, marque un tournant, ouvrant ainsi une porte vers une analyse du risque d'absentéisme bien plus raffinée que les méthodes traditionnelles. Couvrant la période de 2018 à 2022, l'étude capture les variations de l'absentéisme pré- et post-COVID-19, intégrant ainsi l'impact direct de la pandémie sur l'absentéisme.
Abstract
Over the past few years, absenteeism in companies has been constantly increasing, regardless of the business sectors. This rise poses many challenges for companies, from organizational disruptions to decreased productivity and significant financial costs. If the need to understand and anticipate absenteeism trends was already pressing, the emergence of the COVID-19 pandemic has accentuated this requirement. Indeed, the global pandemic has exacerbated the effects of absenteeism, further highlighting its importance for all stakeholders. This thesis therefore seeks to deepen the understanding and to predict absenteeism trends, using the absenteeism rate as the main indicator. Using data from the Nominative Social Declaration, the study focuses on a comprehensive portfolio comprising almost 210,000 individuals, including both health and/or provident scheme members, over a five-year period. The goal is to implement advanced Machine Learning techniques to study absenteeism and compare traditional provident fund databases with recent DSN databases. The application of Machine Learning methods firstly offers an opportunity to analyze the variables with the most impact on the modelling of absenteeism rate, and to make initial predictions about this rate. However, given the inherent complexity of absenteeism, the approach integrates various algorithms from Bagging and Boosting methods. The aim of this methodological diversification is to identify the most suited algorithm to this study. The thesis will then focus on the added value of the DSN, which provides transparent information with no deductible on work stoppages, unlike our provident fund databases. To do this, the analysis will focus on a specific perimeter: individuals with at least one provident cover in the DSN. The main goal is to meticulously compare absenteeism data from these two databases, aiming to reveal any potential bias. The advent of the DSN, combined with recent advances in Machine Learning, marks a turning point, opening the door to a far more refined analysis of absenteeism risk than traditional methods. Covering the period from 2018 to 2022, the study captures the variations in absenteeism pre- and post-COVID-19, thus integrating the direct impact of the pandemic on absenteeism.
Lien permament :
https://www.ressources-actuarielles.net/C12574E200674F5B/0/8C83CF0CE7CB69B2C1258A9D0041A756