Aluno: Tiago Filipe Pinto Rebelo
Resumo
O turnover voluntário é um dos grandes desafios enfrentados pelos recursos humanos e pelas respetivas organizações, principalmente devido aos custos associados, como recrutamento, formação e perda de conhecimento organizacional. Nesse sentido, este projeto tem como objetivo desenvolver um modelo de machine learning, para uma empresa do setor segurador, que identifique quais os colaboradores com maior probabilidade de saírem voluntariamente, assim como as variáveis que mais influenciam essa decisão, fornecendo à empresa uma ferramenta importante na prevenção do turnover e de implementação de estratégias de retenção.
A metodologia adotada foi o CRISP-DM que é composta por seis fases: compreensão do negócio, compreensão dos dados, preparação dos dados, modelação, avaliação e implementação. O conjunto de dados era composto por 1121 observações das quais 92 eram saídas. Para lidar com o desbalanceamento das classes, aplicaram-se técnicas de oversampling e undersampling. Para encontrar os melhores hiperparâmetros de cada algoritmo foi utilizado o método RandomizedSearchCV.
O conjunto de dados foi dividido em 80% para treino e 20% para teste, utilizando validação cruzada k-fold com 5 folds (subconjuntos) no conjunto de treino. Foram avaliados cinco modelos de classificação: Regressão Logística, Árvore de Decisão, Floresta Aleatória, XGBoost e AdaBoost. A Floresta Aleatória destacou-se como o melhor modelo, com precisão e sensibilidade de 82%, e especificidade de 98%, no conjunto de teste. As variáveis mais relevantes para a previsão de turnover foram, por ordem de importância, idade, promoções, antiguidade e vma (remuneração fixa anual).
O modelo foi utilizado para criar diferentes níveis de risco de saída, permitindo à empresa aplicar estratégias proativas de retenção. Este trabalho contribui para a utilização de ferramentas preditivas na gestão de recursos humanos, oferecendo uma abordagem prática para reduzir o turnover e os custos a ele associados.
Trabalho final de Mestrado