Aluno: Mariana Filipa Salgado Pires
Resumo
O crescente número de cirurgias programadas ao longo dos anos tem-se mostrado um problema
recorrente em Portugal, dado que a consequência deste aumento se traduz em listas de espera extensas e
de difícil gestão por parte dos hospitais. Assim, surge a necessidade de se desenvolverem modelos que
tenham a capacidade de apoiar o planeamento e o agendamento de cirurgias. No entanto, isto nem sempre
se mostra uma tarefa fácil devido a toda a imprevisibilidade que envolve o decorrer de uma cirurgia, havendo
fatores externos que por vezes acabam por influenciar a duração da mesma.
Desta forma, o foco deste estudo é criar modelos de previsão para durações de cirurgias, através de
variáveis obtidas antes dessas mesmas cirurgias, recorrendo a dois modelos distintos: Regressão Linear
Múltipla e XGBoost. O primeiro torna-se útil pela fácil interpretação de resultados, servindo de base de
comparação para avaliar o desempenho de modelos de ensemble como o XGBoost. Para além da dualidade
de modelos, são ainda utilizados dois conjuntos distintos de dados: o primeiro é compostos por todos os
dados recolhidos e o segundo corresponde ao primeiro conjunto desagregado por especialidade cirúrgica.
Esta divisão em dois conjuntos de dados ocorre dado que, teoricamente, as durações de cirurgias têm a
particularidade de estarem dependentes da especialidade na qual se inserem. Posteriormente, são utilizados
dois indicadores para efetuar as comparações entre os modelos, nomeadamente o R2 e o Root Mean Squared
Error.
Com os dados do Hospital do Espírito Santo de Évora, podemos concluir que a um modelo mais
complexo não correspondente necessariamente uma melhor performance, estando isto dependente de
características específicas de cada conjunto de dados e do próprio objetivo do estudo. Relativamente aos
modelos obtidos para ambos os conjuntos de dados, conclui-se ainda que um modelo construído tendo por
base cada especialidade pode de facto apresentar resultados piores do que um modelo agregado,
acontecendo particularmente quando o número de observações em cada modelo se mostra insuficiente
para produzir previsões precisas.
Trabalho final de Mestrado