Search button

Analyzing the Performance of Airbnb Listings in Lisbon Using Machine Learning Techniques

Aluno: Xin Chen


Resumo
Desde o seu lançamento em 2008, a Airbnb expandiu-se rapidamente para mais de 220 países e regiões ao longo destes anos. A compreensão do desempenho dos seus anúncios e a previsão de tendências futuras tornam essencial o estudo das métricas de desempenho à luz deste crescimento global. O objetivo desta investigação é identificar os principais fatores que influenciam as métricas de desempenho, nomeadamente, as taxas de ocupação e de avaliação dos comentários, e comparar diferentes modelos de aprendizagem automática para a previsão do desempenho. A base de dados utilizada neste estudo é constituída por dados referentes a anúncios publicados no Airbnb da cidade Lisboa, Portugal, e comtempla mais de 20.000 anúncios diferentes e 75 variáveis no total. Após a limpeza e o pré-processamento do conjunto de dados, foi aplicado o operador de seleção e redução mínima absoluta para selecionar as variáveis mais relevantes a incluir nos modelos. Os resultados mostram que os fatores relacionados com o anfitrião, como o estatuto de superhost, a taxa de aceitação e a taxa de resposta, são as variáveis que mais influenciam o desempenho da propriedade. Além disso, os números de comodidades oferecidas também desempenham um papel fundamental nas métricas de sucesso. Entre os modelos preditivos, o método de ensemble, nomeadamente o Random Forest, superaram outras abordagens e forneceram as previsões mais exatas.


Trabalho final de Mestrado