Aluno: Myke Dylan Van Ingen Palma
Resumo
Aquando deste estudo, o mercado imobiliário estava a passar por um aumento de valor
sem precedentes, marcado por um consistente crescimento exponencial, com apenas algumas exceções notáveis. Prever o valor de uma propriedade poderia servir como um passo
inicial para entender este mercado, beneficiando substancialmente indivíduos interessados
em comprar ou vender casa. Este estudo teve como objetivo estimar valores do mercado
imobiliário através da aplicação de técnicas de Data Science, utilizando fontes de dados
internas e externas associadas a imóveis.
De forma a atingir o objetivo acima mencionado, foi realizado um processo meticuloso de seleção e recolha de dados. Para isso uma fonte de dados de imobiliários recente
e rica foi utilizada, embora deva ser salientado que, a mesma tinha a algumas limitações.
Para garantir uma abordagem consistente e estruturada no desenvolvimento do projeto,
foi aplicado o modelo Cross-industry standard process for data mining (CRISP-DM).
Tentou-se aprofundar a compreensão do domínio do mercado imobiliário, extraindo
informações da literatura existente e do conjunto de dados adquirido. Subsequentemente,
os dados foram explorados com recurso a Power BI, possibilitando assim, uma análise
minuciosa deste conjunto de dados. Utilizando Python, todos os dados foram agregados e pré-processados de forma a facilitar o desenvolvimento e teste de vários modelos
preditivos. Por fim, o modelo que demonstrou maior precisão foi selecionado e integrado
numa aplicação web Flask, permitindo interações de utilizadores com o modelo preditivo
desenvolvido.
Este estudo, que foi focado no mercado imobiliário português, revela que fatores internos e externos exercem uma influência significativa no valor dos imóveis. Verificou-se que
variáveis internas como o número de quartos, casas de banho, o tipo de imóvel, dimensão
e localização, em conjunto com variáveis externas, como a taxa Euribor e a inflação, têm
correlações diretas com os preços das casas.
Resultados de testes rigorosos ao modelo corroboraram a literatura existente: o algoritmo Multi-layer Perceptron revelou ser o modelo mais eficaz para estimar o valor de
imóveis, apresentando uma taxa de erro notavelmente baixa, variando apenas de 2,3% a
um máximo de 16,3% no pior cenário testado. Além disso, observou-se que variáveis
de input neste modelo em particular exibiam interdependência, portanto mudanças numa
variável influenciavam diretamente o impacto de outras variáveis no resultado do modelo.
Trabalho final de Mestrado