Search button

Comparing the Cluster Efficiency of Fragmented-Periodogram and Fragmented-ACF

Aluno: Andreia Filipa Martins Albino


Resumo
Big data faz, cada vez mais, parte do nosso dia a dia e tem um impacto cada vez maior na nossa sociedade. Tem entusiasmado os investigadores para encontrarem novos métodos para lidar com conjuntos de dados muito grandes. Na análise das séries temporais, a mesma necessidade surge. Há algumas décadas, os investigadores batalhavam para encontrar séries de dados longas o suficiente para as analisar; hoje em dia, estão frequentemente sobrecarregados com conjuntos de dados que são demasiado grandes para lidar com métodos tradicionais. O objetivo deste trabalho é estudar e propor métodos para medir as semelhanças e diferenças entre diferentes séries temporais. Esses métodos devem ser computacionalmente simples e perdem, naturalmente, algumas informações mas devem ser capazes de fornecer métricas que são adequadas para agrupar grandes conjuntos para extensas séries temporais. Para ser mais específica, estudo um método muito recente chamado periodograma fragmentado e confirmo por simulação, a sua utilidade para fornecer uma medida simples que leva ao agrupamento correto das séries temporais em consideração. Esta replicação dá algum conforto quanto à correção do exercício e leva a uma descoberta interessante sobre as regras de fragmentação. Portanto, proponho um método equivalente no domínio do tempo, o ACF fragmentado, e confirmo por simulação a sua utilidade. Finalmente, comparo os dois métodos e concluo que o ACF fragmentado tem um desempenho comparável, senão superior. As simulações são, naturalmente, limitadas a classes particulares de modelos, o que abre espaço para pesquisas futuras, como discuto na secção final.


Trabalho final de Mestrado