Análise de séries temporais para previsão de máquinas em serviços de DaaS
Visualizar/ Abrir
Data
2024Autor
Santos, Maike Willian Martins dos
Metadata
Mostrar registro completoResumo
Resumo: Este trabalho tem como fundamento principal o estudo da evolução da quantidade de máquinas ligadas em dois ambientes de Data as a Service (DaaS) a partir de tendências e melhoria nos data centers. Os dados utilizados foramextraídos do Citrix, uma plataforma de gerenciamento de máquinas DaaS, para analisar a quantidade de máquinas ativas hora a hora. Para a revisão dos dados, foi feita a aplicação do modelo de Decomposição Sazonal de médias via suavização exponencial para a captação de padrões de cada dia da semana. O trabalho se encerrou com uma série de análises de resíduo que mostrou significativas autocorrelações e foram necessários modelos mais complexos para a obtenção de uma previsão mais acurada. A conclusão a que se chegou por meio do referido experimento foi a de que é, sim, possível melhorar a infraestrutura de data centers ao entender melhor como as máquinas são utilizadas e aloca melhor os recursos, conseguindo reduzir custos. Além disso, foramrealizados testes de validação do modelo escolhido, incluindo AIC (Akaike Information Criterion), BIC (Bayesian Information Criterion) e o teste de Ljung-Box, os quais evidenciarama presença de padrões não aleatórios nos resíduos, destacando a importância de incorporar a sazonalidade e outros fatores temporais nos modelos preditivos. Abstract: This work is primarily based on the study of the evolution of the number of active machines in two Data as a Service (DaaS) environments, focusing on trends and improvements in data centers. The data used were extracted from Citrix, a DaaS management platform, to analyze the number of active machines on an hourly basis. For data review, the Seasonal Decomposition model using exponential smoothing was applied to capture the patterns for each day of the week. The study concluded with a series of residual analyses that showed significant autocorrelations, indicating that more complex models were necessary to achieve more accurate predictions. The conclusion reached through this experiment was that it is indeed possible to improve data center infrastructure by better understanding how themachines are used and by allocating resources more efficiently, thereby reducing costs. Additionally, validation tests of the chosen model were conducted, including AIC (Akaike Information Criterion), BIC (Bayesian Information Criterion), and the Ljung-Box test, which revealed the presence of non-random patterns in the residuals, highlighting the importance of incorporating seasonality and other temporal factors into predictive models.
Collections
- Data Science & Big Data [138]