Prever o futuro sempre foi visto como uma vidência ou uma habilidade especial concedida pelos céus. De fato, seria incrível poder antecipar o que acontecerá amanhã ou depois. No entanto, essa capacidade não é mais considerada divina ou uma mera crença. Desde o século XIX, estatísticos como Adolphe Quetelet e Francis Galton têm estudado um campo pouco conhecido pela maioria das pessoas: as famigeradas séries temporais. Essas séries são conjuntos de métodos estatísticos utilizados para identificar padrões ao longo do tempo. Recentemente, com o boom das ciências de dados, as séries temporais têm ganhado reconhecimento, principalmente devido ao Aprendizado de Máquina (Machine Learning).
Você pode estar se perguntando: “Então, as séries temporais preveem o futuro?” A resposta direta seria “Não, elas não preveem o futuro”. No entanto, essa resposta é incompleta. Para responder de maneira adequada, é necessário entender o conceito de série temporal como um todo.
Imagine o preço de uma ação, o total de vendas de uma loja ou a quantidade de grãos produzidos por uma fazenda. Todos esses valores são observações ou inferências feitas em um determinado período. Se esses valores forem agrupados em uma linha do tempo, teremos uma série temporal. Dessa forma, uma série temporal pode ser definida como qualquer valor descrito em um espaço de tempo.
Algumas séries temporais como, valores mobiliários e métricas financeiras são conhecidas por apresentarem flutuações e comportamentos caóticos. Para analisar um sistema tão caótico, é necessário um conjunto de técnicas de suavização, a fim de tornar a visualização e o entendimento da série possíveis. Alguns métodos comumente usados incluem:
- Média móvel: Uma técnica que calcula a média dos valores de uma série temporal em um determinado intervalo de tempo, deslizando essa janela ao longo da série para suavizar flutuações.
- Média móvel ponderada: Uma técnica semelhante à média móvel, mas atribuindo pesos diferentes aos valores da série temporal, onde valores mais recentes podem ter um peso maior para capturar tendências mais recentes.
- Suavização exponencial simples: Um método de suavização que atribui pesos exponenciais decrescentes aos valores da série temporal, com maior peso para valores mais recentes.
- Suavização exponencial dupla e tripla: Extensões da suavização exponencial simples que incorporam a suavização de tendências e sazonalidades em séries temporais.
- Suavização por regressão local (Loess): Uma técnica que utiliza regressão local para ajustar uma função suave aos dados da série temporal, considerando uma janela móvel de pontos próximos para capturar padrões não lineares e reduzir o impacto de outliers.
Entre outros.
O objetivo principal da suavização é aprimorar a visualização e possibilitar a compreensão dos dados. Portanto, o próximo passo lógico é compreender a série temporal por meio do estudo de suas componentes, que incluem:
- Tendência: Refere-se à direção geral ou padrão de crescimento ou decrescimento observado em uma série temporal ao longo do tempo.
- Sazonalidade: Refere-se a padrões repetitivos e previsíveis que ocorrem em uma série temporal em intervalos fixos, geralmente relacionados a fatores sazonais como estações do ano, feriados, eventos cíclicos, entre outros.
- Ciclicidade: Refere-se a flutuações de longo prazo em uma série temporal que não são de natureza sazonal, apresentando ciclos irregulares e com duração variável, podendo ser influenciadas por fatores econômicos, políticos ou outros eventos não periódicos.
- Ruído: Refere-se à componente aleatória ou não sistemática de uma série temporal, representando as flutuações imprevisíveis e não explicadas pelas outras componentes, que podem ser causadas por diversos fatores externos ou erros de medição.
Finalmente, o que resta é a modelagem, que consiste em utilizar modelos estatísticos para tentar prever valores futuros. Muitas vezes, essa modelagem é realizada por meio de técnicas de Aprendizado de Máquina (Machine Learning) ou outros modelos. Os modelos mais comumente utilizados incluem:
- MQO (Mínimos Quadrados Ordinários): É uma técnica de estimação de parâmetros usada para ajustar um modelo estatístico aos dados observados, minimizando a soma dos quadrados dos resíduos.
- ARIMA (AutoRegressive Integrated Moving Average): É um modelo estatístico utilizado para modelar séries temporais estacionárias ou transformadas em estacionárias. Combina componentes de auto regressão (AR), média móvel (MA) e diferenciação (I) para capturar padrões de dependência e sazonalidade em uma série temporal.
- VAR (Vector Autoregression): É um modelo estatístico que estende o modelo AR para múltiplas variáveis dependentes, permitindo que cada variável seja modelada como uma combinação linear de seus valores defasados e dos valores defasados de outras variáveis.
- VECM (Vector Error Correction Model): É um modelo estatístico usado para modelar séries temporais de variáveis cointegradas, ou seja, que têm um relacionamento de longo prazo. O VECM é uma extensão do modelo VAR e inclui um mecanismo de correção de erros que captura os desvios de curto prazo em relação ao relacionamento de longo prazo.
- ARCH/GARCH (Autoregressive Conditional Heteroscedasticity/Generalized Autoregressive Conditional Heteroscedasticity): São modelos utilizados para modelar a volatilidade em séries temporais financeiras. O modelo ARCH captura a heteroscedasticidade condicional autoregressiva, enquanto o modelo GARCH é uma extensão que também considera a média móvel dos erros condicionais. Esses modelos são usados para prever e modelar a volatilidade em séries temporais financeiras.
Entre muitos outros.
Agora que temos uma ideia geral do que são séries temporais, voltamos à pergunta motivadora: “As séries temporais preveem o futuro?” Não, elas não têm o poder de determinar o futuro, mas sim de calcular estimativas ou probabilidades de ocorrência de um determinado evento. Portanto, são os métodos mais confiáveis para orientar ações futuras com base nas informações disponíveis no presente.
Referências
- https://oglobo.globo.com/politica/mortalidade-letalidade-conhecido-por-propagar-informacoes-falsas-osmar-terra-acerta-diferenca-na-cpi-25071963
- https://otexts.com/fpp2/forecasting-on-training-and-test-sets.html
Autor: João Lucas Mantovani